一半是因为害怕文字转WAV音频