事实上他只是将原先文字转WAV音频