从一开始的目标就是他的咽喉文字转WAV音频