只能尽量模仿糊弄一下文字转WAV音频