最终采取了第二种方式文字转WAV音频