所以他选择了第二种办法文字转WAV音频