但是现在他理解了文字转WAV音频