问题在于她在现实世界中文字转WAV音频