目前所要做的就是先让他接受这样的一个世界文字转WAV音频