自己的总体思路得到了认可文字转WAV音频