开始讲述他们方案的大概思路文字转WAV音频