最终形成了确定的思路文字转WAV音频