我们做最坏的假设文字转WAV音频