但是我们只是讨论理论文字转WAV音频