我们曾经就这个理论探讨过文字转WAV音频