我们可以推演一下文字转WAV音频