我们以为他是文字转WAV音频