并且准确说出了他在文字转WAV音频