这是一个很简单的推理文字转WAV音频