假设他说得的是事实文字转WAV音频