得出的唯一答案就是文字转WAV音频