这一切都是建立在能够完成任务的基础上文字转WAV音频