所做的任务也都是低级的文字转WAV音频