每个数字代表着一种任务模式文字转WAV音频