这类任务应该各自分开进行文字转WAV音频