才会分别加入文字转WAV音频