对于第二阶段的内容文字转WAV音频