显然也默认了协商的要求文字转WAV音频