因为现在已经涉及到他们的自身文字转WAV音频