问题就在于信息量太大文字转WAV音频