我们没办法在中场给他太多的支援文字转WAV音频