所以他必须要做提前准备文字转WAV音频