并没有仔细的打量文字转WAV音频