确实存在着不太合理的地方文字转WAV音频