主要是为了运动文字转WAV音频