再将他们摄到跟前文字转WAV音频