画面质量不一的图片和几十段音质不一的录音文字转WAV音频