然后大段大段拍摄的文字转WAV音频