那么它就会根据瞬间拍摄的结果文字转WAV音频