现在也只不过是进行着拍摄过程文字转WAV音频