当时十几天的拍摄完成了文字转WAV音频