就实现了所有场景都在室内拍摄完成的壮举文字转WAV音频