仅通过照片里的一些细节文字转WAV音频