还有大量细节文字转WAV音频