但这确实是他们的理想文字转WAV音频