它们不得不从文字转WAV音频