而是通过传送带文字转WAV音频