但绝大多数人都表达了文字转WAV音频