所以他们根本不可能通过话文字转WAV音频