虽然他们能通过第一轮文字转WAV音频