因为他们已然认出文字转WAV音频