因为他认得出文字转WAV音频