甚至他轻易判断出文字转WAV音频