就认可了他的推断文字转WAV音频