是他用感知主动找到的文字转WAV音频