但他认为是文字转WAV音频