但他只承认文字转WAV音频