但他也必须使用文字转WAV音频