他都必须拿到文字转WAV音频