而且得分不是主要因为文字转WAV音频