它的打分方式不是计算平均分文字转WAV音频