最终的实际分数比重点线高了一分文字转WAV音频