这比较是同档次之间进行的文字转WAV音频