两者的程度自然是完全不同的文字转WAV音频