双方之间的差距也是会被放大许多的文字转WAV音频