但也足够说明两人的差距真的几近于无文字转WAV音频