就是科研人员也不一定总能记述正确文字转WAV音频