那么我们为什么不能将目标对准准迪卡身边的人文字转WAV音频