前提是你得有能分辨出差别的眼光文字转WAV音频