它更强调要将外在形式和内在功能结合在一起文字转WAV音频