也不依据于体魄文字转WAV音频