也正是因为这一目标充满难度文字转WAV音频