他们纯粹依靠惯性飞行文字转WAV音频