NVIDIA Isaac GR00T N1 / N1.7:面向人形机器人的开放基础模型
2026-05-14 09:12
模型库介绍

https://arxiv.org/abs/2503.14734?utm_source=chatgpt.com "GR00T N1: An Open Foundation Model for Generalist Humanoid Robots"

GR00T N1 是 NVIDIA 发布的面向 generalist humanoid robots 的开放基础模型。论文将其定义为一个 Vision-Language-Action 模型,采用 dual-system 架构:视觉语言模块负责理解环境和语言指令,扩散 transformer 动作模块负责实时生成运动动作。NVIDIA 官方和 Hugging Face 模型页进一步强调,GR00T N1 / N1.7 面向广义人形机器人推理与技能学习,可使用真实或合成数据进行 post-training,以适配具体人形机器人、任务和环境。(arXiv)

文案介绍:
GR00T 的代表性不只来自模型本身,也来自 NVIDIA 围绕 Isaac、Omniverse、合成数据生成和机器人训练工具链构建的完整生态。相比 OpenVLA 和 Octo 更偏通用机械臂操作,GR00T 明确押注人形机器人这一更复杂的本体形态,强调双臂操作、全身协调、多模态理解和真实世界技能迁移。它的 dual-system 设计也很有代表性:慢系统负责语义理解和任务推理,快系统负责连续动作生成和实时控制。这使 GR00T 更像是“人形机器人基础模型 + 数据飞轮 + 仿真训练平台”的组合体,适合关注 humanoid、双臂操作和工业级物理 AI 生态的研究团队重点跟进。