
数据集介绍
Unitree G1 操作数据集是宇树科技为推进全球具身智能行业发展而开源的真机操作数据集,旨在让人形机器人不仅“能跑会跳”,更能“精细操作”。该数据集基于宇树 G1 人形机器人(配备三指灵巧手)采集,重点覆盖日常生活中的长尾、精细化操作任务,并已适配 HuggingFace LeRobot 等主流开源训练框架。
- 任务时序长度:覆盖短程到中程的精细操作任务,如拧瓶盖、堆积木等多步骤动作。
- 动作可执行性:数据基于苹果 Vision Pro 遥操作采集的真机数据,包含低层伺服控制命令,可直接用于真机部署与算法验证。
- 时序连续性:数据为连贯的物理交互轨迹,保留了完整的操作时序依赖。
- 语言控制:暂不支持自然语言控制(早期版本以动作轨迹为主)。
主要特点
- 真机实采:数据来自已量产的 Unitree G1 人形机器人,具备真实物理交互反馈,有效消除 Sim2Real 鸿沟。
- 灵巧手操作:聚焦三指灵巧手的力位混合控制,是少有的专注“类人形”本体精细操作的开源数据。
- 软硬件全栈开源:不仅开源数据集,还开源了基于 Vision Pro 的遥操作采集代码以及基于 LeRobot 的训练测试 pipeline。
- 生态兼容性强:数据格式已适配 LeRobot 框架,便于开发者直接使用现有的模仿学习算法进行训练。
数据来源
- 发布方:宇树科技 (Unitree Robotics)
- 采集平台:Unitree G1 人形机器人(配备三指灵巧手、RealSense D435 深度相机)
- 采集方式:基于 Apple Vision Pro 的遥操作真机采集
- 开源协议:数据集采用 CC BY-NC-SA 4.0,代码采用 Apache 2.0(部分子集)
规模
- 轨迹数量:虽描述为“数十万”级别,但根据近期宇树整体开源规划,全身遥操作真机数据集已积累至约 189 万条轨迹、340 小时。注:G1 操作数据集为其中专注于上肢操作的核心子集。
- 数据维度:640x480 RGB 图像,每个手臂和灵巧手状态与动作维度为 7。
- 初始任务:包含拧瓶盖倒水、叠三色积木、摄像头入盒、物品收集存储等 5 大类。
- 持续更新:宇树承诺该数据集会持续更新,目前数据集集合页已在 HuggingFace 上线。
应用场景
- 家庭服务:倒水、整理物品、衣物收纳等。
- 教育/研究:为开发者提供真机 baseline,用于验证 Diffusion Policy、ACT 等模仿学习算法。
- 工业/商业:桌面分拣、精细装配等。
官方网址
https://www.unitree.com/cn/opensource