Mobile ALOHA (2024)
2026-05-11 10:41
国际数据集 真实采集 双臂操作 导航 长程任务 机械臂 轮式机器人 视觉 家庭服务 商业零售 通用研究 开源工具链 免费数据集
计费规则:
数据介绍

数据集介绍

Mobile ALOHA 是一个专注于双臂移动操作的真实世界数据集,解决了传统数据集局限于桌面静态操作的问题。该数据通过低成本、全身远程操作系统采集,融合了导航与精细操作,旨在训练能够完成复杂家务(如烹饪、收纳、乘电梯)的机器人。

  • 任务时序长度:支持长程任务,涉及移动底座与双臂的协同,单次任务时长通常较长(包含导航+操作序列)。
  • 动作可执行性:包含 16 维动作向量(14-DoF 双臂关节 + 2-DoF 移动底座线/角速度),提供全身控制数据。
  • 时序连续性:包含约 50 条/任务的真实人类遥操作轨迹,数据中包含了全身状态的同步记录。
  • 语言控制:虽然采集时主要依靠遥操作,但任务设定通常配合自然语言目标(如“擦拭洒落的液体”),适合训练语言条件下的模仿学习。

主要特点

  1. 低成本全身遥操作:搭建成本约 2 万美元(相比传统移动机器人数十万美元),通过将操作者腰部与底座绑定的创新方式,实现了对双臂和底座的同步控制。
  2. 真实的移动操作场景:数据采集在真实的厨房、办公室等物理环境中进行,任务包括烹饪、橱柜收纳、冲洗锅具、乘电梯等。
  3. 联合训练(Co-training)策略:提供了将 7 项长程移动任务与原有 825 条静态桌面操作数据联合训练的范式,可大幅提升移动操作的成功率(最高提升 90%)。
  4. 整机物理交互:数据涉及与环境的强物理交互,如推椅子、开关柜门、烹饪翻斗,对机器人控制器的鲁棒性要求极高。

数据来源

  • 采集平台:基于 Mobile ALOHA 硬件平台,它由 Tracer 移动底座和四个 ALOHA 机械臂组成。
  • 场景环境:100% 真实场景,包括家庭厨房、餐厅、办公室大堂等实际物理空间。
  • 数据形式:真实机器人操作数据,包含 RGB 视觉输入、底盘速度、手臂关节角度等。

规模

  • 总演示轨迹:约 350 条真实人类遥操作轨迹(7 项任务,每项 50 条)。
  • 联合训练数据:整合825 条静态桌面操作演示数据。
  • 场景覆盖:7 类真实家庭 / 商业场景(厨房、餐厅、办公室等)。

应用场景

适合需要“腿”+“手”协同的复杂服务场景:

  1. 家庭服务:收纳重物、洗锅、与人或家具互动。
  2. 商业餐饮:烹饪(如炒虾、上菜)、拾取餐具。
  3. 公共设施操作:呼叫电梯、推动椅子以清理空间。
  4. 鲁棒性研究:测试算法从桌面操作迁移到移动操作时的泛化能力。

官方网站