
数据集介绍
Mobile ALOHA 是一个专注于双臂移动操作的真实世界数据集,解决了传统数据集局限于桌面静态操作的问题。该数据通过低成本、全身远程操作系统采集,融合了导航与精细操作,旨在训练能够完成复杂家务(如烹饪、收纳、乘电梯)的机器人。
- 任务时序长度:支持长程任务,涉及移动底座与双臂的协同,单次任务时长通常较长(包含导航+操作序列)。
- 动作可执行性:包含 16 维动作向量(14-DoF 双臂关节 + 2-DoF 移动底座线/角速度),提供全身控制数据。
- 时序连续性:包含约 50 条/任务的真实人类遥操作轨迹,数据中包含了全身状态的同步记录。
- 语言控制:虽然采集时主要依靠遥操作,但任务设定通常配合自然语言目标(如“擦拭洒落的液体”),适合训练语言条件下的模仿学习。
主要特点
- 低成本全身遥操作:搭建成本约 2 万美元(相比传统移动机器人数十万美元),通过将操作者腰部与底座绑定的创新方式,实现了对双臂和底座的同步控制。
- 真实的移动操作场景:数据采集在真实的厨房、办公室等物理环境中进行,任务包括烹饪、橱柜收纳、冲洗锅具、乘电梯等。
- 联合训练(Co-training)策略:提供了将 7 项长程移动任务与原有 825 条静态桌面操作数据联合训练的范式,可大幅提升移动操作的成功率(最高提升 90%)。
- 整机物理交互:数据涉及与环境的强物理交互,如推椅子、开关柜门、烹饪翻斗,对机器人控制器的鲁棒性要求极高。
数据来源
- 采集平台:基于 Mobile ALOHA 硬件平台,它由 Tracer 移动底座和四个 ALOHA 机械臂组成。
- 场景环境:100% 真实场景,包括家庭厨房、餐厅、办公室大堂等实际物理空间。
- 数据形式:真实机器人操作数据,包含 RGB 视觉输入、底盘速度、手臂关节角度等。
规模
- 总演示轨迹:约 350 条真实人类遥操作轨迹(7 项任务,每项 50 条)。
- 联合训练数据:整合825 条静态桌面操作演示数据。
- 场景覆盖:7 类真实家庭 / 商业场景(厨房、餐厅、办公室等)。
应用场景
适合需要“腿”+“手”协同的复杂服务场景:
- 家庭服务:收纳重物、洗锅、与人或家具互动。
- 商业餐饮:烹饪(如炒虾、上菜)、拾取餐具。
- 公共设施操作:呼叫电梯、推动椅子以清理空间。
- 鲁棒性研究:测试算法从桌面操作迁移到移动操作时的泛化能力。
官方网站
- 数据集:https://mobile-aloha.github.io
- 论文:https://arxiv.org/abs/2401.02117