Mobile ALOHA (2024) - 国家具身智能应用中试基地

国家具身智能应用中试基地

Mobile ALOHA (2024)

2026-05-11 10:41

国际数据集真实采集双臂操作导航长程任务机械臂轮式机器人视觉家庭服务商业零售通用研究开源工具链免费数据集

计费规则:

数据介绍

数据集介绍

Mobile ALOHA 是一个专注于双臂移动操作的真实世界数据集，解决了传统数据集局限于桌面静态操作的问题。该数据通过低成本、全身远程操作系统采集，融合了导航与精细操作，旨在训练能够完成复杂家务（如烹饪、收纳、乘电梯）的机器人。

任务时序长度：支持长程任务，涉及移动底座与双臂的协同，单次任务时长通常较长（包含导航+操作序列）。
动作可执行性：包含 16 维动作向量（14-DoF 双臂关节 + 2-DoF 移动底座线/角速度），提供全身控制数据。
时序连续性：包含约 50 条/任务的真实人类遥操作轨迹，数据中包含了全身状态的同步记录。
语言控制：虽然采集时主要依靠遥操作，但任务设定通常配合自然语言目标（如“擦拭洒落的液体”），适合训练语言条件下的模仿学习。

主要特点

低成本全身遥操作：搭建成本约 2 万美元（相比传统移动机器人数十万美元），通过将操作者腰部与底座绑定的创新方式，实现了对双臂和底座的同步控制。
真实的移动操作场景：数据采集在真实的厨房、办公室等物理环境中进行，任务包括烹饪、橱柜收纳、冲洗锅具、乘电梯等。
联合训练（Co-training）策略：提供了将 7 项长程移动任务与原有 825 条静态桌面操作数据联合训练的范式，可大幅提升移动操作的成功率（最高提升 90%）。
整机物理交互：数据涉及与环境的强物理交互，如推椅子、开关柜门、烹饪翻斗，对机器人控制器的鲁棒性要求极高。

数据来源

采集平台：基于 Mobile ALOHA 硬件平台，它由 Tracer 移动底座和四个 ALOHA 机械臂组成。
场景环境：100% 真实场景，包括家庭厨房、餐厅、办公室大堂等实际物理空间。
数据形式：真实机器人操作数据，包含 RGB 视觉输入、底盘速度、手臂关节角度等。

规模

总演示轨迹：约 350 条真实人类遥操作轨迹（7 项任务，每项 50 条）。
联合训练数据：整合825 条静态桌面操作演示数据。
场景覆盖：7 类真实家庭 / 商业场景（厨房、餐厅、办公室等）。

应用场景

适合需要“腿”+“手”协同的复杂服务场景：

家庭服务：收纳重物、洗锅、与人或家具互动。
商业餐饮：烹饪（如炒虾、上菜）、拾取餐具。
公共设施操作：呼叫电梯、推动椅子以清理空间。
鲁棒性研究：测试算法从桌面操作迁移到移动操作时的泛化能力。

官方网站

数据集：https://mobile-aloha.github.io
论文：https://arxiv.org/abs/2401.02117