
数据集介绍
RoboTurk 真实世界数据集由斯坦福大学发布,依托众包远程遥操作构建中等时长家用机器人操作数据集,以低成本众包模式采集多样化人类操作演示,适合通用模仿学习与跨操作者行为建模。
- 任务时序长度:中等时长短家务任务,单任务流程简洁、交互步骤适中。
- 动作可执行性:提供低级控制信号,基于移动端接口远程遥操作 Sawyer 机械臂。
- 时序连续性:包含完整时间序列传感数据与连续动作轨迹,时序关联完整。
- 语言控制:无自然语言指令标注,以固定具象操作任务为主。
主要特点
- 众包多操作者采集:汇集 54 位不同操作者操作行为,数据具备人类操作差异性与多样性。
- 低成本遥操作范式:依托移动端远程操控,无需专业操作人员,易规模化扩充数据。
- 生活化基础任务:聚焦叠衣、积木搭建、物体搜索等通用居家简单操作,落地性强。
- 支持子集拆分:提供完整数据集与精简子集,适配不同算力与算法训练需求。
数据来源
- 采集平台:Sawyer 机械臂远程遥操作系统。
- 场景环境:室内实景桌面操作环境。
- 数据形式:实景真实机器人操作数据,含视觉图像、机械臂状态、遥操作动作时序数据。
规模
- 总演示轨迹:共 2144 条完整操作演示轨迹。
- 任务覆盖:包含叠衣、搭积木塔、物体搜索 3 类现实家务任务。
- 采集人员:由 54 位不同众包远程操作者参与采集。
应用场景
- 机器人模仿学习、行为克隆算法离线训练。
- 研究不同人类操作习惯对机器人学习效果的影响。
- 通用桌面简单操作任务的算法基准测试与对比。
官方网站
数据集:https://roboturk.stanford.edu/dataset_real.html
论文:https://arxiv.org/abs/1811.02790