BridgeData V2 (2023)
2026-05-11 10:08
国际数据集 真实采集 单臂操作 抓取 短程任务 机械臂 视觉 语言 通用研究 家庭服务 含语言指令 开源工具链 免费数据集
计费规则:
数据介绍

数据集介绍

BridgeData V2 (2023) 是由加州大学伯克利分校研究团队发布的大规模、多样化机器人操作数据集。该数据集在前代Bridge Dataset的基础上大幅扩展,专门设计用于支持可扩展机器人学习研究。数据集收集了超过6万条示范轨迹,覆盖多种环境和技能类型,致力于使在该数据集上训练的策略能够泛化到新的实验室环境、新物体甚至跨机构使用。

  • 任务时序长度:以短程任务为主,每个轨迹对应单次操作,平均轨迹长度约为38个时间步。
  • 动作可执行性:基于VR遥操作进行低级控制,控制频率为5 Hz,输出7自由度动作命令。
  • 时序连续性:以连续RGB-D视频序列形式记录,同时包含对应的动作序列。
  • 语言控制:每条轨迹均附带对应的自然语言指令标注,支持语言条件控制。

主要特点

  1. 跨环境泛化设计:专为跨环境泛化设计,数据采集自24种不同环境,包含7种不同的玩具厨房场景,支持策略对新环境的迁移。
  2. 技能多样性突出:覆盖13类操作技能,从基础的拾取放置、推动、清扫,到复杂的环境交互(开关门/抽屉)和精细操作(堆叠积木、折叠布料)。
  3. 低成本硬件平台:基于低价位、完全公开的WidowX 250机械臂(总成本约$4,000),任何实验室均可复现。
  4. 标准化训练生态:提供完整的训练代码、预训练权重和硬件搭建指南,极大降低了研究门槛。
  5. 多方法兼容性:数据集设计兼顾多种学习范式,支持语言条件模仿学习、目标条件模仿学习以及离线强化学习等多种方法。

数据来源

  • 采集平台:基于WidowX 250 6自由度机械臂,搭配RGB-D相机和VR控制器(Oculus Quest 2)进行遥操作采集。
  • 采集环境:24种不同环境,包含7种玩具厨房场景、办公室环境等,具有物体位置、相机位姿、光照等多维度变化。
  • 数据形式:全部为真实物理环境遥操作采集数据,包含RGB图像(640×480)、深度信息及动作序列。

规模

  • 总示范轨迹:60,096条轨迹,其中50,365条为遥操作示范数据,9,731条为脚本化策略采集数据。
  • 环境数量:24种不同的操作环境。
  • 技能类别:覆盖13类不同的操作技能。
  • 轨迹特征:平均轨迹长度为38个时间步。

应用场景

数据集覆盖广泛的基础操作技能和部分复杂任务,特别适合需要跨环境、跨物体泛化的机器人学习研究:

  1. 基础操作技能学习:拾取放置、推动、清扫、擦拭等基础操作任务的大规模训练。
  2. 环境交互操作:开关门、开关抽屉等需要与环境结构交互的任务。
  3. 精细操作任务:堆叠积木、折叠布料、清扫颗粒介质等复杂操作任务。
  4. 跨机构研究:由于采用低成本开源硬件平台,不同实验室均可使用该数据集进行研究,支持结果的交叉验证。

官方网站

下载地址:https://jszn.datasets.obs.cn-east-3.myhuaweicloud.com/datas/datasets/free/BridgeData%20V2%282023%29.rar