BC-Z (2022)
2026-05-11 10:21
国际数据集 真实采集 单臂操作 抓取 中程任务 跨本体 视觉 语言 家庭服务 通用研究 开源工具链 含语言指令 免费数据集
计费规则:
数据介绍

数据集介绍

BC-Z (Behavior Cloning from Zero-shot) (2022) 是由Google Everyday Robots团队发布的大规模、多机器人、多场景机器人操作数据集。该数据集专为零样本泛化设计,通过将视觉与自然语言理解相结合,使机器人能够通过指定新任务(使用语言或视频)来执行训练过程中未见过的操作,实现了基于模仿学习的零样本任务泛化。

  • 任务时序长度:中等时长,部分任务需要100步以上的决策序列。
  • 动作可执行性:基于10 Hz闭环视觉马达控制,输出低级连续动作命令。
  • 时序连续性:以时序视觉观测与动作演示形式记录,完整保留闭环控制流程。
  • 语言控制:支持通过预训练语言/视频嵌入来指定新任务,无需额外微调。

主要特点

  1. 零样本泛化能力:核心亮点在于支持对新任务的零样本执行,无需在新任务上进行任何微调。
  2. 跨硬件采集:数据采集自多台不同硬件的机器人(硬件存在差异如手臂刚度、相机参数、末端执行器尺寸等),增加了数据的多样性。
  3. 高随机化设计:包含物体位置随机分布、背景变换、干扰物添加等多种变化,提升训练策略的鲁棒性。
  4. 多模态任务指定:支持通过语言指令或视频示范两种方式指定新任务,提供了灵活的任务输入接口。
  5. 大规模真实数据:总计25,877段人机演示,覆盖100种多样的操作任务。

数据来源

  • 采集平台:基于Everyday Robots(EDR)的移动机械臂平台,在多台不同硬件配置的机器人上采集。
  • 采集环境:多样化的真实环境,包含不同的背景、光照条件和物体布局。
  • 数据形式:全部为真实物理环境采集数据,包含时序视觉观测(RGB图像)和对应的机器人动作序列。

规模

  • 总演示轨迹:25,877段人机演示。
  • 任务覆盖:涵盖100种不同的操作任务。
  • 硬件多样性:多台存在硬件差异的机器人参与数据采集。

应用场景

数据集特别适合需要零样本泛化能力的机器人学习研究:

  1. 零样本任务学习:训练能够执行从未见过的任务的机器人策略,无需额外数据标注或模型微调。
  2. 语言引导机器人:通过自然语言指令指定新任务,适用于家庭服务等非结构化环境。
  3. 跨硬件迁移:由于数据采集自多台不同硬件的机器人,支持研究策略在不同硬件平台间的迁移能力。
  4. 多模态策略学习:支持语言和视频两种任务指定方式,适合多模态行为克隆研究。

官方网站

下载地址:https://jszn.datasets.obs.cn-east-3.myhuaweicloud.com/datas/datasets/free/BC-Z%282022%29.zip