InternData-M1
2026-05-11 11:34
国内数据集 仿真生成 单臂操作 抓取 中程任务 跨本体 视觉 语言 通用研究 含语言指令 统一格式 免费数据集
计费规则:
数据介绍

数据集介绍

InternData-M1 是一个全面的实体机器人数据集,包含 244K 模拟演示,具有丰富的基于帧的信息,包括 2D/3D 框、轨迹、抓取点和语义掩码,并附有全面的注释。

主要特点

  • 基于超过 80,000 个开放词汇对象构建实体操作场景。
  • 合成具有空间定位的多轮交互对话数据。
  • 集成任务和动作规划的全链操作数据,提供丰富的基于帧的信息,如 2D/3D 框、轨迹、抓取点和语义掩码。任务指令涵盖开放对象识别、常识和空间推理以及多步骤长距离任务。

数据来源

  • 发布方:上海人工智能实验室
  • 数据形式:纯合成数据(仿真生成)
  • 生成管线:全自动化仿真数据生成管线——场景随机化 → 候选抓取点计算 → 轨迹生成 → 闭环物理验证 → 场景图验证
  • 物理引擎:Isaac Sim 仿真器
  • 物体来源:80k+ 不同物体,覆盖抓取-放置任务所需的刚性物体及部分关节物体

规模

  • 演示轨迹:244,000 条封闭循环样本(含 23 万用于空间推理训练的数据)
  • 总帧数:超过 300,000 帧
  • 抓取-放置场景:244,000 个可泛化场景
  • 物体数量:80,000+ 个
  • 控制模式:低层控制命令(joint/ee control)
  • 标注形式:开放式自然语言指令
  • 数据质量:通过物理仿真闭环验证 + 场景图验证器双重筛选

应用场景

InternData-M1 专为训练通用操作大模型而设计,已在以下场景验证有效性:

  • 空间智能操作:要求机器人理解物体间空间关系(如“将杯子放在盘子的右边”)
  • 长程推理密集型任务:涉及多步骤、多物体交互的复杂任务链
  • 开放物体泛化:在真实世界杂乱环境中操作未见过的物体及新配置
  • 语义指令跟随:根据开放式自然语言指令完成对应操作
  • 真实世界零样本部署:基于纯合成数据预训练后,直接部署到真实机器人上

实验证明,基于 InternData-M1 预训练的 InternVLA·M1 模型,在 SimplerEnv Google Robot 测试中提升 14.6%,在真实世界杂乱环境中对未见物体提升 20.6%,在长时程推理密集型场景中性能超越现有方法 10% 以上。

官方网址

https://huggingface.co/datasets/InternRobotics/InternData-M1