InternData-M1 - 国家具身智能应用中试基地

国家具身智能应用中试基地

InternData-M1

2026-05-11 11:34

国内数据集仿真生成单臂操作抓取中程任务跨本体视觉语言通用研究含语言指令统一格式免费数据集

计费规则:

数据介绍

数据集介绍

InternData-M1 是一个全面的实体机器人数据集，包含 244K 模拟演示，具有丰富的基于帧的信息，包括 2D/3D 框、轨迹、抓取点和语义掩码，并附有全面的注释。

主要特点

基于超过 80,000 个开放词汇对象构建实体操作场景。
合成具有空间定位的多轮交互对话数据。
集成任务和动作规划的全链操作数据，提供丰富的基于帧的信息，如 2D/3D 框、轨迹、抓取点和语义掩码。任务指令涵盖开放对象识别、常识和空间推理以及多步骤长距离任务。

数据来源

发布方：上海人工智能实验室
数据形式：纯合成数据（仿真生成）
生成管线：全自动化仿真数据生成管线——场景随机化 → 候选抓取点计算 → 轨迹生成 → 闭环物理验证 → 场景图验证
物理引擎：Isaac Sim 仿真器
物体来源：80k+ 不同物体，覆盖抓取-放置任务所需的刚性物体及部分关节物体

规模

演示轨迹：244,000 条封闭循环样本（含 23 万用于空间推理训练的数据）
总帧数：超过 300,000 帧
抓取-放置场景：244,000 个可泛化场景
物体数量：80,000+ 个
控制模式：低层控制命令（joint/ee control）
标注形式：开放式自然语言指令
数据质量：通过物理仿真闭环验证 + 场景图验证器双重筛选

应用场景

InternData-M1 专为训练通用操作大模型而设计，已在以下场景验证有效性：

空间智能操作：要求机器人理解物体间空间关系（如“将杯子放在盘子的右边”）
长程推理密集型任务：涉及多步骤、多物体交互的复杂任务链
开放物体泛化：在真实世界杂乱环境中操作未见过的物体及新配置
语义指令跟随：根据开放式自然语言指令完成对应操作
真实世界零样本部署：基于纯合成数据预训练后，直接部署到真实机器人上

实验证明，基于 InternData-M1 预训练的 InternVLA·M1 模型，在 SimplerEnv Google Robot 测试中提升 14.6%，在真实世界杂乱环境中对未见物体提升 20.6%，在长时程推理密集型场景中性能超越现有方法 10% 以上。

官方网址

https://huggingface.co/datasets/InternRobotics/InternData-M1