InternData-N1
2026-05-11 11:32
国内数据集 仿真生成 导航 中程任务 跨本体 视觉 语言 通用研究 含语言指令 免费数据集
计费规则:
数据介绍

数据集介绍

InternData-N1 是上海人工智能实验室发布的目前场景最多元的大规模导航数据集,旨在支撑首个端到端双系统导航大模型 InternVLA·N1 的训练 。该数据集最大的特点在于纯合成数据驱动:完全在仿真环境中生成,不依赖任何真实导航数据,却能使模型在真实世界中实现出色的零样本泛化 。基于该数据集训练的 InternVLA·N1 模型,在 6 个具有挑战性导航基准测试中达到国际领先水平,并且在各种机器人形态(轮式、四足、人形)和真实环境中,仅用合成数据训练即可实现 60Hz 的连续推理效率和超过 150 米的长距离规划能力 。

  • 任务时序长度:中程导航任务,包含从起点到目标点的完整路径序列,总导航里程超过 4,800 公里
  • 动作可执行性:基于传统优化策略和仿真引擎合成的高质量导航轨迹,包含低层移动指令,可直接用于训练端到端导航策略
  • 时序连续性:数据为连续的第一视角图像序列,保留完整的空间时序依赖关系
  • 语言控制:每条轨迹配有通过大模型自动化标注、改写和筛选生成的丰富语言指令,支持视觉-语言导航(VLN)任务

主要特点

  1. 纯合成数据,真机零样本泛化:InternData-N1 的所有数据均在仿真环境中生成,不依赖任何真实采集数据。但基于该数据集训练的模型可直接部署到真实机器人上,实现零样本跨场景、跨本体迁移,证明了大规模合成数据在导航任务中的有效性 。
  2. 场景多元性行业领先:数据集广泛收集了开源场景数据,涵盖 HM3D、3D-Front、Gibson、HSSD、Matterport3D、Replica 等主流场景集,总计超过 3,000 个室内场景,是目前开源领域场景覆盖最广的导航数据集之一 。
  3. 超大规模导航数据:包含超过 5,300 万第一视角图像、80 万条语言指令,总计 4,839 公里的机器人导航经验,相当于一台机器人不间断行走近 7 个月的里程 。
  4. 双子集设计,支撑双系统训练:为适配 InternVLA·N1 的双系统架构(系统2负责空间推理规划,系统1负责敏捷执行),数据集提供了两个专门子集:
  • VLN-CE 子集:面向 HM3D 基准,优化轨迹数据,进行片段切分和自动化标注,主要用于系统2的预训练和双系统联调 。
  • VLN-N1 子集:基于多元场景数据,加入视角、光照的随机化增强,通过大模型自动化生成多样化指令,主要用于系统1的预训练和提升泛化性 。
  1. 高效自动化数据管线:团队开发了一套高效的仿真数据生成流程,单机每日可生成 5 万条导航轨迹,结合自动指令标注与数据筛选,实现了数据生产的高度可扩展性 。
  2. 生态集成完整:数据已与训测工具链 InternNav 深度集成,系统性支持双系统各模块、多种仿真平台(Habitat、Isaac Sim)的训练和闭环评测 。

数据来源

  • 发布方:上海人工智能实验室
  • 数据形式:纯合成数据(仿真生成)
  • 生成流程:基于传统优化策略的轨迹合成 + 自动化拆分标注管线 + 大模型指令标注/改写/筛选
  • 场景来源:HM3D、3D-Front、Gibson、HSSD、Matterport3D、Replica 等开源3D场景数据集
  • 仿真引擎:Habitat、Isaac Sim
  • 支撑模型:InternVLA·N1(端到端双系统导航大模型)

规模

  • 轨迹总数:370,000+ 条(论文数据为 830k VLN 数据,此处采用官方开源数据集的 370k 轨迹数据)
  • 总帧数:超过 5,300 万第一视角图像
  • 语言指令:80 万条
  • 总导航里程:4,839 公里
  • 覆盖场景:3,000+ 个室内场景(涵盖住宅、办公室、商业空间等)
  • 场景来源:6 个主流开源3D场景数据集
  • 子集划分:VLN-CE、VLN-N1、VLN-PE
  • 数据生成效率:单机每日 5 万条轨迹

应用场景

InternData-N1 专为训练通用导航大模型而设计,已在以下场景验证有效性:

  • 视觉-语言导航(VLN):根据自然语言指令(如“去厨房拿一瓶水”)完成长程导航
  • 点目标导航:从起点自主规划路径到达指定坐标点
  • 目标图像导航:根据目标图像进行视觉驱动的导航
  • 多机器人形态泛化:支持轮式机器人、四足机器人、人形机器人的跨本体部署
  • 真实世界长程导航:支持超过 150 米的长距离规划与实时决策(>30Hz)

实验证明,基于 InternData-N1 训练的 InternVLA·N1 模型,在 6 个极具挑战性的导航基准测试中始终保持最佳性能,性能提升幅度在 3% 到 28% 之间,并且在不同场景的多个机器人平台上均展现出强大的零样本泛化能力 。

官方网址

数据链接:https://huggingface.co/datasets/InternRobotics/InternData-N1

项目主页:https://internrobotics.github.io/internvla-n1.github.io/