LET
2026-05-11 11:09
国内数据集 真实采集 长程任务 双臂操作 视觉 语言 家庭服务 工业制造 商业零售 开源工具链 含语言指令 统一格式 免费数据集
计费规则:
数据介绍

数据集介绍

LET (Large-scale Embodiment Teleoperation dataset) 是由乐聚智能构建、已捐赠至开放原子开源基金会OpenLoong社区的全尺寸人形机器人真机遥操作数据集,是国内开源领域规模最大的全尺寸人形机器人真机数据集。

  • 任务时序长度:包含 60,000+ 分钟(约 1,000+ 小时)真实遥操作数据,覆盖中长程任务。
  • 动作可执行性:基于乐聚夸父系列全尺寸人形机器人(Kuavo 4 Pro / 5W)真机统一采集,通过数据转换、模型训练、仿真测试到真机部署的完整工具链,实现开箱即用。
  • 时序连续性:数据记录完整的真实作业链路,并通过组帧技术将传感器时间误差控制在 10 毫秒以内,数据一致性超过 90%。
  • 语言控制:提供中英双语子任务级自然语言标注,每个动作步骤配有自然语言描述,支持语言条件策略训练。

主要特点

  1. 真机实采、规模领先:完全基于真机遥操作采集,是国内开源领域规模最大的全尺寸人形机器人真机数据集,首批开源超 6 万分钟数据。
  2. 多场景、多任务覆盖:跨越工业、商业零售和日常生活三大领域,涵盖汽车工厂、快消场景、酒店服务、3C工厂、生活服务和物流共 6 类真实场景,构建 31 项任务和 117 种原子技能。
  3. 多模态数据融合:同步记录头部与双腕视觉流,提供 RGB 图像、深度图、关节状态及末端执行器状态等多模态信息。
  4. 统一数据标准:以国家地方共建人形机器人创新中心(国地中心)规范为基准,从源头确保数据高质量、专业合规性与可用性。
  5. 完整工具链支持:提供数据转换(rosbag2lerobot)、模仿学习训练(Diffusion Policy / ACT)、仿真测试与真机部署的全流程工具链。

数据来源

  • 采集平台:乐聚夸父系列全尺寸人形机器人(Kuavo 4 Pro / Kuavo 5W),身高约 66m、体重约 55kg、40 个自由度
  • 采集方式:真机遥操作(Teleoperation),100% 真实环境采集
  • 数据托管:已捐赠至开放原子开源基金会 OpenLoong 开源社区

规模

  • 总时长:60,000+ 分钟(约 1,000+ 小时)真实机器人遥操作数据
  • 轨迹文件:约1 万条 ROSbag 轨迹文件
  • 机器人平台:2 种(Kuavo 4 Pro / Kuavo 5W)
  • 任务数量:31 项任务,117 种原子技能
  • 场景类型:6 类真实生产与服务环境

应用场景

数据集覆盖三大领域六类真实场景:

  1. 工业制造:汽车工厂(钣金上料、SPS分拣)、3C工厂(SMT托盘卸料、线圈分拣)、物流(快递分拣、传送带分拣)
  2. 商业零售:快消场景(日化品分拣、条码扫描、货架补货)
  3. 日常生活:酒店服务(房卡递送、送水服务)、家庭服务(桌面整理、衣物收纳、垃圾分类)

官方网站