数据集介绍
LET (Large-scale Embodiment Teleoperation dataset) 是由乐聚智能构建、已捐赠至开放原子开源基金会OpenLoong社区的全尺寸人形机器人真机遥操作数据集,是国内开源领域规模最大的全尺寸人形机器人真机数据集。
- 任务时序长度:包含 60,000+ 分钟(约 1,000+ 小时)真实遥操作数据,覆盖中长程任务。
- 动作可执行性:基于乐聚夸父系列全尺寸人形机器人(Kuavo 4 Pro / 5W)真机统一采集,通过数据转换、模型训练、仿真测试到真机部署的完整工具链,实现开箱即用。
- 时序连续性:数据记录完整的真实作业链路,并通过组帧技术将传感器时间误差控制在 10 毫秒以内,数据一致性超过 90%。
- 语言控制:提供中英双语子任务级自然语言标注,每个动作步骤配有自然语言描述,支持语言条件策略训练。
主要特点
- 真机实采、规模领先:完全基于真机遥操作采集,是国内开源领域规模最大的全尺寸人形机器人真机数据集,首批开源超 6 万分钟数据。
- 多场景、多任务覆盖:跨越工业、商业零售和日常生活三大领域,涵盖汽车工厂、快消场景、酒店服务、3C工厂、生活服务和物流共 6 类真实场景,构建 31 项任务和 117 种原子技能。
- 多模态数据融合:同步记录头部与双腕视觉流,提供 RGB 图像、深度图、关节状态及末端执行器状态等多模态信息。
- 统一数据标准:以国家地方共建人形机器人创新中心(国地中心)规范为基准,从源头确保数据高质量、专业合规性与可用性。
- 完整工具链支持:提供数据转换(rosbag2lerobot)、模仿学习训练(Diffusion Policy / ACT)、仿真测试与真机部署的全流程工具链。
数据来源
- 采集平台:乐聚夸父系列全尺寸人形机器人(Kuavo 4 Pro / Kuavo 5W),身高约 66m、体重约 55kg、40 个自由度
- 采集方式:真机遥操作(Teleoperation),100% 真实环境采集
- 数据托管:已捐赠至开放原子开源基金会 OpenLoong 开源社区
规模
- 总时长:60,000+ 分钟(约 1,000+ 小时)真实机器人遥操作数据
- 轨迹文件:约1 万条 ROSbag 轨迹文件
- 机器人平台:2 种(Kuavo 4 Pro / Kuavo 5W)
- 任务数量:31 项任务,117 种原子技能
- 场景类型:6 类真实生产与服务环境
应用场景
数据集覆盖三大领域六类真实场景:
- 工业制造:汽车工厂(钣金上料、SPS分拣)、3C工厂(SMT托盘卸料、线圈分拣)、物流(快递分拣、传送带分拣)
- 商业零售:快消场景(日化品分拣、条码扫描、货架补货)
- 日常生活:酒店服务(房卡递送、送水服务)、家庭服务(桌面整理、衣物收纳、垃圾分类)
官方网站
- Hugging Face:https://huggingface.co/datasets/LejuRobotics/let_dataset
- 备用地址/代码托管:可通过原子Git(AtomGit)或邮件申请(wangsong@lejurobot.com)获取