MotionMillion
2026-05-11 11:26
国内数据集 视频提取 人体动作 长程任务 无本体 视觉 语言 通用研究 含语言指令 免费数据集
计费规则:
数据介绍

数据集介绍

MotionMillion 是浙江大学发布的大规模人体动作数据集,专注于从视频中提取的连续人体运动与操作状态。

  • 任务时序长度:连续动作序列,包含完整的时序上下文。
  • 动作可执行性:数据来源于真实人类操作的视频捕捉,包含低层人体动作和操作状态信息,适用于从人类演示中学习。
  • 时序连续性:数据为高帧率连续序列,保留动作的完整时序动态特征。
  • 语言控制:提供文本配对描述,支持文本到动作的生成与检索。

主要特点

  1. 超大规模:包含2,000 小时的高质量运动序列,每个动作超过20个详细的注释,是目前最大的开源人体动作数据集之一。
  2. 丰富的人群覆盖:涉及 1,000+ 位不同个体,具有良好的动作多样性。
  3. 操作状态标注:包含超过 100 万个精细的操作状态标注,支持对人与物体交互的细粒度分析。
  4. 视频来源:数据来源于真实世界视频采集,保留了自然的动作表现与环境背景。

数据来源

  • 发布方:浙江大学
  • 数据形式:真实世界视频采集
  • 标注:包含文本配对与操作状态标注

规模

  • 总时长:约 2,000 小时
  • 人数:1,000+ 人
  • 操作状态:1,000,000+ 个

应用场景

适用于人体动作分析与人-物交互研究:

  • 人类动作识别与分类
  • 文本到动作的生成
  • 人-物交互(HOI)分析
  • 从人类演示中学习机器人策略

官方网站

https://vankouf.github.io/MotionMillion/

论文网址:https://arxiv.org/abs/2507.07095