
数据集介绍
MotionMillion 是浙江大学发布的大规模人体动作数据集,专注于从视频中提取的连续人体运动与操作状态。
- 任务时序长度:连续动作序列,包含完整的时序上下文。
- 动作可执行性:数据来源于真实人类操作的视频捕捉,包含低层人体动作和操作状态信息,适用于从人类演示中学习。
- 时序连续性:数据为高帧率连续序列,保留动作的完整时序动态特征。
- 语言控制:提供文本配对描述,支持文本到动作的生成与检索。
主要特点
- 超大规模:包含2,000 小时的高质量运动序列,每个动作超过20个详细的注释,是目前最大的开源人体动作数据集之一。
- 丰富的人群覆盖:涉及 1,000+ 位不同个体,具有良好的动作多样性。
- 操作状态标注:包含超过 100 万个精细的操作状态标注,支持对人与物体交互的细粒度分析。
- 视频来源:数据来源于真实世界视频采集,保留了自然的动作表现与环境背景。
数据来源
- 发布方:浙江大学
- 数据形式:真实世界视频采集
- 标注:包含文本配对与操作状态标注
规模
- 总时长:约 2,000 小时
- 人数:1,000+ 人
- 操作状态:1,000,000+ 个
应用场景
适用于人体动作分析与人-物交互研究:
- 人类动作识别与分类
- 文本到动作的生成
- 人-物交互(HOI)分析
- 从人类演示中学习机器人策略
官方网站
https://vankouf.github.io/MotionMillion/
论文网址:https://arxiv.org/abs/2507.07095