Galaxea 开放世界数据集和 G0 双系统 VLA 模型

G0-VLA 架构和训练流程：阶段 1 以自回归方式在跨实体数据上预训练一个视觉-语言模型。阶段 2 和后训练共享相同的模型结构，通过监督 Action Transformer 的动作重建（使用流匹配损失）在 Galaxea 开放世界数据上进行训练，该数据包含特定于实体的视图以及高级和子任务指令。

在这个仓库中，你可以找到：

model_pre.pt: 阶段 2 预训练后的模型权重

此仓库中的所有数据和代码均受 CC BY-NC-SA 4.0 许可。如果您使用了我们的数据集或模型，请引用：

@article{galaxea2025, title={Galaxea G0: Open-World Dataset and Dual-System VLA Model}, author={Galaxea Team}, journal={arXiv preprint arXiv:2509.00576}, year={2025} }

*G0-VLA

模型测试申请介绍

Galaxea 开放世界数据集和 G0 双系统 VLA 模型

产品

解决方案

开发者中心

关于我们

关注或联系我们