Galaxea 开放世界数据集和 G0 双系统 VLA 模型
G0-VLA 架构和训练流程:阶段 1 以自回归方式在跨实体数据上预训练一个视觉-语言模型。阶段 2 和后训练共享相同的模型结构,通过监督 Action Transformer 的动作重建(使用流匹配损失)在 Galaxea 开放世界数据上进行训练,该数据包含特定于实体的视图以及高级和子任务指令。

在这个仓库中,你可以找到:
- model_pre.pt: 阶段 2 预训练后的模型权重
此仓库中的所有数据和代码均受 CC BY-NC-SA 4.0 许可。如果您使用了我们的数据集或模型,请引用:
@article{galaxea2025, title={Galaxea G0: Open-World Dataset and Dual-System VLA Model}, author={Galaxea Team}, journal={arXiv preprint arXiv:2509.00576}, year={2025} }