蚂蚁集团旗下具身智能公司灵波科技正式开源具身大年夜模型 LingBot-VLA。
https://www.modelscope.cn/collections/Robbyant/LingBot-VLA

据介绍,在上海交通大年夜学开源的具身评测基准 GM-100(包含 100 项真实操作义务)测试中,LingBot-VLA 在 3 个不合的真实机械人平台上,跨本体泛化平均成功率相较于 Pi0.5 的 13.0% 晋升至 15.7%(w/o Depth)。引入深度信息(w/ Depth)后,空间感知才能加强,平均成功率进一步攀升至 17.3%,展示了 LingBot-VLA 强大年夜的精确性和泛化性。

Model:
在 RoboTwin 2.0 仿真基准(包含50项义务)评测中,面对高强度的情况随机化干扰(如光照、杂物、高度扰动),LingBot-VLA 凭借独特的可进修查询对齐机制,高度融合深度信息,操作成功率比 Pi0.5 晋升了 9.92%,实现了从虚拟仿真到真实落地的全方位机能领跑。

后练习成本低、效力高、代码全开源 真正实用的 VLA 模型
得益于涵盖主流构型和详尽义务的大年夜范围预练习,LingBot-VLA 具备强大年夜的通用操控才能,并且可以或许将其高效迁徙到多样的下流机械人义务中。
实验注解,LingBot-VLA 鄙人流义务中可以或许应用更少的数据,达到超出 π0.5 的机能;并且机能优势会跟着数据量的增长而持续扩大年夜。

LingBot-VLA 团队还构建了一套高效的后练习对象链,在 8 卡 GPU 设备下实现了单卡每秒 261 个样本的吞吐量,其练习效力达到 StarVLA、OpenPI 等主流框架的 1.5~2.8 倍,实现了数据与算力成本的双重降低。
LingBot-VLA 此次开源供给了模型权重,并同步开放了包含数据处理、高效微调及主动化评估在内的全套代码库。
-
Website: https://technology.robbyant.com/lingbot-vla
-
https://huggingface.co/collections/robbyant/lingbot-vlaDatasets: https://huggingface.co/datasets/robbyant/lingbot-GM-100
-
Code: https://github.com/Robbyant/lingbot-vla
-
Tech Report: https://arxiv.org/abs/2601.18692

发表评论 取消回复