(图说:在 GM-100 真机评测中,LingBot-VLA 跨本体泛化机能超出 Pi0.5)

继昨日开源高精度空间感知模型 LingBot-Depth后,蚂蚁集团旗下灵波科技今日宣布周全开源具身大年夜模型 LingBot-VLA。作为一款面向真实机械人操作场景的“智能基座”,LingBot-VLA 实现了跨本体、跨义务泛化才能,并大年夜幅降低后练习成本,推动“一脑多机”走向工程化落地。

在上海交通大年夜学开源的具身评测基准 GM-100(包含 100 项真实操作义务)测试中,LingBot-VLA 在 3 个不合的真实机械人平台上,跨本体泛化平均成功率相较于 Pi0.5 的 13.0% 晋升至 15.7%(w/o Depth)。引入深度信息(w/ Depth)后,空间感知才能加强,平均成功率进一步攀升至 17.3%,刷新了真机评测的成功率记载,验证了其在真实场景中的机能优势。

蚂蚁灵波开源具身大年夜模型LingBot-VLA,跨本体跨义务泛化才能立异高 

在 RoboTwin 2.0 仿真基准(包含50项义务)评测中,面对高强度的情况随机化干扰(如光照、杂物、高度扰动),LingBot-VLA 凭借独特的可进修查询对齐机制,高度融合深度信息,操作成功率比 Pi0.5 晋升了 9.92%,实现了从虚拟仿真到真实落地的全方位机能领跑。

蚂蚁灵波开源具身大年夜模型LingBot-VLA,跨本体跨义务泛化才能立异高 (图说:在 RoboTwin 2.0 仿真评测中,LingBot-VLA 跨义务泛化机能超出 Pi0.5)

经久以来,因为本体差别、义务差别、情况差别等,具身智能模型落地面对严重的泛化性挑衅。开辟者往往须要针对不合硬件和不合义务反复采集大年夜量数据进行后练习,直接举高了落地成本,也使行业难以形成可范围化复制的交付路径。

据悉,在数据采集阶段,LingBot-VLA 应用了星海图、松灵的硬件平台,乐聚、库帕思、国度处所共建人形机械人立异中间、北京人形机械人立异中间有限公司、博登智能、睿尔曼也在模型预练习阶段供给了高质量数据支撑。今朝,LingBot-VLA 已与星海图、松灵、乐聚等厂商完成适配,验证了模型在不合构型机械人上的跨本体迁徙才能。

针对上述问题,LingBot-VLA 基于 20000+ 小时大年夜范围真机数据进行预练习,覆盖了 9 种主流双臂机械人构型(包含 AgileX,Galaxea R1Pro、R1Lite 、AgiBot G1等),从而让同一个“大年夜脑”可以无缝迁徙至不合构型的机械人,并在义务变更、情况变更时保持可用的成功率与鲁棒性。与高精度空间感知模型 LingBot-Depth合营,LingBot-VLA 能获得更高质量的深度信息表征,经由过程“目力”的进级,真正做到“看得更清楚、做的更明白”。

LingBot-VLA 凭借扎实的基座才能,大年夜幅降低了下流义务的适配门槛,仅需 80 条演示数据即可实现高质量的义务迁徙。此外,合营底层代码库的深度优化,其练习效力达到 StarVLA、OpenPI 等主流框架的 1.5~2.8 倍,实现了数据与算力成本的双重降低。

此次开源不仅供给了模型权重,还同步开放了包含数据处理、高效微调及主动化评估在内的全套代码库。这一举措大年夜幅紧缩了模型练习周期,降低了贸易化落地的算力与时光门槛,助力开辟者以更低成本快速适配自有场景,模型实用性大年夜幅晋升。

蚂蚁灵波科技CEO朱兴表示,“具身智能要想大年夜范围应用,依附高效的具身基座模型,这直接决定了是否可用以及可否用得起。我们欲望经由过程LingBot-VLA的开源,积极摸索具身智能上限,推动具身智能研发早日进入可复用、可验证、可范围化落地的新阶段,让AI加快在物理世界渗入渗出普及,更早的办事每一小我。”

LingBot-VLA是蚂蚁开源的第一款具身智能基座模型,也是蚂蚁在AGI研发上又一摸索性成果。朱兴介绍,蚂蚁集团果断以开源开放模式摸索 AGI,为此打造 InclusionAI,构建了涵盖基本模型、多模态、推理、新型架构及具身智能的完全技巧体系与开源生态。LingBot-VLA的开源,恰是InclusionAI的症结实践。“等待联袂全球开辟者,加快具身智能技巧的迭代与范围化应用,助力 AGI 更快到来。”

雷峰网版权文章,未经授权禁止转载。详情见转载须知。

蚂蚁灵波开源具身大年夜模型LingBot-VLA,跨本体跨义务泛化才能立异高

点赞(0) 打赏

评论列表 共有 0 条评论

暂无评论

微信小程序

微信扫一扫体验

立即
投稿

微信公众账号

微信扫一扫加关注

发表
评论
返回
顶部