千寻智能 Spirit v1.5 在具身智能模型评测平台 RoooChallenge 最新榜单中取得了世界第一的排名,成功超出 Pi 0.5。

今朝,Spiritv1.5 模型权重、部分公开的微调义务权重以及推理与安排示例内容已实现开源,后续内容则将分阶段持续更新。Spiritv1.5是一个面向真实世界义务的端到端具身智能基本模型,致力于在单一模型框架内同一完成:
- 泛化性:强大年夜的跨义务与跨本体泛化才能
- 稳定性:面向真实场景的持续义务才能
- 精确性:对操作目标与履行成果的稳定精确控制
是以,Spirit v1.5在预练习阶段引入了开放式、多样化的数据采集范式。数据采集不再严格限制义务脚本,而是以“完成有意义目标”为导向,许可操作过程中天然串联多个子义务与原子技能。这种方法使模型在练习阶段接触到更接近真实世界的复杂性,包含遮挡、掉败恢复以及义务之间的天然过渡。
在模型架构上,Spirit v1.5采取Vision-Language-Action(VLA)同一建模框架,将视觉感知、说话懂得与动作生成整合在同一决定计划流程中,削减多模块串联带来的信息损耗,并晋升长程义务中的整体稳定性。
在练习办法上,Spirit v1.5的一个核心特点是不依附高度精选的“干净”演示数据。千寻智能在技巧博客中提出,过度脚本化、受控情况下采集的数据,固然有利于模型快速收敛,但会限制其在真实世界中的泛化才能。
相干消融实验显示,在雷同数据范围下,基于多样化数据预练习的模型,在新义务上的迁徙效力明显高于基于传统演示数据练习的模型,达到雷同机能所需的计算资本明显削减。这一成果也说清楚明了Spirit v1.5在RoboChallenge多构型、未见义务评测中的稳定表示。
根据介绍,RoboChallenge是2025年新成立的标准化评测体系,由Dexmal、Hugging Face等机构结合提议,聚焦具身智能模型的跨平台才能验证。作为当前具身智能范畴强调真实机械人履行才能的重要benchmark,其评测义务覆盖复杂指令懂得、多步调操作筹划以及跨场景履行稳定性等多个维度。

发表评论 取消回复