微软宣布 Rho-alpha 模型，机械人可经由过程说话指令履行复杂义务

42 阅读 0 评论 0 点赞

微软研究院宣布了一款机械人范畴的新型AI模型Rho-alpha，并表示将起首经由过程研究型早期拜访筹划向外部开放。

该模型是微软初次基于 Phi 视觉-说话模型家族、专门面向机械人应用打造的体系。从技巧定位来看，Rho-alpha 被微软视为“物理 AI”计谋的一部分。与重要运行在数字空间中的大年夜说话模型不合，这一偏向强调智能体可以或许直接与物理世界交互。

Rho-alpha 的核心才能在于，将天然说话指令直接转化为机械人控制旌旗灯号，使机械人可以或许完成复杂的双手协同操作义务，而无需依附传统工业机械人常见的固定脚本和预设流程。今朝，微软正在双臂机械人平台和类人机械人上对该体系进行评估测试。

Rho-alpha模型可以冲破机械人在高度可控情况中运行的局限，且可以或许将人类的天然说话指令直接转化为机械人的控制旌旗灯号，批示机械人完成复杂的双手协同操作，无需依附固定的预设脚本。

此外，该模型具备明显的适应性，可在运行中动态调剂行动，并许可人类操作者经由过程直不雅对象进行干涉改正，体系会将此反馈纳入进修过程。为解决机械人练习数据稀缺的问题，Rho-alpha采取了真实演示、仿真义务与大年夜范围视觉问答数据相结合的混淆练习方法，大年夜量合成数据经由过程Azure云上的仿真流水线生成。

今朝该模型正在双臂机械人和类人机械人平台长进行测试评估。它不仅结合了视觉与说话懂得，还引入了触觉感知才能，使机械人能根据触觉反馈及时调剂动作，将来版本还将融入力感知等更多传感模态。

点赞(0) 打赏

本文分类：互联网
本文标签：微软发布 Rho-alpha 模型，机器人可通过语言指令执行复杂任务
浏览次数：42 次浏览
发布日期：2026-01-24 09:26:16
本文链接：http://www.fqpy.com/internet/7538

上一篇 > 国度顶级域名（雄安）解析节点正式上线
下一篇 > OpenAI 已敲定告白商名单，并在告白上线前颁布关键细节

评论列表共有 0 条评论

暂无评论

微软宣布 Rho-alpha 模型，机械人可经由过程说话指令履行复杂义务

评论列表 共有 0 条评论

发表评论 取消回复

评论列表共有 0 条评论

发表评论取消回复