作者丨齐铖湧

编辑丨马晓宁

在无人机迈向通用飞翔智能体的过程中,具身智能正成为其实现认知跃迁的核心技巧路径。雷峰网("大众,"号:雷峰网)第八届 GAIR 全球人工智能与机械人大年夜会,邀请到了具身智能在飞翔机械人赛道的头部玩家微分智飞开创人兼CEO高飞,来聊聊具身智能的一个细分范畴——飞翔具身智能,并商量了世界模型在个中的感化。

本文整顿自高飞与AI科技评论的对话:

01

传统无人机和飞翔具身智能

AI科技评论:您提出“飞翔具身智能”这一概念,它与传统的无人机灵能有何本质差别?

同样,飞翔具身智能和传统无人机最大年夜差别在于智能。传统无人机是一种machine,最多是一种 automatic machine(自念头器)。然则飞翔具身智能,要做的是autonomous甚至intelligent & smart machine,这里的对象是聪慧、易于交互、有经验、可以泛化的,和人一样能懂得说话、情况、做推理的载体。飞翔具身智能,可以在断网、无卫星旌旗灯号、无人操控的情况下,自力完成感知-懂得-决定计划-履行的全闭环流程,相当于物理世界中的飞翔智能体。


高飞:具身智能的本质是“智能机械人”,付与各类机械人认知、推理和泛化决定计划的才能,对于飞翔也不例外,将会从新定义飞翔机械人。拿操作类的机械人打比方,双臂具身智能和传统工业机械臂的本体很类似,甚至可能完全长得一样,但双臂具身智能具备几个关键才能:泛化通用、自立决定计划。就是这些才能,让它和传统机械臂很不一样。

02

机械人是一个面向对象的学科

AI科技评论:您作为一名90后,既是浙大年夜长聘副传授、博导,学术背景很扎实,同时又是微分智飞开创人,一边发paper一边科技创业,能不克不及结合学术角度,聊聊您对具身智能的看法?

高飞:我算是一个机械人范畴的学院派学者。机械人范畴有一个异常明显的特点,它不是面向办法的学科,而是一个典范的面向对象的学科。它的核心目标就是要把机械人造出来并且能work,在过程中应用的办法老是为这个目标办事。

所以你会发明很多机械人学者都是全栈工程师和实用主义者,对新思惟接收度很高。AI结合实体,完成从信息输入到自立进修到义务履行的闭环,这就是具身智能。在 AI 技巧的加持下,无论是基于大年夜模型的大年夜脑才能,照样小脑上端到端强化进修带来的运控才能,照样群体上的分布式群脑才能,都可以让机械人和无人机产生质变。本质上,机械人学者看到了从新定义机械人,做新一代真正“智能的”机械人的巨大年夜机会,在如许的时代机会面前,我认为推动技巧落地的机会必须要把握。

AI科技评论:“机械人不是一个面对办法,而是面向对象的学科”这点很有意思,如今很多在做具身智能的从业者,都是从主动驾驶转过来的,能展开讲讲个中的原因么?

AI科技评论:很有意思,能聊聊“分布式集群技巧”这个范畴的学术成果么?(雷峰网)

高飞:主动驾驶本质上是一种地面轮式机械人,受自身活动学,以及交通规矩、人类车辆交互方法等复杂场景束缚。今朝主动驾驶范畴的技巧,本质是机械人技巧在平面移动范畴的投影。

在过往的机械人范畴,大年夜家认为足式机械人很难work,更不消说家当化,所以做足式的少;做轮式机械人(包含主动驾驶)和无人机这类移动载体的更多。如今跟着技巧的成长,更多形态的机械人让大年夜家看到了落地的曙光,很多主动驾驶的从业者天然会转向新范畴,并且将邻近范畴的knowhow带过来复用。

AI科技评论:那就聊聊飞翔具身智能的应用处景吧,能在哪些场景 work ?

高飞:整体来说,我们(微分智飞)如今还处于摸索和小批量验证阶段,正寻找有更大年夜市场空间和技巧匹配度的偏向。

在泛巡检、泛测绘类义务中,我们已经有了一些交付量,积聚了上千次实飞数据。今朝我们重要面向高危、人工功课艰苦的场景,产品能在全程自立决定计划下完成复杂情况的信息采集;这些采集的信息能帮我们进一步练习模型,让基座模型更能适应特定行业的共性需求。更多场景我们正在一一解锁,比如在市政安防范畴,飞翔具身智能可以帮助智能巡逻和快速应急。

AI科技评论:听起来确切很有想象空间,之前懂得到飞翔具身智能有一个异常关键的部分,叫做“分布式集群技巧”,可以展开说说么?

高飞:这个范畴的成长很快,我早期在港科大年夜解决单体自立导航,进入浙大年夜工作后开端研究集群协同。

和传统的无人机集中控制不一样,分布式集群技巧,类似人类军训走方阵,每小我的分工不合,每个个别会自力思虑决定计划,属于分布式智能协同,这就请求集群中的每一个个别既能自立智能,同时又要高效沟通和分工,不克不及起冲突。

如今我们能做到在仿真里同时控制 1, 000 个飞翔机械人,并且是完全分布式的架构。在真实的场景下,我们可以实现数十机范围的分布式自立搜救、协同建图,甚至多机协同搬运。

高飞:我们第一次实现分布式集群自立导航,是在2022 年的一篇《Science Robotics》工作中。这篇工作被评价为“迈出了无人机集群走出受限实验室场景的重要一步”,是一个重要的里程碑,它证清楚明了多个小型无人机只靠异常便宜的机载传感器和芯片,就可以实现分布式的自立导航、避障和建图。

AI科技评论:您若何对待世界模型在飞翔具身智能范畴的应用?当前有哪些机会、挑衅与局限?

高飞:这是一个令人高兴的偏向。假如说具身智能是让飞翔机械人有了大年夜脑,那么世界模型就是让这个大年夜脑可以或许预演将来和熟悉空间。在我看来,它得价值重要表如今应用和认知层面。

起首是应用层面,它能模仿、能猜测。飞翔机械人的容错率很低,炸机的成本很高。我认为世界模型本质上是一个针对未知空间和将来时光的猜测器。它能帮助机械人提前推演不合飞翔路径带来的后果;也能作为一个高保真的仿真器,生成大年夜量长尾场景数据,用来练习和验证。

更本质的是认知维度的补全。如今的 LLM或者说MLLM重要解决的是逻辑。但飞翔机械人是在三维物理世界里活动的,光懂逻辑不敷,还必须懂几何构造和演变规律,世界模型同时具备这三种才能。打个比方,当机械人面前有一棵树,世界模型不仅能让它知道“那是树”,还能懂得树的三维构造、甚至预判树枝怎么摇。

当然如今照样面对一些挑衅, 比如模型的精确度、及时性,以及怎么把这么大年夜一个模型“塞进”机载计算单位里,还要包管毫秒级响应,这也是大年夜家正在攻关的偏向。但一旦走通,它很可能成为机械人智能的通用基座,将来只须要微调,就能适应各类真实义务。(雷峰网)


03

在本身的科研成果上,

没有人比本身懂得更深刻

AI科技评论:您在知乎上发过一篇关于读博的神贴,引起很多学生的共鸣,能聊聊您的进修经历和创业契机么?

高飞:我的肄业经历很简单,我是 18 岁上大年夜学,从一个小镇青年考上浙大年夜,选择了主动化专业,之后申请了港科大年夜的直博。我的师长教师当时给我安排的博士卒业课题是让飞翔机械人可以实现全自立(full autonomous)导航,可以或许在实验室门口一键起飞,全程无人干涉,主动飞到黉舍门口,什么时刻做出来就什么时刻卒业。

博士卒业后我回到浙大年夜工作,那时我认为还有很多器械想做,所以组建了一个团队来解决这些问题。2019 年到2024 年时代,我在科研方面做出了一些有影响力的成就,比如野外情况下的自立集群、无人机导航筹划体系等,完成了多项国际开创成果,这些成果照样让人比较有成就感的。

但我始终抱有将技巧落地的欲望。我认为临盆力是有三个层次——科学、技巧和应用。科学是在发散摸索新偏向;接下来是技巧,就是由发散的诸多科研摸索收敛而成的、有较大年夜落地可能的技巧路径;最后是应用阶段,也可以说是工程化、产品化阶段,就是让已经收敛的技巧路径产生切实应用价值,直到最后有人愿意为此买单。

作为学者,我在研究的过程中逐渐意识到,要真正实现一项新技巧的完全闭环,必须走到应用阶段——无论是本身推动照样交给别人去做。当然,在本身的科研成果上,没有人的懂得比本身更深刻,是以照样本身去做更直接和有效一些。

当然,最后促使我选择如今创业的部分原因还有具身智能这个巨大年夜的时代机会:将AI赋能到机械人实体上,将会创造无穷可能。

AI科技评论:最后一个问题,你认为具身智能如今是一个泡沫么?(雷峰网)

高飞:我认为具身智能的泡沫有,然则没有大年夜家想象得那么大年夜。

大年夜家想到机械人,都邑下意识地等待它是聪慧的、能思虑的个别(甚至群体)。然则经久以来,机械人实际上是逗留在类似流程主动化、工业主动化的专用设备阶段。这很“机械”,但很不“人”。

要实现真正智能的机械人,关键是机械人的“脑”。以前这些年学界和家当界在小脑和本体上都取得了一些冲破,但大年夜脑层面仍几乎是一片空白,更不要提代表群体智能的群脑技巧了。我认为具身智能是能真正推念头器人大年夜小脑和群脑成长的关键变量,是汗青性的机会;当下具身智能不是一场泡沫,而是一个汗青性拐点。

雷峰网原创文章,未经授权禁止转载。详情见转载须知。

对话微分智飞高飞:看具身智能若何激发飞翔认知革命 | GAIR 2025

点赞(0) 打赏

评论列表 共有 0 条评论

暂无评论

微信小程序

微信扫一扫体验

立即
投稿

微信公众账号

微信扫一扫加关注

发表
评论
返回
顶部