
在人类世界里,我们经由过程不雅察、模仿和调剂他人行动来进修新技能已持续了约30万年,这对同类之间相对轻易实现。 但当对象换成身材构造和认知方法截然不合的其他动物时,简单模仿就变得艰苦;对于植物、真菌、原生生物甚至细菌,人类更谈不上“向它们进修”动作技能。 在机械人范畴,即便我们已经能让机械人按照人类示范履行动作,甚至以远高于人类的速度完成义务,但若何让构造和体系完全不合的机械人共享同一套学到的技能,仍是经久难题。
在最新揭橥于《Science Robotics》的论文中,Sthithpragya Gupta 和 Aude Billard 等人提出,应用“进修‑示教(learning-from-demonstration,LfD)”框架下的活动学智能,可以让外形差别如同R2D2与洗碗机般悬殊的机械人,从同一次人类示范中习得可各自履行的新动作。 与以往只在同型号机械人之间迁徙技能的做法不合,这一体系会对示范动作进行数学建模,将其转化为可以适配到不合机械人关节构造、活动范围和稳定性束缚上的通用策略。
研究团队起首经由过程动作捕获记录人类在工业装配情景中对物体进行摆放、推动、抛掷等一系列操作。 随后,他们建立起一套用来描述机械人自身物理束缚的分类体系,包含均衡极限、关节活动范围等,并将这些信息与动作捕获数据结合,形成可被不合平台调用的不雅测与自适应进修模型。 在实验中,三台在外形和机构上完全不合的贸易机械人,仅经由过程不雅察人类示范,就可以或许稳定地完成将木块从传送带推到工位、再搬运至桌面,最后抛入指定容器等一整套操作流程。

核心技巧之一是所谓“全局稳定动力体系”(globally stable dynamical system),它使得机械人在进修到的动作空间内可以包管活动过程的可猜测性和安然性。 研究人员表示,每一台机械人在履行义务时负责的步调可以交换调剂,体系依然可以或许正常工作;不合机械人会以相符自身物理前提的方法来懂得并重构同一项技能,但始终保持在安然、可行的范围内。 LASA 实验室负责人 Aude Billard 指出,这项工作解决了机械人学范畴一个经久存在的挑衅:如安在机械构造各别的机械人之间迁徙已学会的技能,同时确保行动可猜测且安然靠得住。
从应用角度看,这种活动学智能框架意味着,工业临盆线或办事场景中新增或调换机械人时,不再须要为每款新硬件重写动作代码,只需供给有限次甚至一次人类示范即可完成技能注入。 这不仅削减了对专业编程和控制理论常识的依附,还为中小企业应用多样化机械人设备降低了门槛。 论文合营第一作者 Gupta 强调,在实验中,各机械人分担负务步调的方法可以随时调剂,而全部体系依旧能顺利完成功课流程,显示出高度的灵活性。
项目标下一步目标,是让人类操作者甚至无需亲自做示范动作,仅经由过程天然说话描述,即可让机械人生成并履行对应的行动。 另一位合营第一作者 Durgesh Haribhau Salunkhe 表示,团队欲望彻底清除对技巧背景的请求:用户只需带来设法主意和期望行动,剩下的由机械人主动完成。 假如相干研究持续推动,这种“跨形态共享技能”的进修方法有望成为将来机械人体系的基本才能,加快机械人在更多真实世界场景中的落地安排。

发表评论 取消回复