该论文由清华大年夜学与北京银河通用机械人股份有限公司合作完成。论文的合营第一作者为银河通用研究团队成员薛晗、梁斯凯和张智楷,个中薛晗和张智楷为清华大年夜学学生,指导师长教师为清华大年夜学助理传授弋力。
一、传统避障,困在“低效试错”里
在堆满杂物的客堂里穿梭——须要哈腰避开低矮的咖啡桌、抬腿跨过地上的书本、侧身挤过沙发与书架间的窄缝,这对人类来说易如反掌。但对机械人而言,倒是融合情况感知、动作筹划与碰撞规避的复杂挑衅。
传统强化进修(RL)仅在碰撞产生时赐与处罚,机械人须要反复试错才能摸索出安然路径,进修效力极低;并且直接处理激光雷达、摄像头的原始高维数据,机械人难以快速辨认“自身与障碍物的空间关系”,比如“头部是否会撞到吊灯”“腿部可否跨过书本”。现有办法多针对单一类型障碍物(如地面凸起、高空遮挡),无法应对“地面有杂物+两侧有阻挡+头顶有吊灯”的全空间束缚场景。
清华大年夜学与Galbot团队提出的HumanoidPF(人形势能场) ,为机械人付与了“避障直觉”:它将机械人与障碍物的空间关系编码为持续的梯度场,像无形的“力”引导机械人自立选择安然路径,无需复杂计算就能完成哈腰、抬腿、侧身等灵活动作,成功实现复杂室内场景的无碰撞穿梭。
它的核心魅力在于:不再让机械人依附“碰撞后处罚”的低效试错,而是经由过程前瞻性的情况引导,让避障成为一种“本能反响”,大年夜幅晋升了人形机械人在真实家居场景的实用性。
• 论文标题:Collision-Free Humanoid Traversal in Cluttered Indoor Scenes
• 相干论文:https://arxiv.org/abs/2601.16035
• 项目主页:https://axian12138.github.io/CAT/
• GitHub:https://github.com/GalaxyGeneralRobotics/Click-and-Traverse
HumanoidPF的灵感源自经典的人工势能场(APF),但针对人形机械人的多关节构造进行了重构——它将目标点视为“吸引力”,障碍物视为“排斥力”,形成持续的梯度场,为机械人的每个身材部位供给明白的活动指引。
1. 构建HumanoidPF:用“力场”编码空间关系
HumanoidPF经由过程吸引力场和排斥力场的叠加,生成全局导航梯度场,核心公式如下:
• 吸引力场(引导向目标):

是机械人身材部位x到目标点g的最短无碰撞路径(测地线距离),确保引导路径避开障碍物,而非直线穿越。
• 排斥力场(远离障碍物):

是基于障碍物的带符号距离(signed distance field, sdf)——距离障碍物越近,排斥力越强,避免碰撞。
• 最终引导场(合成吸引力与排斥力):

梯度场的偏向,就是机械人身材部位的最优活动偏向,既远离障碍物,又朝向目标点。

HumanoidPF示意图:左图为势能场2D示意图(红色为障碍物排斥区,蓝色为目标吸引力区);右图为活动偏向分布2D示意图,色彩越深表示该偏向越安然,引导机械人自立选择最优路径。
2. 适配人形机械人:优先级加权,避免身材部位“打斗”
人形机械人有头、躯干、四肢等多个部位,直策应用势能场可能出现活动冲突(如左手要向左躲、右手要向右躲)。为此,HumanoidPF引入优先级加权机制:
• 核心部位优先:骨盆等核心部位权重更高,确保整体活动偏向稳定;四肢权重较低,灵活适配核心偏向。公式如下:
• 危险部位加权:根据身材部位与障碍物的距离(d(x_k))和活动速度(v_k),动态晋升危险部位的权重,公式如下:
距离障碍物越近、活动速度越快,权重越高,优先规避碰撞风险。
确保全身活动调和一致,无冲突。
3. 双管齐下:让避障进修更高效
HumanoidPF经由过程“感知输入+嘉奖引导”双重方法,融入强化进修练习,大年夜幅晋升进修效力:
• 作为感知输入:在机械人13个关键身材部位(头、胸、骨盆、四肢关节等)查询梯度场向量,形成紧凑的情况感知特点,让机械人直接“感知”该若何移出发体;
• 作为嘉奖引导:将梯度场引导的活动偏向,建模为冯·米塞斯-费舍尔(vMF)分布,鼓励机械人动作与引导偏向对齐,供给密集、前瞻性的嘉奖旌旗灯号,公式如下:
个中

最终的引导场为:
是引导偏向,

二、HumanoidPF:给机械人装“避障导航仪”
8类场景避障机能比较:HumanoidPF(最后一行)在所有场景中均实现最高成功率(SR%)和最小距离误差(DE(m)),优势明显。
5. 真实世界:“点击导航”轻松穿梭

这种设计让机械人无需比及碰撞产生,就能获得及时反馈,进修效力大年夜幅晋升。
整体技巧 pipeline:左:HumanoidPF构建及在进修中的双重感化(感知输入+嘉奖引导);右:混淆场景生成与真实安排流程,从仿真练习到“点击导航”实际应用。
三、拓展练习:混淆场景生成,让机械人“见多识广”
要应对真实世界的复杂情况,机械人须要在多样化场景中练习。为此,研究团队提出混淆场景生成策略,大年夜幅晋升政策的泛化才能:
是偏向集中度(核心部位集中度更高),
1. 真实场景裁剪:从3DFRONT等真实室内数据集,裁剪5m×5m的场景块,保存家具、家电等真实障碍物构造;
2. 法度榜样化障碍物生成:人工生成“地面凸起、两侧阻挡、高空吊挂”的全空间束缚场景,甚至经由过程扭转、噪声扰动,模仿不规矩障碍物(如散落的书本、倾斜的盒子);
3. 课程进修:从简单场景(单一障碍物)慢慢过渡到复杂场景(多障碍物全空间束缚),让机械人循序渐进控制避障技能。
这种练习方法,让机械人见过“哈腰躲吊灯+抬腿跨杂物+侧身挤窄缝”的复合场景,在真实情况中碰到类似情况时,能快速做出反响。
避障实测场景:(a)8种典范测试场景的避障行动;(b)法度榜样化生成的复杂障碍物场景;(c)真实世界“哈腰-跨障”复合义务;(d)动态干扰下的避障表示,机械人能应对物体移动的突发情况。
四、实测:灵活应对8类场景
在“哈腰-跨障”“侧身-哈腰”“多障碍物持续避障”等8类复杂场景中,HumanoidPF的成功率均跨越90%,远高于ASTraversal(28.1%-82.1%)和Humanoid Parkour(33.3%-88.7%)等基线办法。
HumanoidPF在Unitree G1人形机械人上完成了周全测试,无论是仿真照样真实场景,都展示出卓越的避障才能:
4. 仿真测试:8类场景成功率超90%
个中,在最具挑衅性的“侧身-哈腰-跨步”场景(须要同时规避两侧和上方障碍物),HumanoidPF的成功率达到86.6%,远超基线,充分证实其处理全空间束缚的才能。
研究团队将政策安排为“点击导航(Click-and-Traverse)”体系:用户在地图上点击目标地位,机械人经由过程激光雷达构建及时情况地图和HumanoidPF,自立筹划路径并穿梭,无需手动操控。
在真实室内测试中,机械人成功完成:
• 哈腰避开低矮茶几(高度0.4m);
• 抬腿跨过15cm高的书本;
• 侧身挤过0.8m宽的窄缝;
混淆场景生成的泛化机能:参加高难度法度榜样化场景练习后(最后一行),机械人在未知复杂场景的成功率从1.2%晋升至66.7%,泛化才能大年夜幅晋升。
• 应对“哈腰+跨障”复合义务,全程无碰撞,表示稳定。

6. 泛化与鲁棒性:应对未知场景和动态干扰
是机械人实际活动偏向。
• 零-shot泛化:在未练习过的艺术家设计场景中,包含真实家具和不规矩障碍物,练习后的政策在“简单场景”成功率95.2%,“复杂场景”成功率66.7%,远高于仅用真实场景练习的基线;
• 动态干扰:在机械人穿梭过程中移动障碍物,它能及时更新HumanoidPF,调剂活动轨迹,避免碰撞,展示出强鲁棒性。
五、关键优势:为什么HumanoidPF如斯高效?
1. 前瞻性引导:不再依附“碰撞后处罚”,而是经由过程梯度场供给及时、密集的活动指引,进修效力晋升数倍;
2. 低迁徙gap:势能场作为持续的空间表示,能腻滑传感器噪声和场景细节差别,从仿真到真实世界的迁徙几乎无需额外微调;
3. 通用适配:不依附特定障碍物类型或场景构造,无论是规矩家具照样不规矩杂物,都能经由过程势能场编码空间关系,泛化性极强。
比较其他工作:S={g,l,o} 表示“地面(ground)有杂物+两侧(lateral)有阻挡+头顶(overhead)有吊灯”的全空间束缚。
总结
HumanoidPF的核心价值,是为机械人构建了一套“机械人-障碍物关系”的通用说话——它将复杂的空间感知转化为直不雅的活动指引,让避障从“低效试错”变为“本能反响”。
跟着技巧完美,人形机械人或许能像人类一样,在堆满杂物的房间里灵活穿梭,自立完成家务、取物等义务,真正走进日常生活。而HumanoidPF的提出,为通用人形机械人的情况适应才能奠定了关键基本。
雷峰网版权文章,未经授权禁止转载。详情见转载须知。

发表评论 取消回复