
杨立昆不会担负该公司的首席履行官,而是履行董事长,这让他能拥有与在Meta时雷同的研究自由。
报道称,杨立昆的新公司名为先辈机械智能实验室(Advanced Machine Intelligence Labs),将由法国医疗人工智能始创公司Nabla的结合开创人兼首席履行官亚历克斯·勒布伦(Alex LeBrun)引导。
“我是一名科学家,一个有远见的人。我能鼓励人们去研究有趣的事物。我很善于断定哪种技巧可行、哪种弗成行。但我做不了首席履行官,”杨立昆说,“我既太缺乏层次,并且也年纪太大年夜了!”
数十年来,他一向在潜心构思若何让机械具备如许的智能。他也毫不讳言本身对大年夜型说话模型的质疑立场,硅谷当下正痴迷于这类模型,认为它们有望实现超出人类的智能,但在他看来,大年夜型说话模型虽有实用价值,其本质却受限于说话载体,存在根本性局限。要实现媲丽人类的智能程度,机械还必须懂得现什物理世界的运行规律。
为杀青这一目标,他提出了一套解决筹划——基于V-JEPA架构的“世界模型”。这类模型不依附说话文本,而是经由过程进修视频和空间数据来懂得物理世界,同时具备筹划、推理和长效记忆的才能。杨立昆将这种智能形态定名为高等机械智能(AMI)。
杨立昆于1960年出身,在巴黎郊区长大年夜,从小就对人类智能的来源问题充斥好奇。
恰是他八、九岁时不雅看的片子《2001太空漫游》(2001:A Space Odyssey),为他指清楚明了如今的门路。他比划着,形容当时本身的思惟受到了极大年夜震动。
杨立昆的父亲是一名航空工程师,同时也是个“业余创造家”,恰是父亲培养了他着手制造、捣鼓各类物件的爱好。从小到大年夜,他热衷于组装飞机模型,还吹奏木管乐器,比如竖笛,以及一种名为克鲁姆管的“古怪的文艺中兴时代乐器”——他曾参加一支文艺中兴舞曲乐队,吹奏这种乐器。
他表示,曾经有一位师长教师认为他数学太差,不合适在大年夜学里进修数学,于是他决定攻读工程学。
上世纪80年代,杨立昆就读于巴黎高等电子与电工技巧工程师学院。恰是在肄业时代,他读到一本商量“先天与后天”之争的著作——书中记录了说话学家诺姆・乔姆斯基与心理学家让・皮亚杰的辩论,此次浏览成了他的灵感迸发时刻。乔姆斯基主意人类生成具备说话才能,而皮亚杰则认为人类认知虽有先天框架,但绝大年夜部分才能都源于后天进修。
“说这话可能会冒罪人……”他表示,“但我读这本书的时刻,认为乔姆斯基所说的一切都弗成能是真的,我们所有的才能都是学来的。智能的核心在于进修。”
彼时,人工智能研究——也就是当时所称的“神经收集”技巧,一种大年夜致模仿大年夜脑工作机制的技巧——在早期测验测验受挫后,几乎成了一片无人问津的范畴,甚至被科学界视为禁忌。但杨立昆主动寻找其他研究神经收集的学者,并与当时任职于卡内基梅隆大年夜学的杰弗里・辛顿等人同病相怜,成为学术上的“知音”。
后来,他以博士后研究员的身份参加了辛顿地点的多伦多大年夜学。此后,两人与约书亚·本吉奥(Yoshua Bengio)合营为深度进修和现代人工智能奠定了基本,并是以在2018年获得了计算机科学范畴最负盛名的图灵奖。
杨立昆是多项重要早期人工智能技巧的核心开创者。上世纪80年代末至90年代,他任职于美国新泽西州的AT&T贝尔实验室 —— 这座实验室曾被誉为全球顶尖的企业研究机构。在此时代,他研发出卷积神经收集架构,这种技巧被广泛应用于图像辨认范畴。他还基于该架构搭建了一套体系,这套体系后来被各大年夜银行广泛用于支票读取。
这项研究的构思其实是他在多伦多大年夜学时萌生的,但多亏贝尔实验室雄厚得近乎无穷的资金支撑和前沿技巧贮备,才得以将其落地应用于实际世界。
杨立昆回想起他刚参加时,当时的老板拉里·杰克尔(Larry Jackel)对他说过的一句话:“他说,‘你知道吗?在贝尔实验室,省钱可不会让你出名。’”
贝尔实验室的光辉岁月注定走到了尽头。一场企业重组使得实验室的资金大年夜幅缩水,还被拆分给了不合的子公司。杨立昆重返学术界,在纽约大年夜学启动了一个专注于神经收集研究的新项目,课后常去格林尼治村的爵士俱乐部消遣。
到2013年,深度进修的可行性已显而易见——其图像辨认应用展示出了令人注目标成果。彼时谷歌刚启动“谷歌大年夜脑”项目,一年后便收购了英国人工智能实验室DeepMind。
杨立昆赞成加盟,但提出了三个前提:第一,不必辞去纽约大年夜学的教职;第二,无需迁居加州;第三,新实验室的研究成果必须对外公开。
在杨立昆眼中,脸书就像“一张白纸,任其挥洒”。“资金显然不成问题。”
扎克伯格赞成了,合作就此敲定。杨立昆正式参加全球顶尖科技企业之一的脸书,牵头成立了一家致力于基本研究的全新人工智能实验室,定名为脸书人工智能研究院(FAIR)。
2022岁首年代,在聊天机械人ChatGPT问世之前,各大年夜人工智能实验室其实都已研发出类似技巧,只是当时广泛将其视为实验性项目。最终,是一家范围不大年夜、名不见经传的人工智能实验室——OpenAI,悄然推出了一款易于应用的聊天机械人产品,由此引爆了如今的人工智能高潮。
ChatGPT的横空出世,让Meta内部乱了阵脚。公司引导层决定全力押注大年夜型说话模型Llama的研发。扎克伯格对公司架构进行重组,成立了生成式人工智能部分,专门负责加快相干技巧的产品化过程。杨立昆则保持,这款模型必须以开源情势宣布。
杨立昆泄漏,客岁Meta在人工智能计谋长进行了大年夜刀阔斧的调剂。扎克伯格向生成式人工智能部分施压,请求其加快技巧研发与落地速度,这一决定计划最终导致两边沟通彻底掉灵。
也恰是在这一年,马克・扎克伯格打来德律风。他有意在脸书(Facebook)组建人工智能部分,为了招揽杨立昆,特意邀请他到本身位于加州的家中赴宴。杨立昆回想道,当时有一位私家厨师掌勺,做了“鸡肉配口感醇厚的白葡萄酒”。
“我们团队其实有很多新鲜且极具价值的设法主意,本该被投入应用。但公司治理层却只执着于那些稳妥的、已被验证可行的筹划。”他说,“一旦陷入这种保守思维,只会逐渐落后于人。”
此后推出的几款Llama系列模型均以掉败了却。2025年4月宣布的Llama 4更是昏暗结束,公司还被指控操控测试基准,以此掩盖模型的机能表示。杨立昆坦承,当时团队确切“在数据成果上动了些四肢举动”——为了在不合的测试基准中取得更亮眼的成就,他们针对不合测试采取了不合的模型版本。
杨立昆表示,Llama 2的宣布堪称里程碑时刻,彻底改变了全部行业格局——它向所有效户开放了模型权重,任何人都可以免费下载、自由调剂。这款模型一跃成为高机能开源大年夜型说话模型的标杆,其所倡导的开源理念,与谷歌、开放人工智能研究中间履行的技巧垄断路线形成了光鲜比较。一时光,Meta公司被视为人工智能研究范畴的“良心企业”。
“马克对此勃然大年夜怒,根本上对所有介入该项目标人都掉去了信赖。最终,全部生成式人工智能部分被彻底边沿化。很多人已经离职,那些还没走的,也迟早会分开。”
客岁6月,Meta向数据标注始创企业Scale AI投资150亿美元,同时聘请该公司28岁的首席履行官兼结合开创人亚历山大年夜・王(Alexandr Wang)执掌帅印。亚历山大年夜・王接办了Meta在人工智能范畴的全新投资项目,以及旗下一家名为TBDLab的研究机构。该实验室的核心义务是研发新一代前沿人工智能模型。
此前,Meta曾因以1亿美元签约奖金为筹码,从竞争敌手处发掘顶尖研究人才而登上消息头条。“此举毕竟是否明智,留待时光考验。”杨立昆面无神情地说道。
对于这位受雇来引导该机构的亚历山大年夜・王,杨立昆直言其“年纪尚轻”且“经验不足”。
亚历山大年夜・王同时还成了杨立昆的直属上司。被问及面对这种层级关系的改变作何感触,起先,他对此漫不经心,表示本身素来习惯与年青人共事。“昔时脸书工程师的平均年纪只有27岁,我的年纪是他们的两倍。”
他最终与身为配药师的老婆Isabelle以及他们的三个儿子在新泽西州假寓下来,不过他大年夜约每五周就会去一次巴黎。他说,美国给他带来了“文化冲击”。
“亚历山大年夜(王)也没有对我比手划脚,”他回应道,“没人能敕令研究人员该做什么,尤其是像我如许的研究人员。”
谈及本身在Meta任职十余年后最终决定离职的原因,杨立昆直言不讳。他表示,持续留在公司已陷入难以调和的立场困境。尽管扎克伯格十分承认他活着界模型范畴的研究,但公司为推动超等智能项目新招募的一批人,“满脑筋都是大年夜说话模型”。
显然,这一状况让杨立昆深感格格不入。“我敢肯定,Meta内部有不少人,或许也包含亚历山大年夜,都巴不得我不要对外传播鼓吹:就实现超等智能而言,大年夜说话模型本质上是一条逝世胡同。”他说,“但我不会因为某些人认为我错了,就改变本身的不雅点。我本身并没有错。作为一名科学家,我的职业操守不许可我做出违心之举。”
“他学得很快,也清楚本身的短板地点……但他既没有科研工作的相干经验,也不懂研究该若何开展、若何推动,更不知道什么身分能吸引研究人员,什么身分会让他们反感。”
促使他离职的另一大年夜原因是,他活着界模型与自立智能体(AMI)范畴的研究成果,已展示出诸多潜在应用处景,例如航空发念头和重工业等,但这些范畴均非Meta的存眷重点。此外,杨立昆毫不辛苦便找到了愿意投资新一代人工智能技巧的投资方。
在职业生活的全新阶段,杨立昆认为,创办一种“新型实验室”——也就是兼顾基本研究的始创企业——是当下最具成长潜力的新赛道。他以OpenAI前首席技巧官米拉・穆拉蒂创办的思维机械公司(Thinking Machines,“但愿投资方清楚他们在做什么”),以及开放人工智能结合开创人兼首席科学家伊利亚・萨茨凯弗创建的安然超等智能公司(Safe Superintelligence,“这家我敢肯定,投资方完全搞不懂他们在做什么”)为例,称这两家企业就是很好的范本。
他提出的全新模型架构,借助视频数据赞助人工智能模型懂得实际世界的物理规律,从而使其能更精准地猜测后续可能产生的事宜。该模型还会依托“类情感机制”——即过往的经验与评估成果——来指导猜测过程。
“假如我掐你一下,你会认为疼。这件事会进而影响你对我的认知模型。比及下一次我抬手接近你时,你就会本能地退缩。这就是你的猜测机制在发挥感化,而触发这一反响的‘情感’,恰是恐怖或是对苦楚悲伤的躲避。”他解释道。
杨立昆表示,将来12个月内,人们就能看到这一技巧的“雏形版本”,而更大年夜范围的落地应用将在几年内实现。尽管这还远算不上真正的超等智能,但已为其铺就了可行路径。“或许我们今朝仍未察觉到某些潜在障碍,但至少将来可期。”
被问及欲望能留下如何的人生遗产,他不假思考地答道:为世界增加更多智能。“智能,才是我们这个世界最须要去赓续积聚的器械。”他弥补道,更多的智能意味着更少的人类魔难、更理性的决定计划,以及对世界和宇宙更深层次的认知。
“人类的魔难源于愚蠢。”

发表评论 取消回复