作为一名创投背景的学术带头人,朱晓蕊刚刚迎来她的47岁人生。
从学术成就看,1977年出生的朱晓蕊,先后在1998年和2000年取得哈尔滨工业大学学士和硕士学位,2006年,她在美国犹他大学获得博士学位,具有机电一体化和机械工程多重背景;学成归来后,朱晓蕊进入哈尔滨工业大学(深圳)任教,2011年被破格评为博士生导师,2014年被评为正教授。
在她担任哈工大教授的14年中,作为项目负责人主持了不少国家级项目,总经费超过千万,并多次参与组织了机器人领域的全球顶级学术会议,曾被IEEE评价为“机器人领域的杰出女性”。
从创投成就看,她是“全球无人机霸主”大疆前首席科学家、“港股激光雷达第一股”速腾聚创首席科学家、机器人公司大道智创的联合创始人和投资人、自主驾驶导航技术研发商一清创新的创始股东。一拿资金二拿技术,走出了一条“导师+学生”的独角兽孵化之路。
但业内少有人知的是,朱晓蕊还是中国科技媒体雷峰网创始人林军的另一半。两人于2011年在深圳成立雷峰网,五年后联合高文院士、徐扬生院士等人共同发起国内第一个具有全球视野的大型AI论坛——全球人工智能与机器人大会(GAIR)。
作为历届大会的组委会主席或程序主席,朱晓蕊所积攒的人脉图谱被再次释放。她曾定下嘉宾邀请的三条准则:
一是国内在某个研究方向上的知名院士、
二是海外包括华人在内的某一领域的领军人士、
三是在以科技创新为特色,有很强学术背景的大公司任职的知名科学家。
她表示,“以前,学术界、工业界、投资界各自为营,大部分人觉得这三个领域是完全分开的。但在我们的会上,这三界的融合一定要成为大会一个新看点。”
科技圈内用一句话总结朱晓蕊:不会创业的教授不是好的投资人,技术出身的她善于联手一众学术界、产业界、投资界人士,投身中国硬科技产业化的历史进程。
新加坡GAIR研究院院长朱晓蕊博士
2023年,除了教授、投资人、联合创始人之外,朱晓蕊有了第四个身份–学术期刊创刊主编–《人工智能与机器人研究国际期刊》(IJAIRR)。
IJAIRR是全球第一本聚焦在人工智能(AI)、机器人(R)以及基础科学研究领域(R)的跨学科国际学术期刊。延续以往思路,这本期刊将重点关注来自产学研各界的研究进展,并且入选该期刊的优秀作者,将会受邀在GAIR大会上作主题演讲。
但不同于其他期刊,“鼓励互动”是IJAIRR最大的特点,即以“去中心化科学”为核心理念,采用激励方式提倡科学家公开分享和讨论他们的研究。
期刊主页链接:https://gairdao.com/journals/ijairr(点击文末阅读原文即可进入)
近日,经科学论证、严格评审、扎实筹备,首期五篇论文已上线。借此契机,雷峰网对话朱晓蕊教授,深入探讨了她的人生经历、创刊历程,以及简要介绍首期收录论文。
揭秘创刊心路
Q:朱老师,首先请您讲一讲,作为一名有产学研投背景,参与组织过多届大型科技峰会的女性科学家,为何在现在这个时间点决定创办一本学术期刊?
朱晓蕊:我在2021年就有创立一本“人工智能+机器人+基础科学”聚焦交叉学科的国际期刊的想法,并在2022年下半年开始筹备。当时我先联系了新加坡世界科技出版集团的董事会主席潘国驹教授。
这个出版社是他一手创立,如今已经成为亚洲最大的科学出版社之一。这是我们首次正式合作,但我很早就对他们的学术出版和期刊有所了解,潘国驹教授非常认可和支持我,便向我推荐了他们出版社的总经理李志伟博士。
紧接着我开始选择联合主编人选,联系长期从事人工智能、机器人或基础科学等跨学科研究的学者。
我与孙宇教授认识多年,他在机器人抓取研究领域表现出色,过去几年曾来GAIR大会做过演讲,效果很好,还担任过大会的session chair,因此是联合主编的理想人选之一。但我希望在期刊的研究方向上拥有多样化的团队。
人工智能与医学结合是一个有趣的领域,并通过朋友的介绍联系到了在这个领域造诣颇深的许东教授。在讨论后,许东教授认为该期刊在定位上独特,没有其他类似的刊物,便很爽快地答应了作为联合主编的邀请。而且在后续过程中他非常有热情,我们一起讨论了期刊的运作模式。
人工智能与机器人研究国际期刊(IJAIRR)成立仪式,李志伟、孙宇、朱晓蕊、许东
更为关键的是,许东和孙宇两位教授在过去的职业生涯中,曾经担任过许多顶级期刊的编辑,他们对期刊的运作有丰富的经验,知道如何管理和运营一个期刊。这是我们能顺利做同一件事的重要原因。
Q:能介绍下《人工智能与机器人研究国际期刊》(IJAIRR)吗,包括这本期刊的定位和面向对象?
朱晓蕊:这本期刊虽然在新加坡创立,而且合作出版社的董事会主席潘国驹是华侨领袖,联合主编们也是华人背景,但我们的期刊并不是专门面向华人。
可以理解为,这是一个由华人科学家组织的,面向人工智能、机器人及基础科学研究的交叉领域的期刊,但我们的目标是成为一个全球性的平台,吸引来自不同国家和地区的科学家参与投稿和阅读。
为了具有全球影响力,期刊的编委成员应该具有多样性,覆盖不同的地域和国家,以反映全球范围内的科学研究。而且期刊在新加坡成立也会放大这种国际优势。新加坡作为一个连接亚洲、欧洲和北美的重要门户,具有独特的地理位置优势。
我希望通过在新加坡设立期刊,吸引更多的国际科学家和读者参与进来,展现多种文化和研究背景的视角。未来IJAIRR期刊与GAIR大会是相辅相成的关系,优秀的期刊作者会邀请到大会做演讲和宣传,也有助于促进全球范围内的学术交流和合作。
Q:这个期刊和雷峰网(公众号:雷峰网)GAIR大会有何联系?从雷峰网2011年成立,到2016年创办GAIR大会,一直到2023年成立GAIR研究院,创办期刊,背后是怎样的演变发展逻辑?
朱晓蕊:雷峰网最初以智能手机及其生态为重点,随着时间的推移,其关注领域逐渐扩展到更广泛的深科技领域。
2016年,雷峰网创办了GAIR全球人工智能与机器人大会,目的是促进学术界、产业界、投资界以及地方政府的交流与合作,推动产学研的深度融合。因为过去它们之间存在明显的隔阂和边界。
学术界往往专注于自己的学术研究,工业界则关注产品研发和升级,而地方政府则关注宏观政策和产业规划。这种隔阂和边界的存在,导致三方之间的交流和碰撞机会很少。
比如学术界的人所做的研究原来只需要得到同行的认可,边界就到这了。但是你把这些东西拿给工业界的人看,给政府做宏观政策的人看,他们是什么想法、他们认不认可这个东西、或者是从他们的角度对你有些什么样的建议。
工业界的人也是一样的。尤其是在中国工业界,以前大家自主研发的东西并不太多,后面慢慢地随着整个产业去做升级,工业界的人发现原来那种粗放的方式已经不能奏效了,必须要有自主研发,因此会第一时间想到要跟学术界形成对接。
为了把整个产业升级的生态链条搭建起来,雷峰网在2016年举办了GAIR大会,旨在搭建一个学术界、产业界、投资界和政府之间的交流平台。可以说这是一个各界双向奔赴的过程。2023年GAIR研究院的成立,是在GAIR大会基础上进一步深化这种跨界合作,通过各种方式将会议内容的精华部分沉淀下来。
会议结束后,讨论和交流的内容往往很难被保存和延续。因此,我们决定创建一个在线的社区和一本高质量期刊,以便更好地将会议中的讨论和交流内容进行整理和保存。这样可以促进学术交流和合作,并使更多的学者能够分享他们的研究成果。
Q:为什么这件事是你来做?在您自己此前求学和博导经历中,您和产业界、投资界的互动就比较多了,而且还鼓励学生去创办公司,所以从你个人来说,什么触动了你去做“桥梁”的工作?
朱晓蕊:我是2006年底博士毕业从美国回来的,2007年正式开始在哈工大深圳研究生院做老师,正好是深圳市产业转型的关键时期。当时,深圳市主要是以低端制造业为主,而政府希望将其转向高端产业。
深圳市政府希望通过建设大学城来吸引优秀的高校和学生,以推动产业升级,所以最早才有了哈工大、北大、清华三个学校的深圳研究生院(没有本科)。
我当时也是因为这个事情,在深圳开始了我做老师的生涯。2002年哈工大与深圳共建成立研究生院,由于成立初期全职老师的数量相对较少,实验室的研究方向有限,而每位研究生必须从头到尾完成一项研究课题才能达到毕业要求。
尽管深圳市有产业升级的需求,但当时拥有研发的企业并不多,于是我开始考虑如何让学生参与到更有意义的项目中,而不是仅仅去企业里做一些重复性的低端技术工作。
因此,我那时候鼓励学生在完成基础课程学业后创办公司,将前沿课题转化为创业项目。通过这种方式,学生可以在创业过程中完成毕业论文,又能为产业升级做出贡献。
这个过程中,我加深了对工业界的了解,也促使我梳理出一种学术研究与产业实践结合的模式。过去我们在学校实验室里做了很多东西,但往往被浪费掉了,很多研究成果被搁置,没有进一步地转化为应用。
尤其是我们偏工程的一些学科,做出来的很多研究成果差不多就是 3 到 5 年的生命周期。也就是说,如果这3 到 5 年之内,你这个成果没有去更进一步地转化成应用,很大可能就会过时了。
所以当时大概5年左右我会换一个新的课题方向。因此学校的教授们可以引领研究方向,去找产业界里的漏洞、短板、长期需要升级的地方,然后把后续的产业转化机会交给有兴趣有能力的学生,这在某种程度上也是一种传承。
总的来说,我认为与产业界的紧密合作和鼓励学生创业是将研究成果转化为实际应用的重要途径,同时需要不断地更新研究方向,保持研究的时效性和价值。
Q:为什么要创办一本囊括了AI、机器人和基础科学的交叉研究的期刊,这与您自身的研究方向有关吗?朱晓蕊:我本科就读于哈尔滨工业大学(哈工大),在大三时选择进入了学校新成立的“机电一体化系”,属于最早成立的一个交叉学科的系,哈工大机器人研究所当时就隶属于这个系。这个研究所是学校的重要研究机构之一,机器人研究所的成立标志着学校对机器人技术这一前沿领域的重视,现在基本上算是机器人领域的“黄埔军校”了,许多从事机器人研究的学者和专家都与该研究所有关联。
我当时是考研第一名顺利进入了机器人研究所读硕士,在那里对机器人研究领域产生了浓厚的兴趣,并在博士阶段去了美国犹他大学做进一步深入研究。
随着机器人技术的发展,我意识到机器人不仅仅需要关注身体部分(机器人的物理结构),还需要关注大脑部分(即智能决策和感知能力),即人工智能。因此,我在博士后半程开始偏重于机器人+AI方向的研究。等到我自己开始独立做研究的时候,基本上都是在往机器人与 AI 这个交叉方向去做。
我当时以做“感知定位技术“开始,感知技术是机器人+AI方向的一个重要分支,涉及理解周围环境,包括视觉、听觉、触觉等。我认为,将机器人与人工智能相结合是一个具有挑战性和前景的领域,希望通过自己的努力,为这个领域做出更多的贡献,我们现在创办的这本期刊重点关注之一便是机器人学与人工智能领域的紧密结合。
这本期刊关注的另外一个重点是AI或机器人和基础科学的交叉研究,这块是我自己很感兴趣但是时间精力所限没有机会开展的跨学科研究方向,也是引领未来的研究方向。
我相信人工智能与机器人技术将成为未来人类社会的基础设施。
一方面,更多的基础科学研究会在人工智能与机器人的赋能下取得范式转移层面的理论突破和应用进展。另外一方面,人工智能与机器人研究的进展也将受益于与不同基础科学的合作,包括数学、物理、生物学、心理学、语言学等。这种相互影响、相互成就才是跨学科研究的魅力所在。
Q:首期上线的五篇论文,能介绍它们各自的特点和研究领域,以及你们的筛选评审过程吗?
朱晓蕊:首期论文非常重要,希望为后面投稿的作者们提供有益的启示和借鉴。所以最终入选的论文来自不同国家和地区,包括美国、新加坡和中国,展现了期刊的国际性。同时,这些论文也代表了AI、机器人、基础科学领域的跨学科研究成果,符合期刊的定位要求。
我分别来简单介绍一下IJAIRR首期发表的五篇文章:
Bud Mishra教授的论文《AI, Thinking Machines and A Vast Active Living Intelligent System》
Bud教授来自美国纽约大学,是该校Courant数学研究所,Tandon工程学院和医学院的教授,以及西奈山医学院和冷泉港实验室的客座教授,同时也是我们期刊的编委会荣誉顾问。
他长期从事生物信息学研究,所以他从生物学的一些概念类比过来,探讨了生物学启发的AI研究,提出了一种超前的观点性文章。我称之为"Biology-inspired AI",即,该文章创新性地从生物学的维度思考和畅想人工智能的未来,利用信息不对称性博弈论的工具去分析和讨论未来人工智能时代人和智能机器共生的可能性。
论文全文链接:
https://gairdao.com/doi/10.1142/S2972335323020015
田英利教授团队的文章《Multi-Modal Multi-Channel American Sign Language Recognition》
田教授来自美国纽约城市大学,2000年前后曾在卡内基梅隆大学机器人研究所进行博士后研究工作,师从当今计算机视觉和机器人领域巨擘金出武雄(Takeo Kanade)教授,曾在 IBM T. J. Watson 研究中心领导视频分析团队,是工业界走向学术界的重要女性代表。
她的这一论文涉及研究AI在语言学领域的应用(AI for Linguistics),提出了一个基于机器学习的多流框架,用于从RGB-D视频中实时识别美国手语(ASL)手动手势和非手动手势(面部和头部运动)。具体方法是基于3D卷积神经网络(3DCNN),通过融合来自多个通道(RGB、深度、运动和骨骼关节)的多模态特征,包括手势、面部表情和身体姿势。
论文全文链接:
https://gairdao.com/doi/10.1142/S2972335324500017
Ling Feng教授团队的《Asymptotic edge of chaos as guiding principle for neural network training》
Ling Feng教授来自新加坡高性能计算研究所,利用数学方法研究AI,试图解决AI的“黑箱”问题,即AI决策过程的可解释性和理论指导。
论文全文链接:
https://gairdao.com/doi/10.1142/S2972335323500011
周伯文教授团队的文章《Generative AI for Complex Scenarios: Language Models are Sequence Processors》
周伯文教授拥有丰富的前沿研究经历与业界经验,曾任IBM Research人工智能基础研究院院长、IBM Watson Group首席科学家、IBM杰出工程师、京东集团高级副总裁、集团技术委员会主席、云与AI总裁,2022年从产业界回到学术圈。
本篇论文中,他从宏观框架层面讨论人工智能应用从解决狭义问题到导航复杂的现实场景的范式转变。因为如今以GPT-4为代表的大型语言模型(LLMs),已经超越了语言处理的传统界限,在理解和生成精妙文本方面表现出了非凡的能力。这篇涉及AI 和机器人的交叉研究,也是一篇观点类论文。
论文全文链接:
https://gairdao.com/doi/10.1142/S2972335324010014
孙宇教授团队的文章《Consolidating Trees of Robotic Plans Generated Using Large Language Models to Improve Reliability》
孙宇教授来自美国南佛罗里达大学计算机科学与工程系,主要研究领域为机器人、智能系统、医疗健康应用。他的这篇论文也是AI 和机器人的交叉研究,但不同于周伯文教授,他讨论了如何将AI中的大型语言模型应用于机器人的任务规划,这是一个具体的场景应用研究。
论文全文链接:
https://gairdao.com/doi/10.1142/S2972335324500029
总之,首期发表的五篇文章涵盖了AI与生物学、语言学、数学以及机器人学的交叉研究,不仅关注AI的具体应用场景,还探讨了AI的理论基础和可解释性,以及研究范式探讨。而且同行评审是学术期刊中非常重要的一环,可以确保论文的质量和学术价值。
在我们的编委会成员中,已经有Prof Bud Mishra 、Prof. Dr.-Ing. Tamim Asfour 、Prof I-Ming Chen 、ProfessorZhidong Wang等5位编委会荣誉顾问,以及15位来自全球各地的编辑,他们会根据文章的研究领域和内容,再选择合适的同行评审者。以确保评审过程的公正性和准确性。
具体可看:
https://www.worldscientific.com/page/ijairr/editorial-board
Q:在这本期刊的运营方式上,您提到了“去中心化科学”“Web3技术支持”两个词,这对期刊发展有何影响?
朱晓蕊:这是针对学术界长期存在的“学术中心化”而提出的一种解决方法,旨在打破学术思想的不流动性桎梏,促进学术交流和创新。我们会利用Web 3技术提供的工具来支持未来在线学术社区的运作。
因为Web 3技术的核心特点是去中心化,这意味着数据和信息的控制权不再集中在单一的实体手中,而是分散在网络的各个节点。这种模式有助于促进开放和透明的学术交流。
一个好的学术社区平台是能够促进科学生产资料的流通,包括论文、数据库、实验视频、算法原始代码等。(平台为 gairdao.com ,目前还在建设中,将在2024年3月开放测试)帮助学者们将他们的研究成果推广到更广泛的受众,而不仅仅是发表在期刊上后就被淹没。这样的平台可以鼓励更多的学术交流和反馈,让学者们能够看到他们的工作被实际应用和复现,从而获得同行的认可和进一步的改进建议。
就像社交媒体上的互动一样,学者们可以在平台上分享他们的进展,得到同行的点赞和评论。这种互动不仅能够提升研究的可见度,还能够促进学术界的民主化,让研究者们能够直接从同行那里获得反馈,而不是仅仅依赖于有限的同行评审过程。更重要的是,对于公开分享他们研究并参与社区建设的人,我们会提供相应的经济回报,形成一个良性循环。
这里就会用到Web3工具中的经济功能。未来社区将会有不同级别的活动,以激励学者们在不同层面上参与平台上的交流和合作。总的来说,我设想的去中心化学术社区平台,将有助于促进知识的开放共享,提高研究的透明度和可复现性,同时也为学者们提供了一个更加活跃和互动的学术交流环境。
我们从过去的GAIR大会到现在的期刊和在线社区,都是为了形成一个完整的学术交流平台,服务于在该领域的所有人。
Q:最后,请您说说后续期刊的上线进程,以及对期刊的寄语。
朱晓蕊:我们计划在每三个月左右发布一期,每年发布四期,也就是每年的3月、6月、9月、12月。除了学术界,期刊还鼓励企业界学者和专家投稿,尤其是那些在企业内部研究院从事AIR研究的学者。
由于AIR领域发展迅速,许多企业都在进行相关研究以保持竞争力。通过期刊这个平台,企业界和学术界可以更好地交流和合作,共同推动AIR领域的发展和创新。
最后,我想说,《人工智能与机器人研究国际期刊》(IJAIRR)是人工智能与机器人(AIR)领域,第一本专注于人工智能、机器人技术和基础科学相结合的跨学科研究的科学期刊。
欢迎投递IJAIRR期刊,我们真诚地希望你能从阅读文章中得到启发,同时,我们也欢迎更多前沿科研人员加入编委团队 ijairr@wspc.com 希望这本期刊尽力做到最好!
首期论文已上线
论文一
题目:《Multi-Modal Multi-Channel American Sign Language Recognition》
作者:Elahe Vahdani、Longlong Jing、Matt Huenerfauth、Yingli Tian(田英利)
摘要:In this paper, we propose a machine learning-based multi-stream framework to recognize American Sign Language (ASL) manual signs and non-manual gestures (face and head movements) in real-time from RGB-D videos. Our approach is based src=”https://static.leiphone.com/uploads/new/category/pic/202103/604edcf3ccee8.jpg?imageMogr2/thumbnail/!740x140r/gravity/Center/crop/740×140/quality/90″>