研究由蒙特利尔大年夜学传授Karim Jerbi领衔,团队成员包含深度进修前驱、蒙特利尔大年夜学传授Yoshua Bengio等人,他们对多款主流大年夜说话模型(包含ChatGPT、Claude、Gemini等)进行了体系评估,并与逾10万名人类受试者的数据进行了比较,是今朝范围最大年夜的人机创造力比较研究之一。论文揭橥于《Scientific Reports》,题为《人类与大年夜说话模型的发散性创造力》(Divergent creativity in humans and large language models)。
成果注解,在用于衡量“发散性说话创造力”的部分测试中,一些大年夜说话模型(包含GPT‑4在内)的平均得分已经跨越通俗人类。Jerbi指出,这一发明“也许令人惊奇甚至不安”,但同样重要的是:哪怕是最强的AI体系,其表示仍低于最具创造力的人类个别。
进一步分析显示,当研究人员只看创造力程度处于人类“上半区”的那一半介入者时,这一群体的平均表示已经优于所有测试的AI体系,而在创造力排名前10%的顶尖人群中,人类与AI之间的差距加倍明显。结合第一作者、蒙特利尔大年夜学博士后Antoine Bellemare‑Pépin以及康考迪亚大年夜学博士生François Lespinasse指出,这解释“最高程度的创造力仍然是人类独有的优势”。
为了公平比较人类与AI,团队应用了多种办法,个中核心对象是由合作者、加拿大年夜多伦多大年夜学研究者Jay Olson开辟的“发散联想义务”(Divergent Association Task,DAT)。这同心专心理测验请求介入者——无论是人类照样AI——在一次作答中给出10个在语义上彼此尽可能不合的词语,例如“银河、叉子、自由、藻类、口琴、量子、怀旧、天鹅绒、飓风”等,经由过程计算词语间的语义距离来衡量发散性思维才能。
先前研究注解,人类在DAT中的表示,与其他诸如创意写作、点子生成、创意问题解决等多种传统创造力测验的成果高度相干,是以可被视为更广泛创造性认知过程的一个快捷代理指标。DAT的另一个特点是操作简单、耗时短,平日只需两到四分钟即可完成,并已以在线情势向"大众,"开放。

论文结尾指出,与其预言创意职业的终结,不如将AI视作扩大想象力界线的“创意助手”。将来的创造力生态,可能不再是简单的人类对抗机械,而是人机协作的新范式:AI为人类供给灵感、变体与实验场,人类则在更高层次上把握审美、价值与意义。Jerbi认为,这类正面比较人类与机械才能的研究,正在迫使学界和"大众,"从新思虑“什么才算创造力”这一根本问题。
在完成基本词语测试后,研究团队进一步考察了这种“说话层面”的表示可否迁徙到更复杂的创作义务中。他们安排AI体系与人类介入者在多个写作场景下正面较劲,包含创作俳句(三行短诗)、撰写片子剧情概要以及创作短篇故事等,随后对作品德量进行评估。成果延续了此前模式:在一些义务中,AI的平均表示优于通俗人类,但在人类创作者中程度较高的一部分,尤其是最善于写作与故事构思的个别身上,人类优势依然明显。
研究还商量了一个关键问题:AI的“创造力”是否可控、可调节?谜底是肯定的。文章指出,一个重要技巧参数是模型的“温度”(temperature),该参数影响输出内容的可猜测性与多样性:温度较低时,AI生成的答复更保守、更可预期;温度较高时,输出加倍多变、跳脱,往往会带来更具风险但也更具新意的联想。
此外,提示词(prompt)的写法同样影响明显。研究发明,当指令鼓励模型从词源学角度推敲词语的来源和构造时,AI更轻易做出出人意表的联想,并在创造力评分上获得更高分数。这意味着,AI表示出的创造力在很大年夜程度上依附于人类的输入与引导,人机互动的设计正成为创意过程的核心环节之一。
在外界广泛担心AI会“代替”创意工作者的背景下,这项研究给出了相对谨慎的断定。Jerbi强调,尽管AI如今在某些标准化测验中达到甚至超出了人类平均创造力程度,但过分将人机关系懂得为“竞争”是误导性的。在他看来,生成式AI起首是一种极其强大年夜的创意对象,“它不会代替创作者,而会深刻改变创作者想象、摸索与创作的方法——当然,这取决于人们是否选择应用它”。

发表评论 取消回复