并且此次迭代,颇像是狼披上了羊皮——从模型后缀的数字序号看,这是Google最“小”的一次迭代,之前都是从Gemini 2.0到Gemini 2.5如许的迭代,此次从Gemini 3.0到Gemini 3.1Pro Preview。


然则这“.1”的迭代,进步得却不是一星半点。

03

GoogleCEO皮查伊(Sundar Pichai)表示,新代模型异常擅长处理“超等复杂的义务”。例如将复杂概念可视化、将数据综合成单一视图或者将创意项目变为实际。

01


姚顺宇也专门在X上发帖为Gemini 3.1 Pro Preview振臂,盛赞:

“Gemini不仅仅是一个好模型,更好的模型正在以弗成阻挡之势到来。”


既然此次新代模型的凸起才能在处理“超等复杂”的义务,那么通俗的对话放一边,Google的官方博文中,重点给出了几种示例秀肌肉。

这个功能前代也有,然则比较之下进步明显。

须要留意的是,大年夜约一周前,Google推出了“专用推理模式”Gemini 3 Deep Think,专为科学、研究、工程等复杂、开放式问题设计。

此外,在GPQA Diamond(科学常识测试)中,3.1 Pro得分94.3%;智能体类基准MCP Atlas上,得分69.2%;真实收集浏览与信息整合才能的基准BrowseComp上,得分85.9%。

Demini 3 Deep Think是姚顺宇从Anthropic跳槽到GoogleDeepMind之后介入的第一个项目。

而如今的Gemini 3.1 Pro Preview和Gemini 3 Deep Think有千丝万缕的关系,官方表示“直接构建在Gemini 3 Deep Think的经验和技巧之上”。相当于把Deep Think的核心推理晋升技巧“下放”到更广泛可用的Pro模型中。

Gemini 3.1 Pro Preview能做什么

第一,经由过程简单的提示词,创建SVG动画。

比如提示词“生成一个SVG,描述一只变色龙静静地坐在树枝上。让变色龙的眼睛跟随用户的鼠标光标在屏幕上移动。”

Gemini 3 Pro生成的动画背景是单一的白色,变色龙也看起来很逝世板,甚至一侧有两只眼睛。

Gemini 3.1 Pro生成的动画则有丰富的“深绿色丛林”背景,变色龙身材有黄色斑纹和圆点装潢,眼睛立体,腿部姿势天然曲折。


再比如提示词“生成一个滑动切换开关的SVG,当鼠标悬停在太阳图标上时,将其变成发光的月亮,同时背景从通亮腻滑渐变到阴郁。采取干净的扁平UI风格。”

Gemini 3 Pro给出的动画固然完成了义务,图标可以随鼠标变更,然则主图标单一,是一个缺角的圆形图案,用黄色代表日间,白色代表夜间。

Gemini 3.1 Pro生成的动画要复杂得多,日间是黄日白云,夜间是新月繁星,两套图标丝滑变换。


总而言之,Gemini 3 Pro做的动画,让人想起多年前那个“学了三年动画”的梗。


而Gemini 3.1 Pro交付的SVG动画,已经达到了可以直接应用的后果。

第二,构建工程级别体系。

Gemini 3.1 Pro已经可以根据一段高复杂度的天然说话指令,直接生成一个集3D衬着、及时太阳星历计算、API异步拉取和物理光效于一体的完全交互体系,而不是简单页面demo。

Google给出的示例中,用户给出文字指令,Gemini 3.1 Pro生成了构建一个高保真、可交互的3D国际空间站(ISS)轨道追踪器。应用高分辨率的Blue Marble纹理贴图衬着一个精细的3D地球模型。


第三,生成交互式创意体系。

当被请求为艾米莉·勃朗特(Emily Brontë)的《呼啸山庄》(Wuthering Heights)打造一个现代小我作品集网站时,该模型并未简单地总结文本内容,而是基于小说的氛围与情感进行推理,设计出一个简洁、现代感实足的界面,创建出一个捕获主人公精力内核的网站。

在另一个示例中,Google展示了Gemini 3.1 Pro编写的一个复杂的3D椋鸟群舞(murmuration)模仿。


对于研究人员和设计师而言,这供给了一种强有力的方法来原型化感官丰富的界面。

第四,将文学主题转化为可运行的代码。

这个示例可能是通俗人也最轻易get到厉害之处的一个。


抽象推理,这种才能的含金量不消多说。

02

不要忘了,Google此次宣布的只是“预览(Preview)”,Google很快就会推出正式版。而“.1”的迭代,Google也是在暗示其只是小秀肌肉。

到底有多强?

新代模型免不了过一下刷榜这一步。

而“.1”的进级,获得了动辄倍数跃升的成就。

根据Google官方博文放出的测试成果,

在ARC-AGI-2基准测试中,3.1 Pro的验证得分达到了77.1%。比3 Pro的推理机能晋升了一倍以上。

这也相符3.1 Pro的示例,因为这个测试评估的是模型解决全新逻辑模式的才能。用人话说就是,抽象推懂得谜的才能。

这个价格,整体上和Gemini本身的上一代3 Pro一致,但如果和 Anthropic Opus 系列比起来,照样相对便宜的。 Opus这类模型输入/输出单价能在$5/$25阁下。


这些成就,均跨越了Anthropic的Sonnet 4.6、Opus 4.6,以及OpenAI的GPT-5.2与GPT-5.3-Codex。

GoogleGemini 3.1 Pro此次在ARC抽象推理和BrowseComp搜刮义务上明显拉开差距,显示出明显的Agent偏向,而非纯真常识模型。

此外,专门做大年夜模型基准测试与比较分析的第三方评测机构也宣布了相干测试成果,大年夜赞Gemini 3.1 Pro在构成Artificial Analysis Intelligence Index的10项评测中领先6项,相较于Gemini 3 Pro Preview在多项才能上明显晋升,尤其是在推理与常识、代码才能以及降低幻觉方面进步最大年夜。


并且,Gemini 3.1 Pro Preview保持较高的token效力。

运行完全Artificial Analysis Intelligence Index约需5700万token(比Gemini 3 Pro Preview多100万)。

这一token应用量低于其他在最大年夜推理模式下运行的前沿模型,如Opus 4.6(max)和GPT-5.2(xhigh)。

结合更低的单token订价,Gemini 3.1 Pro Preview在前沿模型中具有成本优势,运行完全Intelligence Index的成本不到Opus 4.6(max)的一半,不过仍约为领先开源模型GLM-5的两倍。

社区里满溢的手搓demo的热忱,也证清楚明了它的才能与实用性。

才能翻倍价格不变

Google官方API订价显示,Gemini 3 Pro/3.1 Pro Preview的收费构造是按token计费的:

小于200k tokens时,每百万token输入约2美元,输出价格为4美元。大年夜于200k tokens时,每百万token输入4美元,输出18美元。

在高低文缓存方面,根据提示词范围,每百万 token 收取 0.20 至 0.40 美元,外加每小时每百万 token 4.50 美元的存储费。

尤其是结合当下它在模型才能上相当凸起,这个价格更显得极具竞争力。

今朝,开辟者可以在AI Studio、Gemini API、Gemini CLI、智能体开辟平台Google Antigravity以及Android Studio应用3.1 Pro;企业用户则可以在Vertex AI和Gemini Enterprise应用;通俗用户在Gemini应用和NotebookLM都能用上,不过后者仅限Pro和Ultra订阅用户。

各个社区里已经有不少人迫在眉睫上手操作,真的就和Google的演示一样,手搓了不少惊艳的玩意。

有人用Gemini 3.1 Pro 生成了一个可交互的 3D 机械级汽车悬架体系模仿器,包含真实几何构造、连杆束缚与及时转向和行程计算,相当于把机械工程建模、物理逻辑和3D可视化一次性写成可运行对象,接近工程级原型才能。

它不仅生成视觉代码,还构建了一个沉浸式体验,用户可以经由过程手部追踪操控鸟群,并聆听根据鸟群活动变更的生成式配乐。


有人用3.1 Pro制造“捉鬼猎人走过一栋闹鬼的房子”的轮回动画,惊呼“Gemini没有开打趣”。


总之,Google这回是真憋了个大年夜招。

小小一个“.1”,却把推理和代码才能拉得飞起,订价还这么稳。

AI圈越来越实际了。模型再强,毕竟得看账单值不值。企业开端精打细算每个token的回报,开辟者也得掂量掂量性价比。Google这一步,不仅是抢回王座,更是把竞争推向“谁更会过日子”的新阶段。

且看接下来,捏着拳头的Anthropic和OpenAI,以及xAI、Meta、微软等一众竞争敌手该若何应对吧。

点赞(0) 打赏

评论列表 共有 0 条评论

暂无评论

微信小程序

微信扫一扫体验

立即
投稿

微信公众账号

微信扫一扫加关注

发表
评论
返回
顶部