众力资讯网

谷歌突发Gemini 3.1 Pro!首次采用「.1」版本号,推理性能×2

相较于去年11月才刚刚发布的3Pro,别看只是「.1」的一小步,升级幅度肉眼可见:

在官方给出的SVG对比展示中,3.1Pro在多模态生成和语义理解上都提升了一个level。

不仅如此,3.1Pro还能将日常数据转为互动可视化内容,一个航空航天仪表盘也能轻松roll出:

玩起「模拟城市」来,也是地形生成、道路铺设、交通线路,一整套直接成型:

夯,是真夯,这不有网友们手搓体验完真·就只想说一句——其他家模型可以直接over了(doge)

闲话少叙,技术报告、模型卡更多细节,我们直接开扒——

.1一小步,推理能力一大步

此次升级,官方的说法是把上周发布的Gemini3DeepThink背后的核心智能给公开了:

在Gemini3的基础上,3.1Pro在核心推理能力上更进一步。

在ARC-AGI-2基准测试中,3.1Pro获得了77.1%的验证分数,在推理表现上达到3Pro的2倍之多:

此外,3.1Pro支持1M上下文,知识截止日期为2025年1月,在多模态理解能力、vibecoding、多语言性能和长上下文方面都同步增强。

在Arena的对比评测结果中,3.1Pro的整体排名分数也比3Pro高出13分,文本与代码维度的表现进步也相当明显:

在官方给出的多模态效果中,在同一句提示词下,3.1Pro在动作连贯性和色彩输出上较3.0Pro有明显提升:

在推理能力上,3.1Pro相比上一代能应对结构更复杂、步骤更多的提示词需求。

比如下面这个案例:3.1Pro直接生成了一个3D版“椋鸟群飞”,视觉代码一次到位,还顺手做出了可交互玩法。

用户可以直接通过手势追踪操控鸟群,而且画面还能够根据鸟群运动变化而生成的音乐~

整体上来看,在复杂主题的可视化方面,Gemini3.1Pro确有明显的进化。

网友们也在第一时间对官方宣传进行了检验。

比如用3.1Pro直接生成一个《我的世界》:

再瞧这位网友,用3.1Pro搓出来了个人网站(别说,感觉比Gemini官网效果还好?):

还有网友脑洞大开,让3.1Pro开发了一款教育应用,直言模型在模拟光线效果上那叫一个逼真!

一圈体验下来,大家纷纷表示:

目前,Gemini3.1Pro已经在Gemini应用和API中上线,GoogleAIPro和Ultra用户还可以在NotebookLM中使用这一最新模型。

智能成本还在呈数量级下降

有意思的一点是,此次发布Gemini3.1Pro,是谷歌首次采用「.1」这样的小版本号。

具有网友表示:不儿,Gemini3Pro不是还在Preview吗,这就出新模型啦?

不得不说,大模型的2026,注定还是要卷到飞起。

另外值得注意的是,谷歌这一小步,还又把大模型向帕累托前沿推了推。

帕累托前沿(ParetoFront),可以简单理解为最小化成本,最大化性能。

定价方面,Gemini3.1ProPreview的输入价格为2美元(<200ktokens)/4美元(>200ktokens),输出价格为4美元(<200ktokens)/18美元(>200ktokens),跟Gemini3ProPreview持平。

从ARC-AGI基准的视角来看,则是每完成一次ARC-AGI-2任务花费0.96美元(约合人民币6.63元)——

相较之下,Gemini3DeepThink价格是3.1Pro的10倍,而两者性能相差仅几个百分点。

有网友认为,这样的推进速度,「完全打破了传统的成本-智能曲线」。

相比于基准榜单上测试成绩的变化,对于高速进化中的大模型应用而言,成本方面的持续压缩更加值得关注。

并且2026,这才刚刚开始呢。

参考链接:

[1]https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-1-pro/

[2]https://deepmind.google/models/gemini/pro/