众力资讯网

通用人工智能真的提前落地了,这次突破口就在编程领域! 最近Claude新模型直

通用人工智能真的提前落地了,这次突破口就在编程领域!

最近Claude新模型直接刷新了整个行业的评测纪录,它和以往AI的差距,真的就是学霸和学神的次元壁差距,普通AI考满分,是拼尽全力追上了考题标准;而这款新AI考满分,单纯只是因为人类的测试标准,上限就这么高。

很多人可能不知道,专业评测机构MTR最近遇到了有史以来最尴尬的情况:测不动这款AI了。

以往测评AI,都是考验模型会不会做题,数学、代码、阅读理解,一套流程下来就能评定水平,但这次完全反过来了,不是AI出错、能力不达标,而是人类设计的题库、测试场景,已经完全跟不上AI的真实实力,就好比温度计量程太小,被高温直接顶爆。

现在行业测评的标准已经彻底革新,不再局限于简单答题,而是模拟真实职场,考验AI能不能像全职员工一样,长时间连续工作,独立搞定一整套复杂任务。

最直观的就是程序员的工作场景,测评会把程序员耗时几小时的开发任务交给AI,看它能不能自主读代码、梳理项目架构、设计开发方案,还能自己排查BUG、修复漏洞,全程不用任何人插手,行业把这项能力叫做任务时间跨度,说白了,就是AI能独立“上班干活”的时长。

回看AI的进化史,进步速度真的吓人,几年前的AI,只能做秒级的简单工作,最多写一行代码;后来升级后,能独立写简单函数,支撑几分钟的工作;再之后,已经可以完成小时级的小型程序开发。

而最新的Claude模型,直接做到了连续16小时独立作业!更关键的是,目前全球最难的AI测评题目,最高时长上限就是16小时。

这也就意味着,不是AI只能干16小时,是人类目前根本造不出更难、耗时更长的测试题来考验它,这绝对是AGI发展的标志性转折点。

这场AI革命,最核心的变化,是实现了认知劳动自动化。

互联网时代,自动化解决的是信息传播问题;而AI新时代,直接把人类的脑力劳动、认知工作实现了自动化,首当其冲被影响的就是程序员和网络安全两大行业。

以前的AI只是程序员的辅助工具,帮忙提速、简化工作,但按照现在的迭代速度,AI独立开发能力越来越强,纯人工写代码的工作模式,很快会被逐步替代,普通程序员的岗位价值会大幅缩水。

网络安全行业的变化更是颠覆式的。过去AI只能辅助人工找漏洞,现在的AI已经能复刻顶级黑客的思维,把各种细碎的小漏洞串联起来,搭建出完整的攻击链。

以往专业安全团队要花几周时间完成的渗透测试,现在AI几十分钟、最多几小时就能搞定,效率提升几十倍,这也是现在所有科技企业都在卷“AI对抗AI”技术的根本原因,网络安全的行业攻防规则已经彻底改写。

不过大家也别被各种夸张报道带偏,不用神化当下的AI。

现在很多媒体吹捧AI是“外星技术”,其实水分很大,现阶段的AI依旧有明显短板,会产生内容幻觉、逻辑跑偏,根本无法真正理解现实世界,距离真正的人类通用智能,还有很远的路要走。

真正值得我们关注的核心变化,是AI的身份彻底变了。

老式AI只是被动的问答工具,你问它才会答;而新一代AI,是实打实的数字员工,可以自主规划任务、独立执行、闭环收尾,全程自主完成复杂工作。

更恐怖的是未来的可能性:一旦AI可以自主研发、迭代更强的AI,科技进步就不再是普通指数增长,而是指数的指数增长。

这次人类题库被AI轻松打爆,看似只是一次评测突破,实则预示着通用人工智能提前到来,整个科技行业的变革浪潮,已经正式开启。