通用人工智能真的提前落地了，这次突破口就在编程领域！最近Claude新模型直

通用人工智能真的提前落地了，这次突破口就在编程领域！

最近Claude新模型直接刷新了整个行业的评测纪录，它和以往AI的差距，真的就是学霸和学神的次元壁差距，普通AI考满分，是拼尽全力追上了考题标准；而这款新AI考满分，单纯只是因为人类的测试标准，上限就这么高。

很多人可能不知道，专业评测机构MTR最近遇到了有史以来最尴尬的情况：测不动这款AI了。

以往测评AI，都是考验模型会不会做题，数学、代码、阅读理解，一套流程下来就能评定水平，但这次完全反过来了，不是AI出错、能力不达标，而是人类设计的题库、测试场景，已经完全跟不上AI的真实实力，就好比温度计量程太小，被高温直接顶爆。

现在行业测评的标准已经彻底革新，不再局限于简单答题，而是模拟真实职场，考验AI能不能像全职员工一样，长时间连续工作，独立搞定一整套复杂任务。

最直观的就是程序员的工作场景，测评会把程序员耗时几小时的开发任务交给AI，看它能不能自主读代码、梳理项目架构、设计开发方案，还能自己排查BUG、修复漏洞，全程不用任何人插手，行业把这项能力叫做任务时间跨度，说白了，就是AI能独立“上班干活”的时长。

回看AI的进化史，进步速度真的吓人，几年前的AI，只能做秒级的简单工作，最多写一行代码；后来升级后，能独立写简单函数，支撑几分钟的工作；再之后，已经可以完成小时级的小型程序开发。

而最新的Claude模型，直接做到了连续16小时独立作业！更关键的是，目前全球最难的AI测评题目，最高时长上限就是16小时。

这也就意味着，不是AI只能干16小时，是人类目前根本造不出更难、耗时更长的测试题来考验它，这绝对是AGI发展的标志性转折点。

这场AI革命，最核心的变化，是实现了认知劳动自动化。

互联网时代，自动化解决的是信息传播问题；而AI新时代，直接把人类的脑力劳动、认知工作实现了自动化，首当其冲被影响的就是程序员和网络安全两大行业。

以前的AI只是程序员的辅助工具，帮忙提速、简化工作，但按照现在的迭代速度，AI独立开发能力越来越强，纯人工写代码的工作模式，很快会被逐步替代，普通程序员的岗位价值会大幅缩水。

网络安全行业的变化更是颠覆式的。过去AI只能辅助人工找漏洞，现在的AI已经能复刻顶级黑客的思维，把各种细碎的小漏洞串联起来，搭建出完整的攻击链。

以往专业安全团队要花几周时间完成的渗透测试，现在AI几十分钟、最多几小时就能搞定，效率提升几十倍，这也是现在所有科技企业都在卷“AI对抗AI”技术的根本原因，网络安全的行业攻防规则已经彻底改写。

不过大家也别被各种夸张报道带偏，不用神化当下的AI。

现在很多媒体吹捧AI是“外星技术”，其实水分很大，现阶段的AI依旧有明显短板，会产生内容幻觉、逻辑跑偏，根本无法真正理解现实世界，距离真正的人类通用智能，还有很远的路要走。

真正值得我们关注的核心变化，是AI的身份彻底变了。

老式AI只是被动的问答工具，你问它才会答；而新一代AI，是实打实的数字员工，可以自主规划任务、独立执行、闭环收尾，全程自主完成复杂工作。

更恐怖的是未来的可能性：一旦AI可以自主研发、迭代更强的AI，科技进步就不再是普通指数增长，而是指数的指数增长。

这次人类题库被AI轻松打爆，看似只是一次评测突破，实则预示着通用人工智能提前到来，整个科技行业的变革浪潮，已经正式开启。

众力资讯网

通用人工智能真的提前落地了，这次突破口就在编程领域！最近Claude新模型直

热门分类

通用人工智能真的提前落地了，这次突破口就在编程领域！ 最近Claude新模型直

猜你喜欢

热门分类

通用人工智能真的提前落地了，这次突破口就在编程领域！最近Claude新模型直