众力资讯网

DeepSeek-V4预览版正式开源,Agent能力超越Sonnet 4.5

DeepSeek-V4预览版正式开源,Agent能力超越Sonnet 4.5

4月24日上午,DeepSeek-V4 模型预览版正式上线并同步开源。这是继R1爆火之后,DeepSeek带来的又一次架构级升级。

三大亮点一次看懂:

一、双版本齐发,按需取用

V4系列包含两款MoE模型——DeepSeek-V4-Pro总参数1.6T(激活49B),以及DeepSeek-V4-Flash总参数284B(激活13B)。Pro主打性能旗舰,Flash主打轻量高速,适配不同成本与场景需求。

二、百万上下文全面普及

DeepSeek-V4开创了一种全新的注意力机制,在token维度进行压缩,结合DSA稀疏注意力技术,实现了全球领先的长上下文能力,并且相比传统方法大幅降低了对计算和显存的需求。从现在开始,1M(一百万)上下文将是DeepSeek所有官方服务的标配。换句话说,一次处理整本《三体》、啃一个超大型代码库,从奢侈品变成了日常操作。

在1M token场景下,V4-Pro相比V3.2只需27%的单token推理算力,KV缓存降到10%——这直接决定了长文本推理的经济性。

三、Agent能力对标海外顶流

在Agentic Coding评测中,V4-Pro已达到当前开源模型最佳水平。DeepSeek-V4已成为公司内部员工使用的Agentic Coding模型,据评测反馈使用体验优于Sonnet 4.5,交付质量接近Opus 4.6非思考模式。同时V4针对Claude Code、OpenClaw、OpenCode、CodeBuddy等主流Agent产品做了专项适配,开发者可以直接无缝切换。

世界知识方面,V4-Pro在世界知识测评中大幅领先其他开源模型,仅稍逊于顶尖闭源模型Gemini-Pro-3.1。

开源世界的Sonnet 4.5+级别选手登场,百万上下文从卷价格变成卷标配,对Agent和Coding从业者来说,工具箱又厚了一层。