众力资讯网

不出意料,Deepseek V4依然是文本模型,没有多模态,文件读取能力来自此前

不出意料,Deepseek V4依然是文本模型,没有多模态,文件读取能力来自此前单独发布的OCR2模型

V4版本体量大幅增大,从671B扩充到1.6T,顶配Mac Studio很可能要顶不住了

新版本的提升主要在agent与coding能力上,这次大概率不会像去年那样惊艳了,原因很简单:一方面,DS团队承接了支持寒武纪、昇腾等国产卡的支持,势必会拖累研发进度(当然这很有必要);另一方面,DS的资源投入在国内也只是第二梯队,不仅比不了硅谷大厂、相比阿里字节也差了不止一个量级,在没有新的范式革命的前提下,是很难有颠覆性的成绩的。

当前大模型发布的一个怪圈是:新模型一定是刷分王,一定要说自己是SOTA,不说吊打也是媲美GPT、Gemini、Claude,相比之下,Deepseek在万众瞩目之下极为谨慎克制地坦承自己还不如Claude上一版本,这是属于真正强者的谦逊。

DeepSeekai