模型公司亲做 Agent,是认输还是进化?
DeepSeek 招 Harness 团队这事,值得展开聊两句。
先说一个有意思的细节:招聘 JD 里,把 Skills, MCP, Memory、Subagent、Multi-Agent 这些应用层面的功能全都列进了清单。
这种写法在以前的中国大模型公司招聘里几乎不会出现。这说明两件事:
头部模型公司已经从"我能训出最好的模型"的骄傲里走出来了,承认"训练 ≠ 落地"Agent 平台层这件事,已经被他们正式看见。为什么是现在?
过去两年,所有人都在卷参数。V3、V4 一轮一轮刷新榜单,benchmark 一个比一个漂亮。但市场会用脚投票。Claude Code 拿下了全球编码 Agent 市场的过半份额,年化收入冲到二十多亿美元,而 Claude 最新的神话和寓言两个模型模型又是目前模型的水桶天花板。
凭什么?不仅仅是模型本身,还要凭 Harness。
模型只是大脑,能稳定干活才是手脚。Harness 就是那套"手脚系统":上下文管理、工具调用、文件读写、终端执行、测试反馈。每一件都和模型本身没关系,但缺一不可。
Anthropic 的聪明之处在于,他们自己把这套 Harness 做到了极致。竞争对手即使拿到同样的模型权重,也做不出 Claude Code 那种工程体验。这就是"模型 + Harness"协同优化的护城河。
DeepSeek 现在下场,是在追赶这条路。
时间窗口还在,但不算宽。Claude Code 还会继续进化,Cursor 这种独立工具也在加速,再过一年多,市场形态基本就固化了。DeepSeek 要么 12 个月内出产品,要么就只能捡剩饭。
不过,DeepSeek 有两个独特优势:
第一个是性价比。 V4 系列的定价本来就比 Claude 和 GPT 便宜一大截。Harness 顺势补贴,全球最便宜的编码 Agent 几乎可以预见。这对价格敏感的中文开发者市场,几乎是降维打击。
第二个是数据飞轮。 Anthropic 最厉害的不是 Claude,是真实用户调用数据 → 反哺训练的闭环。这件事只有模型公司自己能做。DeepSeek 因为开源,本来就有海量调用数据,Harness 一旦推出,这些数据能合规地回流到训练管线——这是 R-1 颠覆推理模型那条路的延续。
对行业的影响:
短期:卷参数的时代彻底结束,卷产品 + 卷生态的时代开始。
中期:独立 Agent 公司的生存空间被压缩。但模型无关的 Agent 平台反而更有价值。未来在我看来依然会是是多模型并存的局面,开发者需要统一的中台来调度 Claude、DeepSeek、本地模型、垂直小模型。
长期:Agent 会变成"水电煤"一样的基础设施。没有人会关心底层模型是哪家,但所有人都会关心自己用的 Agent 平台能不能稳定。
DeepSeek 这步棋走通了,中国 AI 公司集体从"研究型"转向"产品型"。走不通,700 亿融资就是天花板。
但不管走不走得通,Agent 平台层这件事都必须要走,必须要做。