模型公司亲做 Agent，是认输还是进化？DeepSeek 招 Harness

模型公司亲做 Agent，是认输还是进化？

DeepSeek 招 Harness 团队这事，值得展开聊两句。

先说一个有意思的细节：招聘 JD 里，把 Skills, MCP, Memory、Subagent、Multi-Agent 这些应用层面的功能全都列进了清单。

这种写法在以前的中国大模型公司招聘里几乎不会出现。这说明两件事：

头部模型公司已经从"我能训出最好的模型"的骄傲里走出来了，承认"训练 ≠ 落地"Agent 平台层这件事，已经被他们正式看见。为什么是现在？

过去两年，所有人都在卷参数。V3、V4 一轮一轮刷新榜单，benchmark 一个比一个漂亮。但市场会用脚投票。Claude Code 拿下了全球编码 Agent 市场的过半份额，年化收入冲到二十多亿美元，而 Claude 最新的神话和寓言两个模型模型又是目前模型的水桶天花板。

凭什么？不仅仅是模型本身，还要凭 Harness。

模型只是大脑，能稳定干活才是手脚。Harness 就是那套"手脚系统"：上下文管理、工具调用、文件读写、终端执行、测试反馈。每一件都和模型本身没关系，但缺一不可。

Anthropic 的聪明之处在于，他们自己把这套 Harness 做到了极致。竞争对手即使拿到同样的模型权重，也做不出 Claude Code 那种工程体验。这就是"模型 + Harness"协同优化的护城河。

DeepSeek 现在下场，是在追赶这条路。

时间窗口还在，但不算宽。Claude Code 还会继续进化，Cursor 这种独立工具也在加速，再过一年多，市场形态基本就固化了。DeepSeek 要么 12 个月内出产品，要么就只能捡剩饭。

不过，DeepSeek 有两个独特优势：

第一个是性价比。 V4 系列的定价本来就比 Claude 和 GPT 便宜一大截。Harness 顺势补贴，全球最便宜的编码 Agent 几乎可以预见。这对价格敏感的中文开发者市场，几乎是降维打击。

第二个是数据飞轮。 Anthropic 最厉害的不是 Claude，是真实用户调用数据 → 反哺训练的闭环。这件事只有模型公司自己能做。DeepSeek 因为开源，本来就有海量调用数据，Harness 一旦推出，这些数据能合规地回流到训练管线——这是 R-1 颠覆推理模型那条路的延续。

对行业的影响：

短期：卷参数的时代彻底结束，卷产品 + 卷生态的时代开始。

中期：独立 Agent 公司的生存空间被压缩。但模型无关的 Agent 平台反而更有价值。未来在我看来依然会是是多模型并存的局面，开发者需要统一的中台来调度 Claude、DeepSeek、本地模型、垂直小模型。

长期：Agent 会变成"水电煤"一样的基础设施。没有人会关心底层模型是哪家，但所有人都会关心自己用的 Agent 平台能不能稳定。

DeepSeek 这步棋走通了，中国 AI 公司集体从"研究型"转向"产品型"。走不通，700 亿融资就是天花板。

但不管走不走得通，Agent 平台层这件事都必须要走，必须要做。

众力资讯网