众力资讯网

复盘罗永浩对谈MiniMax闫俊杰:一个AI原生的公司是怎么长出来的

文丨李丹编辑丨谌岩进入2025年,百模大战早已落幕,曾经高调的AI六小虎也退到聚光灯边缘。大模型创业公司如今面临的是内外

文丨李丹

编辑丨谌岩

进入2025年,百模大战早已落幕,曾经高调的AI六小虎也退到聚光灯边缘。大模型创业公司如今面临的是内外夹击的险境:在国内,阿里、字节等移动互联网巨头带着远超创业公司的钱、算力等资源,以及势在必得的决心和行动力发起饱和进攻;眼光再放远一点,几家创业公司在诞生之初无一不背负着“中国的OpenAI”的期望,然而如今OpenAI估值5000亿美元,是国内AI创业公司估值的一百倍还多。

越来越多人觉得,在资源的碾压下,创业公司很难打得赢大厂。故事又回到了只要进入巨头盯上的赛道,创业公司往往不是被并购,就是走向无人问津的宿命。今年年初,DeepSeek的横空出世证明了创新的力量,也一定程度上帮助创业公司们从和大厂的消耗战中解脱出来。但仍绕不开的问题是,当几乎所有的互联网巨头都下场做AI,为什么还需要创业公司?

近期,中国大模型头部创业公司MiniMax的创始人兼CEO闫俊杰做客罗永浩的播客“十字路口”,两人进行了一场四小时的对话。闫俊杰为人低调,极少公开露面,但这次做了许多毫无保留的真诚分享,聊了聊他的成长经历、创业以来的心路历程和MiniMax的尝试,甚至包括第一次把头发剃光时的心情。

在这次节目之前,闫俊杰已经有一段时间未公开接受如此长时间的访谈。再出现在公众视野,他依然轻声细语,面带笑意,同时抛出犀利观点,围绕产品、组织、人才、战略,分享了许多有价值的思考。他反复提到一点:AI行业不是互联网行业的延伸,传统的经验也不一定有效。

就像移动互联网颠覆了PC互联网,智能手机颠覆了功能手机,AI行业也不是移动互联网的延伸,而是一个全新的物种。AI时代需要探索全新的组织形式、产品哲学、人才定义,这就是创业公司的机会所在。

AI时代原生的公司要如何重新发明自己?一个创业公司该如何在海内外巨头的优势下生存下去?闫俊杰和MiniMax提供了一个反直觉的样本。

反直觉之一:“草根”出身的团队

在大模型赛道,人才几乎是除算力外,军备竞赛最重要的一部分。最典型的就是几个月前,扎克伯格用1亿美元的天价薪酬挖角挖穿硅谷,国内的一众大厂也纷纷推出各种各样的人才激励方案。

但具体到对人才的定义,每家公司都有自己的理解。闫俊杰认为,“这是导致不同公司做的东西非常不一样的一个核心因素。”

在激烈的抢人大战里,有两家公司的选择显得很特殊:DeepSeek和MiniMax。区别于其他大厂研究员海归比例不小,部门核心管理层多为多年经验中高管,这两家公司的人才更年轻,且更多是在公司内部“长出来”的。

晚点LatePost曾分析过DeepSeek过半研究人员的背景和工作履历:多数人不到30岁,应届生过半,大部分最高学历是本科或硕士,关键岗位负责人基本都没有博士学位,境外留过学的研究者占比不到 10%。

MiniMax情况相似,“真正在公司里面能够起到非常关键作用的同学,其实很多人都是他的第一份工作。”

甚至在MiniMax创立之初,当时GPT3.5尚未出现,AI还没有变成一门显学,相关的人才并不如现在这么多,连闫俊杰自己也没做过自然语言处理。当他抱着“有什么变化就要发生了”的想法离开商汤创业时,能说服的人并不多,“当时国内非常顶尖的一些人,在传统AI时代已经取得成功,不太会愿意切换一个东西。所以创业的时候基本上只能和最年轻的人一起来做。”

闫俊杰形容自己和初创团队都是“草根”出身,初创团队十几个人,“有些都不是学这个的”。闫俊杰复盘这些人能够加入自己的原因,其实非常简单,也是一种对第一性原理的相信,曾有MiniMax的前员工说,他加入MiniMax是被会议室墙上那句“Intelligence with Everyone”打动。

在闫俊杰看来,这样的相信也帮了MiniMax。因为相信改变正在发生,MiniMax相比其他明星创业公司起步早了一年多,他觉得,要不是做得早,在后来明星研究员和大厂AI背景更受欢迎的融资环境里,MiniMax的优势并不大。

● 上海,2025世界人工智能大会,MiniMax的展牌。图源:视觉中国

创业者的人才观,往往与自己的成长经历有关。我们不妨看看闫俊杰自己是一个怎样的人。他1989年出生在一个教育资源可以称得上匮乏的河南县城,本科在东南大学学数学,后来又去中科院自动化所读了博士,清华读了博士后,并无海外留学经历。出来创业时,他既不算“业界大佬”,也不认为自己是“技术天才”。

小时候,他去过最大的城市是舅舅工作的南京。那时他的愿望是能够去大城市读书,找到工作。等到了读博士,对他来说最好的工作,是和学长一样去IBM当Java软件开发工程师,年薪28万。

转折点发生在2014年,他在后来为人工智能行业输送了大量人才的“黄埔军校”百度实习,第一次接触真正意义上的GPU集群,认知被大大改变。后来,他又去了商汤,一路做到商汤副总裁、研究院副院长和智慧城市事业群 CTO。

某种意义上来说,闫俊杰并不是那种到哪都拔尖的明星人物,而是系统的胜出者。如果追溯到童年,他赞同自己是“运气好”,有一个较为正向的成长环境,不断获得好的反馈。求学过程中,他很早就意识到自己无法成为一个顶尖的数学家,反而发掘出对人工智能的兴趣,并在中科院和清华这两个人工智能摇篮里沉淀数年之久,后来又在百度和商汤这样的业界头部公司锻炼了技术能力和商业实践。这是一条不经规划却又十分圆满的成长路径。

在MiniMax内部,闫俊杰被称呼为IO,一种解释是,计算机语言里的Input/Output,另一种解释是,这是Dota-2里的一个辅助型英雄。叫这个名字可能是个偶然,但闫俊杰的确是相信团队作战的人。

以前,闫俊杰讨厌管人,他做学术出身,习惯了一个人写代码,一个人做实验,一直觉得自己不需要团队。但在商汤,有一年多的低谷里,每次技术测试都是倒数,后来他靠着集中有限的资源到一个上限更高的技术路径上,用优化系统的方式,凭借团队的力量做出好的结果。这段经历帮他塑造了创业的基本思路。

闫俊杰日常花大量时间面试,MiniMax的算法人员,他几乎都是最后一个面试官。他考核的核心除了聪明、热情,最看重的一点是“有没有和人合作的能力”。

科技领域最不缺的就是“明星”和“怪咖”。但不同于大多数公司强调的“英雄主义式”的核心技术人员驱动,MiniMax相信环境和组织的力量,相信组织可以催生创新和进步。MiniMax的期权激励计划,不仅面向技术研究人员,也覆盖了公司全职能。MiniMax核心目标之一是“怎么样让公司的年轻人能够有一个足够好的环境,能够变得越来越好。虽然过程中一定会犯很多错,一定会有很多代价”。

真正让闫俊杰觉得“公司在变好”的时刻,有时不是取得了怎样的外部成绩,而是他发现公司有人有了自己的认知,“并且在那个点上,其实比我认知更好。每当这件事出现的时候,感觉我们又往前走了一步。”

为什么MiniMax不学硅谷,高薪单点挖角?在闫俊杰看来,年轻人的优势和劣势都是缺乏经验,硅谷的经验虽好,但直接拿来“不一定work”,同时年轻人有更宝贵的东西:想象力和自信心。

人才或许也是AI全球竞争中中国公司的优势。根据MacroPolo发布的《全球人工智能人才追踪调查报告 2.0》,来自中国的顶尖AI研究人员占比在2019年到2022年间,从29%提升到了47%。闫俊杰认为,比较核心的原因是在人工智能行业,最重要的能力第一是足够聪明,第二是数学跟编程能力比较好,第三个是需要非常长时间的努力。“具备这三种特点的人确实很多是中国人。”

人才密度带来了诸多优势。首先是成本,“美国最好的公司估值可能是中国创业公司的100倍,收入也是100倍,花的钱可能也是几十倍,但技术可能就领先5%,而且这个差距还在缩小”。用非常低的成本做出差距不大的技术,对应更高的估值和收入空间,这是中国公司的机会。其次,受限于算力限制,反而可能倒逼中国的人才做出更多创新。“很多美国那边的经验你没办法直接拿来用,需要做很多本土的创新。”

“什么时候可以做得比美国更好,我觉得真正的突破点,是中国这些优秀的年轻人里面出来了几个旗舰型的技术天才。有可能两三年是可以实现的。”

反直觉之二:好的组织就像一个好的大模型

AI时代产品和人才的变化或许更显性,而组织逻辑的变化则是更底层、更颠覆性的。

曾有工程师写下自己在OpenAI工作的经历,将OpenAI比作“洛斯阿拉莫斯实验室”(Los Alamos,美国研究出原子弹的实验室)的现代版本。OpenAI依赖工程师和研究者“从下到上”推动项目,“好主意可以来自任何地方,进展不是规划的,而是迭代的”。

移动互联网时代的组织逻辑是,只要设定明确目标与责任边界,把每个岗位做好切分,整体就会被稳定推动。但研发是一件不同的事,工程可能是可预期的,科学却不是。过去十年最成功的管理方式,OKR、流水线式分工、目标倒排,在AI时代可能都会失效了。

最典型的例子是,OKR没法定了。MiniMax内部曾经尝试过用OKR,发现行不通,更不必提KPI。“我们下一个模型要做怎么样,会有个非常详细的计划,但是它到底能不能做出来?”

闫俊杰还提到今年MiniMax另一个组织上的大变动,是他意识到“算法和基础设施一定要是一体的,相当于所有人要优化同一个目标,而不是每个人自己优化目标。”相当于内部每个人没有了自己的scope。有些人不认同,离开了MiniMax。

OKR不奏效,AI时代的公司需要全新的管理工具,但这样的工具还没有出现,需要这些AI原生的公司自己去探索。

AI公司目前能做到的,是尽可能让组织扁平、灵活。OpenAI员工数已经超过3000人,但哪怕规模如此庞大,还是保留了灵活的工作方式,研究员可以直接行动让想法落地,不必等批准;团队之间的协作也不必层层审批、等季度规划。MiniMax也类似,现在还是只有闫俊杰、闫俊杰的-1,闫俊杰的-2三个层级。

MiniMax如今四百多人,和几乎所有创业者一样,闫俊杰不喜欢做管理,认为杠杆太低,但很喜欢研究组织。“很多管理的问题,我觉得其实是组织不顺导致的。这个事我觉得非常微妙,组织的杠杆其实非常大。坦白说如果我们不是在某些时间点做了一些组织上的创新,我觉得我们很多的模型其实做不出来。”

在闫俊杰看来,一个AI时代原生的公司里,好的组织应该就像一个好的大模型,重要的是多样性,多样性越大,能力上限越高。他把AI时代以前的公司分为两种,一是公司只有一种文化,所有人都得符合这种文化;二是大公司,每个岗位有一个画像,需要员工主动来适配,自己是什么样并不重要。

“对我们来说,一个更好的方式是,公司不应该有岗位,而是有几种不同画像的人。这几种人可以做很多事,我们需要的是在一个组织里,给予一些底层的原则,能够让这几种人在一起工作。”

反直觉之三:真正的产品是模型本身

在中国的大模型创业公司中,MiniMax曾是最早说“AI to C”的一家公司,也是做产品最早、最多,投入最大的一家。早在2022年,MiniMax就推出了AI角色扮演产品Glow,之后又在国内推出星野,海外推出Talkie,海螺生成的猫咪跳水、体操视频一度在全网病毒式传播。2024 年上半年以前,MiniMax的战略是“产模一体化”,模型和应用双轮驱动。

to C产品的成功,曾为MiniMax带来不错的商业回报。当同行还在为商业化焦虑时,外媒就报道了MiniMax2024年营收将突破7000万美元。但在这次访谈中,闫俊杰重申MiniMax是一家“技术驱动”而非“产品驱动”的公司,最重要的目标不是应用的留存、增长,甚至不是收入,而是技术迭代。换句话说,MiniMax的野心不止于做一款成功的产品,而是不断追求更高的智能,这是第一性。

在移动互联网时代,一个成功产品的目标是清晰的:降低信息分发成本、扩大覆盖面、抓住更多用户时间,最终形成强大的网络效应和规模经济。为此,产品经理们挖空心思设计出更精美的界面,更灵活的交互,产品体验成为用户运营的核心,所谓“好的产品会自己说话”。

而在闫俊杰看来,“在AI时代,传统意义上的产品其实更像是一个渠道”。AI 产品,不论是生产力产品还是娱乐产品,本质是在提供某种智力,“真正的产品其实是模型本身”。

移动互联网公司时代,App的界面、交互、内容质量、留存机制决定了一切,因为产品本身就是最重要的“资产”。但在AI时代,产品只是展示模型能力的窗口,模型够不够聪明才最重要。大模型公司押注的不应该是某个App的流行,而是智能本身将成为水电一样的基础设施。

基于此,闫俊杰又提出了一个看起来很反直觉的观点:并不是用户越多,数据越多,模型能力就提升越快。“这件事不太取决于你的用户量多大,而取决于质量有多好,以及能不能找到那些真正有效的,能让模型变得更聪明的一些分布。”

这也和移动互联网时代推荐算法的逻辑不同。推荐算法的逻辑是用户越多,反馈越多,推荐引擎越聪明。正是基于这个逻辑,过去AI产品需要大量投流以获取用户。烧钱换流量是移动互联网的逻辑,但至少在闫俊杰看来,这不是大模型的逻辑。

在流量渠道被巨头把持的今天,如果大模型创业公司选择烧钱投流买量,是一种将本就不富裕的资源做无谓消耗的行为。想明白这一点,或许能帮助AI创业公司逃脱互联网巨头的地心引力。同行Kimi的选择,也是退出投流大战,投入对基础技术的研究。

“更好的模型可以导向更好的应用,但更好的应用和更多用户并不会导向更好的模型。”

对于是否坚持技术驱动,产品和模型谁更优先,据闫俊杰所说,MiniMax经历过大约半年时间的摇摆,“一开始的想法很简单,我们有AI的人才,再加一些互联网的人才,这不就成了吗?但是后面发现这事根本就不work。通过模型能力来让产品或者业务变好,和通过复制移动互联网的经典路线来让它变好,这两个东西有可能都是对的,但这两个东西没办法共存。”

当闫俊杰意识到这一点,MiniMax掉转船头。这位创业者看起来温和,但对自己的判断很坚定。访谈中,他提到几次认为公司本可以做的更好的节点,都将原因归结为“我的认知不够”。

● MiniMax创始人&CEO闫俊杰出席2024外滩大会。图源:视觉中国

后来在MiniMax内部,DAU被称为 “虚荣指标”。MiniMax的选择是坚持做更智能的模型,用技术升级产品,“不是说做出Talkie,我们的模型就停在产品里面了,有些公司的智能水平可能就被产品限制住了”。

既然真正的产品都已经是模型本身了,“产品经理会不会就被裁了?这个行业会不会就不存在了?”产品经理出身的老罗对此颇有危机感,连说了好几句“我很慌”。

在以产品为中心的移动互联网时代,产品经理负责定义需求、排优先级,写文档、催排期,连接技术与用户。但在AI时代,技术成为主导,只要模型够强,产品经理可以把代码交给AI来写,如果工程师也有好的创意,也无需需求文档就能落地。闫俊杰提出一种可能,“我们不应该太在意移动互联网时代是怎么分工的。不管是产品经理还是开发还是算法,大家的边界其实会变得越来越模糊,只是在不同阶段可能会有不同人来主导。”

变化在MiniMax已经发生:例如,很难统计MiniMax的非技术人员比例是多少,因为大家的工作方式更靠近问题本质,而不是传统职位定义。负责B端大客户的售前,按理说不是技术岗,最主要的工作应该是给客户画PPT,但在MiniMax,为了高效,售前甚至会自己写代码,给客户做demo。

反直觉之四:AI也许不是赢者通吃的行业

行业内的一种说法是,看一个创业公司是否相信AGI,就看它是成立在GPT发布之前还是之后。

MiniMax在2022年初创立,对AGI的笃信不言而喻。

OpenAI发布GPT3.5前半个月,中东正好举办世界杯, 闫俊杰去中东转了一圈,每到一个地方,他说自己在做AGI,没有人听得懂,他还得用蹩脚的英语解释什么是AGI。回国后,闫俊杰在酒店隔离期间看到了GPT3.5的发布,“一用就觉得变天了”。等他出了酒店,再没人问他“什么是AGI”。

对于AGI有许多不同的定义,闫俊杰和MiniMax对AGI的想法几乎没有变过,“最终模型能够把不同模态整合在一起,语言、图像视频、音频、音乐四个市场会慢慢融合”。这源于闫俊杰在商汤时期就有的观察,一定要做天花板最高的事情,而真正的AGI输入和输出都是动态的,尽管实现起来很难,但目标是正确的。

在外界看来,MiniMax的技术路线一向激进。MiniMax从创立之初就将多模态能力作为核心方向,一上来就同时做好几个模型,想把每个模态都先走通,等到时机合适的时候就可以再一起整合。而其他大模型公司大多先做语言模型,再拓展到语音、视觉,或特别聚焦大语言模型,几乎不做多模态。

2023年6月,大部分国内公司还在迭代稠密模型(dense model),MoE(混合专家系统)模型尚未成为行业共识时,MiniMax就花了80%以上的精力下注MoE。

“我选的技术路线是上限最高的,几乎没有退路,选的算力方式也激进。” 闫俊杰曾说。

2023 年以来,MiniMax陆续发布了大语言模型、语音生成模型、视频生成模型和图文理解模型等,作为一个创业公司,这样分散精力是否容易把自己推向生死边缘?

闫俊杰承认,“我们这么做代价是很大的。但第一我觉得这件事一定会发生,第二至少等到发生了,我们的技术积累和人员组织跟得上。”目前,OpenAI的Sora 2就是多模态融合的思路,具备了文本生成、图像生成、视频生成、语音合成等多种能力。接下来,MiniMax也会在后续新模型中尝试这种融合。

但不论如何,未来还没来。多模态结合这件事目前虽然有了趋势,但并没有真正发生,还需要时间和耐心。

不同的公司已经做出了不同的选择。零一万物明确不再追求AGI,百川智能收缩至垂类赛道,美国的AI创业公司Scale AI被Meta收购,同时创始人加入Meta负责AI业务。

AI浪潮里的公司越来越少。一个创造价值越来越多的市场里面,参与的人却越来越少了,这也是闫俊杰对未来乐观的原因之一。但和移动互联网不同的是,移动互联网的资源是“流量”,但AI的资源是“智能”。流量可以垄断,智能却各有偏向。

闫俊杰认为,目前大模型远没有到存量竞争的地步。以Open Router上的API调用情况为例,各个模型的使用量还在增加。“核心是所有模型都要考虑实际成本,而且这比过去互联网时代的成本要高得多。一旦加上了成本的约束,那大家都要开始来做取舍。”这也是创业公司目前能够找到自身差异化的现实空间。

MiniMax的选择是智能程度。闫俊杰最看重的,还是“一是技术的领先性,二是技术领先性能带来收入的跳变”。至于到底是技术驱动还是产品驱动还是业务驱动,“取决于说在不同阶段什么东西的进步速度最快”。在眼下,这个问题的答案还是技术。

在竞争激烈的当下,AI创业公司的使命是能否在AI时代再造自身,抛弃旧时代的惯性,在混沌中找到新工具,建立新秩序。好在一切还在进行中,技术还在进步,市场还在成长,留给中国AI创业公司想象和探索的空间,也会越来越大。

【版权声明】所有内容著作权归属镜相工作室,未经书面许可,不得转载、摘编或以其他形式使用,另有声明除外。