2025年12月9日,伦敦的冬夜寒风凛冽,但英国《自然》杂志总部却灯火通明。当主编布兰登·马赫在镜头前宣布“梁文锋”的名字时,全球科技界的目光瞬间聚焦于这位来自中国杭州的AI研究者。他成为继屠呦呦、曹原之后,第三位登上《自然》年度十大科学人物榜单的中国面孔。而这一刻的背后,是一个关于勇气、坚持与颠覆的十年征程。

2015年的杭州,西湖边的咖啡馆里,32岁的梁文锋正与团队讨论着一个大胆的设想:用AI算法替代人类交易员。彼时的他,已是量化投资领域的明星——他创立的幻方量化,凭借自主研发的“萤火一号”系统,在私募圈崭露头角。但梁文锋的野心不止于此。
“那时的我常想,如果AI能预测股票,为什么不能预测更复杂的世界?”回忆起转型的契机,他语气平静,却难掩眼中的炽热。2021年,当ChatGPT的雏形尚未问世,梁文锋已预判到通用人工智能(AGI)的潜力。他做了一个惊人的决定:从幻方量化的利润中划出10亿元,在杭州城西建起一座名为“萤火二号”的算力中心。
“1万张英伟达A100显卡,堆起来像一座小山。”团队成员回忆,当时国内鲜有企业敢如此“豪赌”基础研究。但梁文锋坚持:“算力是AI的入场券,我们必须拿到第一张。”
“寒冬”中的逆袭:用十分之一成本震撼世界2024年的冬天,对全球AI行业而言格外寒冷。互联网大厂收缩投入,初创公司纷纷倒闭,而梁文锋的团队却在杭州的实验室里熬过了无数个不眠之夜。
“R1模型的训练像在走钢丝。”首席科学家林浩(化名)描述,团队尝试了上百种架构,最终在2025年1月突破瓶颈:一种名为“多头潜在注意力”(MLA)的机制,将显存占用降至传统模型的1/10,而推理速度提升3倍。更颠覆的是,他们通过动态精度调节技术,让模型在华为昇腾芯片上的性能损失仅5%,成本却直降70%。
2025年1月20日,R1模型正式发布。测试结果令全球哗然:在数学推理、编程等复杂任务中,R1的表现与美国顶尖模型持平,而训练成本仅为后者的1/10至1/20。当天,DeepSeek应用登顶美区苹果商店下载榜;三天后,英伟达股价单日暴跌17%,市值蒸发5890亿美元。
“这像一场‘算力民主化’的革命。”麻省理工学院教授阿维·戈德法布评价,“梁文锋证明了,算法创新可以打破硬件垄断。”
开源:一场“危险”的赌局2025年3月,梁文锋做出一个令业界震惊的决定:公开R1模型的全部代码与训练细节。
“封闭技术是筑墙,开源才是建桥。”他在发布会上说。这一策略立即引发争议:竞争对手可能“抄袭”,团队多年的心血可能付诸东流。但梁文锋力排众议:“真正的壁垒在于持续创新,而非一时保密。”
开源策略迅速引发连锁反应。全球开发者涌入DeepSeek的代码库,有人优化模型效率,有人将其应用于医疗、教育领域。北大团队基于R1开发的“AI数学教练”,让学生解题速度提升40%;非洲开发者用其搭建的农业病害诊断系统,惠及数百万农民。
“梁文锋重新定义了‘竞争’。”《自然》特写部编辑马赫写道,“他选择与世界共享火种,而非独占光明。”
“萤火”之光:照亮中国AI的未来梁文锋的办公室里,挂着一幅字:“守正出奇”。朋友说,这四个字是他性格的写照——既有理工生的严谨,又有理想主义者的浪漫。
他极少接受采访,却常在深夜回复年轻研究员的邮件;他拒绝商业化诱惑,却鼓励团队“用技术改变世界”。在DeepSeek,没有“老板”与“下属”,只有“同学”与“探索者”。这种“混沌精英制”的管理模式,让平均年龄28岁的团队迸发出惊人创造力。
2025年11月,梁文锋受邀参加国务院座谈会。当被问及“中国AI如何突破封锁”时,他回答:“我们不需要‘弯道超车’,因为根本不在同一条赛道上。真正的创新,是开辟一条新路。”
尾声:一场未完成的革命入选《自然》榜单后,梁文锋依然每天工作15小时。他的日程表上,下一个目标是开发具备自我进化能力的AGI系统。“我们才刚摸到门槛。”他说。
而在杭州的实验室里,新一代模型正在训练。服务器指示灯闪烁如萤火,仿佛在诉说着一个关于未来的承诺:这里,将诞生更多的颠覆。
评论列表