中国的两位顶级科学家,AI芯片方向的精英人才将为美国效力,巧的是他们同为清华校友!
韩松在MIT实验室里反复调试代码时,可能没想到自己多年的研究成果最终会以这种方式融入全球最大芯片公司的生态。
韩松从清华大学毕业后前往斯坦福深造,师从相关领域专家,博士阶段专注神经网络压缩技术。他开发了Deep Compression方法,能大幅降低模型大小同时保持性能,这项工作在学术圈引发关注。
毕业后韩松进入麻省理工学院任教,带领团队继续攻关高效AI模型,让复杂算法在手机芯片或汽车设备上实时运行。
OmniML公司成立后,把这些技术产品化,帮助企业解决边缘计算难题。英伟达收购OmniML后,相关成果直接进入CUDA体系,支撑更多硬件优化项目。
与韩松轨迹交织的还有贾扬清。贾扬清本科同样毕业于清华大学,2014年在加州大学伯克利分校完成博士,期间推出Caffe框架。这个框架代码结构清晰,支持GPU加速,在TensorFlow和PyTorch普及前,成为全球视觉任务主流工具。
许多团队在ImageNet竞赛中使用Caffe搭建模型,工业界从谷歌到国内公司都广泛采用。贾扬清博士后加入谷歌大脑团队,后转至Facebook AI研究院,2019年进入阿里巴巴担任人工智能基础设施副总裁,负责阿里云AI平台建设。
2022年他离开阿里,在美国创办Lepton AI,专注大模型推理和计算优化。2025年4月,Lepton AI被英伟达以数亿美元收购,改名为NVIDIA DGX Cloud Lepton,融入英伟达云端服务。
这些发展让人们看到清华电子系人才在AI领域的连续输出。同一时期,焦剑涛本科阶段就以第一作者身份在顶级期刊发表论文,毕业后进入斯坦福读博,2018年获得学位,研究覆盖信息论、机器学习和统计学。
之后他加入伯克利担任助理教授,方向包括生成式AI、强化学习以及自动驾驶技术。2023年,焦剑涛与朱邦华、Jian Zhang和Kurt Keutzer共同创立Nexusflow,公司初期瞄准生成式AI在网络安全中的应用,让AI理解自然语言指令来管理安全软件。
Nexusflow进展迅速,2023年9月完成种子轮融资,Point72 Ventures领投,金额1060万美元,投后估值5300万美元。
团队推出NexusRaven-V2,这是一个130亿参数开源模型,在函数调用和嵌套任务上表现突出,成功率超过当时GPT-4约7个百分点,而且训练过程避开了版权问题。
2024年11月,Athene系列模型发布,其中Athene-V2-Chat在多项测试中接近GPT-4o和Claude 3.5水平,Athene-V2-Agent在代理任务上甚至超越GPT-4o专项版本。
朱邦华参与构建的LMArena评测体系,也为行业提供了可靠参照。这套体系基于众包盲测,用户对比两个匿名模型回答后投票,用Elo积分排名。Meta公司在Llama-3.1技术报告中正式采用该数据,说明其公信力得到认可。
LMArena从文本扩展到多模态评估,累积海量真实用户反馈,成为独立于厂商自评的公共坐标。
韩松和贾扬清的选择,反映出这一批清华校友在全球AI竞争中的位置。他们从学术研究到创业,再到技术被巨头整合,路径清晰。
焦剑涛等人创立Nexusflow后,产品快速迭代,也在吸引更多资源。整个过程里,伯克利和斯坦福的学术环境提供了重要支持,而清华的基础训练让这些人才在早期就展现出实力。
“天才就是持久的耐心。”这句话放在这些科学家身上合适,它提醒人们,长期积累的技术突破往往在关键节点发挥作用,也让人思考人才流动背后的深层原因。
韩松团队的边缘计算成果进入英伟达生态,贾扬清的Lepton AI加强云端能力,这些都让AI硬件应用场景更广。Nexusflow的模型在安全和函数调用领域的表现,则显示新一代开源努力正逐步追赶甚至局部超越商业闭源方案。
他们的工作从实验室论文走向实际部署,从框架开发到公司收购,串起AI芯片方向的国际链条。读者看到这些细节,或许会对未来技术格局多些期待。
