众力资讯网

华为发表半导体韬定律 华为 韬定律 华为韬定律 华为 中美芯片战 中美芯片战争

华为发表半导体韬定律 华为 韬定律 华为韬定律 华为 中美芯片战 中美芯片战争 英伟达 NVDA[股票] 长电科技 sh600584[股票] 台积电 TSM[股票] 中芯国际 hk00981[股票] :《中美算力之战的真相:AI不缺算力,缺的是"搬运工"》 在全球最大的AI数据中心里,有一个让工程师沉默的数字:推理阶段,GPU的算力利用率往往低于30%。花数十亿美元购置的英伟达H100,超过70%的时间在等待。等什么?等数据。推理与训练的根本性差异,在于计算模式的不同。训练阶段的核心算子是大规模矩阵乘法(GEMM),计算强度高,GPU的Tensor Core利用率可超80%,内存带宽是瓶颈但非主导因素。推理的解码阶段则截然相反:每当大语言模型(LLM)生成一个新的词元(token),它都必须从高带宽内存(HBM)中重新加载整个模型的完整权重——Llama-70B的权重约140GB,每生成一个字,就要把这140GB在芯片之间搬运一次。矩阵乘法在推理阶段退化为矩阵向量乘法(GEMV),计算量极小,但数据搬运量极大。学界已将这个现象精确量化:推理阶段的"算术强度"(每字节数据对应的浮点运算量)约为0.5到2 FLOPs/byte,而H100的峰值算术强度约为100 FLOPs/byte。两者相差50倍。换言之,芯片99%以上的算力潜力,被"搬运工不够快"这一个问题锁住了。

2026年,TrendForce的数据显示,高带宽内存(HBM)需求同比增速仍超过70%——行业正在用钱投票,把资金砸向内存系统,而非计算单元。华为的论文给出了更直白的数字:超过80%的AI集群能耗消耗在数据移动上,而非计算本身;超过70%的系统成本投入数据存储领域。这是2026年AI产业的真实处境。也是理解华为“韬定律”为什么在此刻出现、为什么直击要害的起点。

一、被忽略的时间,把时延从"结果"变成"设计起点"

深度科技研究院院长张孝荣给韬定律下了一个精准的注脚:"'韬定律'把时延从结果变成设计起点,用'时间缩微'替代'几何缩微'。推理时延的瓶颈不在计算有多快,而在数据等多久——这一点的改变,是根本。"他还补了一句让人心头一紧的话:"推理的瓶颈已经从'存不够'变成了'搬不动'。近存计算让计算发生在数据所在的地方,本质是把数据搬运的功耗和时延抹掉。"这个改变,听起来像是表述方式的调整,实则是工程哲学的根本重构。长期以来,摩尔定律给了半导体行业一个"黄金方程":晶体管数量翻倍,成本减半。这个公式在28nm节点之前成立;在7nm节点开始动摇;在3nm之后已经反转——每颗晶体管的制造成本不再下降,在部分节点甚至在上升。王立新(北京邮电大学教授)把它比作一条工厂流水线:过去60年,行业主要做一件事——把工人(晶体管)塞得更多、道路修得更窄。芯朋微董事长张立新用另一个维度补充了这个比喻:"摩尔定律是往流水线上塞进更多工人来提高效率;韬定律是优化路径、加快零部件的周转来提高效率。他进一步指出,先进封装只是实现'时间缩微'的物理手段之一,韬定律的核心是以信号传递时间为维度来推测行业发展。"两个比喻合在一起,描述的是同一个现实:当继续堆工人的边际收益递减,精简物流动线的价值就浮出水面了。

在电路物理语言里,这个"物流动线"就是时间常数τ。τ = R·C,电阻乘以电容。信号每走一段导线,就积累电阻和电容,电路切换的速度随之受限。为此,华为开发了LogicFolding技术,其核心动作是打破传统二维布局的平面边界,通过重组逻辑结构缩短关键走线路径,在不依赖最先进光刻节点的前提下提升晶体管密度与性能。这正是韬定律将"制程追赶"单赛道扩展为"制程追赶+系统创新"双赛道的工程起点。韬定律的核心主张,是把τ——而非晶体管尺寸L——立为跨越器件、电路、芯片、系统四个层级的统一优化目标。τ还有一个广义缩减规则:每一代产品τ_{n+1} = τ_n / α,α是每代产品的τ缩减倍数,因场景而异——在功耗受限的手机端约为每年1.3倍;在安全关键的自动驾驶场景约为每年1.5倍;而在AI工作负载中,由于算力直接转化为经济价值,α最高可达每年10倍。摩尔定律用一把尺子量所有场景;韬定律给不同场景配了不同的刻度,这是它比摩尔定律更精确、也更灵活的地方。芯和半导体副总裁仓巍将这个突破的工程意义表述得尤为精准:"韬定律给工艺工程师、架构师和系统设计师提供了同一把尺子,让他们围绕同一个量、用同一套单位展开协同优化,而不是各自在本层独立优化、各扫门前雪。"这是自1974年丹纳德定律以来,第一次有人给整个计算栈建立共享的优化语言。何庭波在论文结语中也承认:"这是自丹纳德之后,第一个为整个计算栈建立共享优化目标的缩放原理。"黄仁勋在英伟达内部有过一个与此高度一致的判断:"算力的价值由吞吐量决定,而吞吐量越来越多地被系统架构和互连效率决定,而非单纯由制程节点决定。"两句话,是同一个产业洞察的东西方表达。 中美算力之战的真相:AI不缺算力,缺的是″搬运工″