文 | 北方朔风 天书
最近华为高管何庭波提出的韬(τ)定律可以说是石破天惊。简单来说,在制程工艺受限的情况下,华为提出通过逻辑折叠等优化技术降低系统时间常数τ,以实现芯片性能的巨大突破。华为方面表示应用韬定律的芯片已经完成了流片,相关产品可能今年就会落地。
对于韬定律的问世,科技圈的舆论看法还存在着不小分歧。支持者认为这是后摩尔定律时代的重大工程理论创新反;对者认为IT技术领域里所谓的定律,如摩尔定律等都是一种事后发展趋势总结,华为目前提出的只是一种工程技术路线,还不足以称为定律。
笔者认为比起这些定义上的争论,我们更需要的是对当前中美AI竞争的实际情况有一个清晰的认知。不管是定律还是工程技术路线,只要能有助于解决我国目前芯片和AI产业面临的瓶颈,韬定律就绝对可以说得上是又一重大突破。
缺卡仍是中国AI的最大瓶颈
最近一年多以来,中美各大模型公司的竞争已进入白热化趋势,大模型能力的侧重点也发生了从逻辑推理和世界知识到编程和智能体(agent)的转向。尤其Anthropic的Claude大模型在编程和智能体能力,以及相关生态上实现显著突破后,一些硅谷迷信论者试图再次将中美之间大模型的能力差距神秘化,宣称美国AI不可超越(上一次神秘化在OpenAI发布推理大模型后达到高峰,随后被DeepSeekR1彻底打破)。
实事求是的说,国内大模型和美国三家主流大模型之间目前的差距,根本上仍是算力差距所致。最近DeepSeek V4的发布就足以说明这一点。在缺卡的情况下,V4靠着理论创新和技术优化,用超低的成本依然达到了接近美国主流大模型的水平。
还有很多例子可以证明国内AI产业缺卡。比如两家上市的大模型公司智谱和minimax,这一年的增长速度都还算不错。这两家公司都对外表示,如果GPU充足的话增速还可以更快。
另一个例子是字节的Seedance2.0。这个目前全球最强的视频生成模型,刚推出时性能是肉眼可见的强大。但用户数量暴增之后,就出现了排队时间十分漫长,以及模型能力降智的问题,严重影响了用户体验。综合业内各方面信息来看,字节应该是国内目前GPU数量最多的企业,它家都面临算力不足,其他公司的情况更可想而知了。
反过来说我们也得承认,如果字节没有国内最多的算力,也不可能训练出来最强的视频生成模型。字节固然有着大量视频资料,可视频生成模型的训练也远比传统大模型更加消耗算力,GPU的数量和质量对模型能力的影响依然是决定性的。从总体上来说,芯片规模和性能,还是和大语言模型的能力上限存在强关系。
还有因为国内算力紧缺,所以国产大模型的参数量都相对较小。像DeepSeek和kimi算是比较大的了,但也就在1T参数左右。而美国的几家顶尖闭源模型虽然没有公布参数大小,但是从定价,传闻还有世界知识的丰富度来看,我们可以估计,它们的参数都超过了5T,甚至有可能超过10T。
按照经验公式来看,训练模型的大小出现线性提升,训练所需的算力就需要指数级提升。尽管模型大小并不完全决定模型能力,像DeepSeek这样的团队可以通过创新和优化在有限的算力内提升模型能力,但是主流的大模型参数越来越大仍然是相当时间内无法避免的趋势。
所以中美大模型之间暂时存在一定能力差距是事实,问题是我们并不需要对这种差距过度焦虑,这种差距没有什么神秘化的成分,就是芯片数量的物理限制所致。
从总体的情况来看,中美人工智能差距在算力有明显不足的情况下反而在缩小。像Seedance2.0算是我国第一个性能远超美国大厂的AI模型,如果说传统的大语言模型,中国和美国顶尖水平的差距依然是3到6个月左右。具体是多少没有那么容易量化,毕竟人工智能的各种测试集都很容易出现过拟合。
AI编程不是中美AI竞争的“胜负手”
之所以这半年来国内炒作中美AI差距增加的舆论又多了起来,主要还是因为人工智能行业的风向变化太快。在去年12月,大多数声音还在夸谷歌的Gemini3.0有多聪明,知识结构有多丰富;结果三个月之后热点变成了编程和agent,Gemini就被说成是“美国豆包”了。
这种评价其实和大模型的真实能力差距关系不大,在世界知识这个领域,Gemini至今依然是明显领先的。能力相近的模型之间在编程上的差距,目前更多的还是后训练和生态建设的差异导致。在一些被视作智能的指标上,A社也不怎么样,如果说A社模型在编程之外其他的长处,那应该是角色扮演。
现在国内各公司也开始加大code类应用的开发投入,相信国产大模型在编程能力上的提升会比大多数人估计的更快,美国公司在这方面的领先并没有什么神秘的,不可逾越的壁垒。
更深入一层来说,这段时间大模型的“唯编程论”,其实说到底还是AI行业深陷盈利焦虑的体现。
目前AI相关的各种商业模式中,编程付费可以说是最成熟稳定的。虽然各家推出的coding plan业务,尽管价格普遍昂贵也还是无法覆盖成本,但互联网公司和程序员群体已经是最有意愿为AI付费的群体了。而且大型编程项目对token的消耗量是极高的,在各种agent爆发的当下更是如此。所以AI编程是目前大模型盈利远景的救命稻草,Anthropic公司更是借此获得了近万亿估值。
各种互联网公司目前疯狂消费token,降本增效的狂热幻想当然是最大动力。但具体到硅谷大厂们来说,因为这些大厂手里普遍都拿着不少AI公司的原始股,所以它们炒作AI编程取代人工,大量花钱买token并不心疼,毕竟这些AI公司一旦上市,它们将获得巨额股价回报。
但起码就目前来说,大模型在编程方面能彻底取代程序员的前景是很可疑的。这两年美国就业市场的确因为AI被严重冲击,但按照美国最近的就业统计,在各大公司狂烧token的背景下,美国软件工程师就业行情反而有所改善。
首先这波AI裁员潮和美国疫情之后放水政策导致的过度招聘有关,而且被裁的很多并不是程序员。更为根本的是,虽然现在的大模型拥有极强的编程能力,但依然是程序员本身的能力越强,效果才越好,外行用AI写写小程序和简单项目完全没问题,但面对复杂项目还是玩不转。
最近因为AI的普及,很多原来业务不涉及复杂软件服务的公司也有了野心,纷纷启动各种项目。然后这些本身没有技术底蕴的公司马上就会发现,光靠AI写代码是不行的,还是要招聘程序员。这是美国最近程序员就业反弹的主要原因,当然,再就业的程序员待遇能不能比得上大厂就是另一个问题了。
与此同时,越来越多的大厂也发现,AI编程带来的降本增效效果远比事前想象的要差。所以AI编程的商业前景并没有现在资本市场炒作得那么明朗。于是最近又有一种观点为AI编程提出了更美妙的前景,认为比起让AI花大代价进一步理解充满不确定性的人类思维,可能让AI完全掌握规则清晰固定的机器语言的代价会小不少。
更进一步,如果AI能完全掌握编程,并通过各种智能体学会完全控制人类的各种终端和系统,甚至扩展到具身智能,那么也能勉强算是实现AGI了。当前的agent热也是这种观点的体现,这也是前文那些恐慌性舆论背后的一种认知因素。
问题是,先不说在现有技术路线下,想达到这一目标还需要花多少时间烧多少钱。假如真实现了,那毫无疑问,绝大部分程序员就真的要被干掉了。按照目前估计,想要保证人工智能投入的收支平衡,在2030左右需要达到年收入2万亿美元。但目前硅谷所有人的工资加上印度软件外包产业,也就是年一万亿的水平。
也就是说,把硅谷和印度的程序员全裁了,还得有一半的盈利缺口,剩下的缺口还要再让起码几千万人失业才能填上。今天的美国和其附属国家们真的扛得住这种毁灭性的失业冲击吗?真要到这一步,扔向山姆奥特曼别墅的可就不是燃烧瓶了。
所以美国大模型编程能力的暂时领先,根本不是什么中美AI竞争的“胜负手”,反而在这方面越发展,越可能让美国社会,乃至整个西方世界变成火药桶。
实现算力突破仍是中国AI发展的当务之急
看看美国精英们的为所欲为,看看硅谷AI右翼们狂热自大的样子,我们就不难明白,在火药桶彻底点燃以前,美国的统治阶层根本没有动力去解决AI发展带来的社会矛盾。由于美国金融和互联网霸主的地位,他们还会将这种矛盾输出至全世界。
为了避免这种悲剧性前景,作为目前世界上唯一一个真正能负起责任的大国,中国尽快突破AI领域的最后瓶颈,彻底破除美国的AI神话是极其有必要的。中国社会当然也会不可避免的受到AI发展带来的种种冲击,这点我们在之前的文章中多次讨论过,但同时,我们也有能力,有意愿在这一过程中直面和解决AI带来的各种问题,乃至最终构建出一套AI时代社会持续发展的新范式,这也是中国作为负责任大国的职责所在。
这个任务首先还是要着落在算力突破上。这次特朗普访华后,一开始传言的“H200入华”并没有实现。事实上,这个窗口期不会存在很长时间。这不光是因为现在国内正坚定的走自主研发的道路,也是因为当前特朗普在AI相关的承诺上根本没有任何信用效力。
先不说美国一些智库和媒体对中国AI能力的“捧杀”,以当前美国的各种反华势力正在大力鼓吹和中国进行“AI决战”的架势,芯片方面的销售协议怕不是三个月就得被抵制作废。
国产GPU目前面临三方面限制,先进制程,产能和生态。其中产能和生态的限制现在来说没那么大了。首先是生态,这方面之前被很多人认为是最难解决的,但现在可能是最好解决的了。一方面是中国市场足够大发展足够快,生态总归是用出来的;另一方面就很幽默,以前涉及到GPU内核的代码只有少数专业人士才能实现,但现在大模型的编程能力使得这方面技术门槛降低,生态跨平台的成本也随之显著降低了。
产能问题也可以逐渐解决。按照某些开源情报的评估,之前国内企业购买的进口光刻机的产能,实际上远远没有完全发挥出来。限制产能的不是光刻机,反而是其他领域,好在这些领域的国产化速度比较快。同时,国产的DUV光刻机进度显然也会比EUV更快。
最难的就是先进制程。当下DUV的多重曝光收益已经到了极限,传统方式很难继续下去。而EUV技术的复杂程度使得就算造出了机器,也未必能直接用来制造芯片。哪怕是ASML,在正式交付EUV光刻机之前,也有一代产品造出来但是没有投入市场。
虽然中国凭借电力上的充沛,可以用规模效应抵消芯片在最先进制程上的差距,但制程差距太大肯定也是不行的。华为这次提出来的“韬定律”就是解决先进制程限制的重大突破。
“韬定律”的突破性意义
正如本文开头所说,对“韬定律”到底是不是一种定律的概念性争论并不重要。逻辑折叠的确是本次“韬定律”蓝图中的关键技术,但两者并不完全等同。“韬定律”从整体上来说是华为综合了很多技术经验后,对未来芯片发展的一个展望性总结。
一些舆论以其他半导体公司也有类似逻辑折叠的探索为理由否定“韬定律”的创新性,这也欠缺说服力。面对半导体制程发展的减缓,芯片制造企业必然会尝试寻找其他的路径。而半导体技术发展到了如今这个地步,可供探索的新方向目前也就只有那么几个。除了国外一些半导体企业,国内像长江存储也选择了探索和国际主流不一样的技术路线,它家的Xtacking技术思路和华为有些类似,但是具体工艺上差异相当大。
问题是从技术探索到生产落地,中间经常隔着很远的距离。在过去的几十年里,提高逻辑芯片性能虽然有很多方式,但提高制程一直是最简单最有性价比的方式,所以海外一些公司就算做出了探索,也很难有动力去应用到实际生产。以华为为代表的国产芯片公司因为先进制程受限,所以提前选择这个路线也是水到渠成。
而且那些没受制裁的企业目前继续推高制程的难度也越来越大。像台积电在探索下一代制程的过程中,并没有使用ASML的下一代High-NA EUV光刻机,而是用老的EUV搞低效的多重曝光,因为新一代技术的可靠性和性价比都值得怀疑。
以这样的趋势来看,各家先进半导体公司未来大概都会尝试类似的路线,无非是中国企业先迈出了一步。如果华为真能在新技术路线上率先实现量产,那么占据这一领域的定义权也是无可厚非的。当前阶段的中国正需要在各种领域树立我们的定义权。
虽然逻辑折叠确实不是前所未见的技术,但这也有好处,这类技术和现有的半导体技术继承关系比较大,可以快速投入应用,这也是华为宣布相关产品今年就可能落地的原因。之前有个讨论很广的光刻机替代方案叫做光刻厂,从理论上并非不行,但是想要满足这个系统的运行,半导体生产线就需要重做,这种技术就很难快速投入应用了。
而且从公布的论文中看,华为的逻辑折叠比AMD的X3D技术复杂很多,因为需要重新设计整个芯片的结构,而不是加一层存储层那么简单。从逻辑芯片的3D化来说,华为提出的路线显然是更进一步的,这也算是一个不小的范式革命了。
这也足以证明,虽然在先进光刻领域我们还受到很多限制,但是在其他方面的进步速度是喜人的,没有这些领域的进步也支持不了“韬定律”的创新。同时,这条路线也面临几方面的困难,如果华为在未来都能将之攻克,那么就真的可以称为划时代突破了。
首先这种3D化的结构要求重新建立芯片的设计理念,因为用传统设计进行逻辑折叠会带来不可接受的延迟,所以必须要用特别优化后的互联设计把延迟降到最低,设计难度很大。目前无论是相关工程软件或是人工智能,对这方面的设计都存在盲区。
然后是散热问题。无论怎么说,逻辑折叠都会带来更多的热量,传闻华为为了这款芯片设计了全新的散热系统。但这还不是最大的问题,毕竟手机的芯片功率只有几瓦,如果要把这种技术用在GPU上,难度就大很多了。毕竟GPU的功率有几百瓦甚至是上千瓦,对散热的要求高太多了。
所以在华为的路线图里可以看到,昇腾系列GPU用上这个技术的时间明显比手机芯片更晚,这应该和散热有些关系。而逻辑折叠继续发展下去,未来可不止两层逻辑芯片,到时候散热应该怎么做又是全新的挑战了。
最后是产能问题。逻辑折叠技术不仅需要复杂的芯片设计,还需要比当下更复杂的先进封装技术,在早期究竟能腾出多少产能来生产这类芯片实在很难说。如果用来制造GPU,还需要晶圆上有大面积的无缺陷区域,这也意味着更高的良率要求。
说到这里,笔者也不建议拿华为的路线图来推测国产EUV落地的情况。毕竟“韬定律”的路线图相当复杂,就算造出国产EUV,也未必会第一时间用在这上面。按照我国半导体的发展方向,初代的EUV很有可能先用在存储芯片上,迭代之后再逐步用在先进逻辑芯片上。
如今摩尔定律正面临失效,传统制程技术正在接近天花板,未来逻辑芯片必然会向着3D化发展。当下存在的这些困难都不是阻碍技术发展的理由,而中国庞大的芯片市场,也足以给攻克这些技术难关提供强大的动力。
正如我们之前在文章中多次强调过的,中国当前无论发展AI还是搞载人航天,目的都不是为了与美国进行竞争;相比起美国,中国在这些领域的投资理性也是有目共睹。但奈何在这两个领域美国都摆出了要和中国决战的姿态,绝不容许中国在这两个领域超过美国。可以说,当美国的工业能力陷入体系性的衰退之后,就开始愈发迷恋“决战兵器”式的逻辑。
既然如此,我们也唯有努力尽快彻底突破美国的技术封锁。与美国的竞争对我们并不重要,但替广大后发国家彻底打碎美国的技术神话,将技术的解释权和发展权掌握在第三世界手里则是非常重要。而由于美国当前ALL in AI式的极度狂热情绪,在这个领域实现彻底的超越,对打碎美国技术神话的作用将是决定性的。等国产算力瓶颈彻底实现后,这一天就很近了。
期待更多的“韬定律”出现。