来源:环球时报
日前,国产大模型DeepSeek V4正式发布,引发国内外高度关注。从技术层面而言,新版本性能进步显著,多项指标在开源模型中位列第一,已经接近主流闭源模型水平。在定价说明中,有一行注释小字写道:“受限于高端算力,目前Pro的服务吞吐十分有限,预计下半年昇腾950超节点批量上市后,Pro的价格会大幅下调。”这意味着V4未来的算力扩容与成本下降,绑定的是华为昇腾芯片。这一细节受到外界的格外关注。
在此之前,官方技术报告首次将华为昇腾NPU与英伟达GPU并列写入硬件验证清单,寒武纪、摩尔线程等8家国产芯片厂商在模型发布当天就完成适配。这些细节与V4这一说明相互印证,表明一条从芯片到框架,再到应用的国产AI技术链条,已悄然完成高水平闭环。此前备受质疑的国产芯片与软件生态也已基本成型。
平台与生态的意义,远超模型一时的性能高低。英伟达CEO黄仁勋近日在播客访谈中直言:“如果DeepSeek V4先在华为平台上发布,那对我们国家来说将是灾难性的。”
黄仁勋真正担心的,是英伟达多年构筑的CUDA护城河被突破。所谓CUDA护城河,可以简单理解为一种绑定:开发者使用英伟达GPU开发AI模型,其所写的代码、训练的模型都会绑定在CUDA生态中。迁移到其他芯片平台无异于推倒重来,成本极高。凭借海量用户与长期积累,CUDA生态的垄断性甚至超过Windows在操作系统领域的地位。不少美国企业曾试图挣脱,最终都铩羽而归,只能继续承受英伟达GPU的高溢价。全球范围内,也仅有谷歌凭借TPU十余年的独立演进,算是真正摆脱了这一束缚。
此前,中国大模型企业也多数是CUDA生态的深度用户。由于先进算力芯片被“卡脖子”,中国企业反而练就了将有限性能压榨至极致的功力。同时,中国企业也越来越意识到,芯片“卡脖子”终究只是“有没有”的问题,而软件生态解决的则是“能不能自己说了算”的问题。两者缺一不可,但后者才是摆脱长期依赖的关键。
正因如此,DeepSeek的选择与中国企业的配合,才具有风向标意义。一方面,DeepSeek的产品能力和价格竞争力毋庸置疑。另一方面,DeepSeek作为开源模型,合作界面开放、部署灵活,生态活力远超闭源系统。任何芯片厂商都可以针对V4进行适配优化,这也是寒武纪、摩尔线程等国产芯片能完成“Day-0”适配的基础。
本质上,DeepSeek与国产芯片的合作,提供了CUDA之外的另一个选项。V4的预训练阶段仍然使用英伟达GPU,模型也完全兼容CUDA生态,充分表明国产模型并无意与CUDA决裂,也充分照顾到了用户的需求。与此同时,DeepSeek凭借坚持开源,将针对性优化、适配的权利完全分享,就是希望用兼容和开放打开生态壁垒。
这番努力的意义,不在于几家企业、厂商的突围,更在于为全球AI产业提供了一种新的可能:一个不被单一厂商锁定、多元共存的开源生态,是可以跑通的。
回顾AI的发展历程,从操作系统到云计算,技术生态的建立最终总是指向封闭与垄断。CUDA的成功也是这种逻辑的产物,而它形成的壁垒,与当前整个产业正在追求的低成本、高普及性存在根本分歧,也束缚了全球AI产业的创新活力。
以DeepSeek V4为代表的中国开源模型传递出一种截然不同的信号。它们不追求取代CUDA,也不打算成为新的壁垒,而是要证明另一条路,一条开放代码、开放适配权,让任何有能力的芯片厂商和云服务商平等接入,把选择权交还给开发者和用户的道路。这条路的尽头不会有新的垄断生态,而是一个真正社区共建、由市场选择的多元格局。
中国企业正在迈出的,或许是打破闭源藩篱、构建全球开源AI生态的关键一步。在这个意义上,我们看到的不是用一堵墙去推倒另一堵墙,而是打开一扇可以自由通行的门。门的背后,是一个算力来源多元、技术选择自由、合作多于对抗的新格局。(作者是科技与战略风云学会研究员)