陈经：中国开源大模型改写AI格局

来源：环球时报

日前，国产大模型DeepSeek V4正式发布，引发国内外高度关注。从技术层面而言，新版本性能进步显著，多项指标在开源模型中位列第一，已经接近主流闭源模型水平。在定价说明中，有一行注释小字写道：“受限于高端算力，目前Pro的服务吞吐十分有限，预计下半年昇腾950超节点批量上市后，Pro的价格会大幅下调。”这意味着V4未来的算力扩容与成本下降，绑定的是华为昇腾芯片。这一细节受到外界的格外关注。

在此之前，官方技术报告首次将华为昇腾NPU与英伟达GPU并列写入硬件验证清单，寒武纪、摩尔线程等8家国产芯片厂商在模型发布当天就完成适配。这些细节与V4这一说明相互印证，表明一条从芯片到框架，再到应用的国产AI技术链条，已悄然完成高水平闭环。此前备受质疑的国产芯片与软件生态也已基本成型。

平台与生态的意义，远超模型一时的性能高低。英伟达CEO黄仁勋近日在播客访谈中直言：“如果DeepSeek V4先在华为平台上发布，那对我们国家来说将是灾难性的。”

黄仁勋真正担心的，是英伟达多年构筑的CUDA护城河被突破。所谓CUDA护城河，可以简单理解为一种绑定：开发者使用英伟达GPU开发AI模型，其所写的代码、训练的模型都会绑定在CUDA生态中。迁移到其他芯片平台无异于推倒重来，成本极高。凭借海量用户与长期积累，CUDA生态的垄断性甚至超过Windows在操作系统领域的地位。不少美国企业曾试图挣脱，最终都铩羽而归，只能继续承受英伟达GPU的高溢价。全球范围内，也仅有谷歌凭借TPU十余年的独立演进，算是真正摆脱了这一束缚。

此前，中国大模型企业也多数是CUDA生态的深度用户。由于先进算力芯片被“卡脖子”，中国企业反而练就了将有限性能压榨至极致的功力。同时，中国企业也越来越意识到，芯片“卡脖子”终究只是“有没有”的问题，而软件生态解决的则是“能不能自己说了算”的问题。两者缺一不可，但后者才是摆脱长期依赖的关键。

正因如此，DeepSeek的选择与中国企业的配合，才具有风向标意义。一方面，DeepSeek的产品能力和价格竞争力毋庸置疑。另一方面，DeepSeek作为开源模型，合作界面开放、部署灵活，生态活力远超闭源系统。任何芯片厂商都可以针对V4进行适配优化，这也是寒武纪、摩尔线程等国产芯片能完成“Day-0”适配的基础。

本质上，DeepSeek与国产芯片的合作，提供了CUDA之外的另一个选项。V4的预训练阶段仍然使用英伟达GPU，模型也完全兼容CUDA生态，充分表明国产模型并无意与CUDA决裂，也充分照顾到了用户的需求。与此同时，DeepSeek凭借坚持开源，将针对性优化、适配的权利完全分享，就是希望用兼容和开放打开生态壁垒。

这番努力的意义，不在于几家企业、厂商的突围，更在于为全球AI产业提供了一种新的可能：一个不被单一厂商锁定、多元共存的开源生态，是可以跑通的。

回顾AI的发展历程，从操作系统到云计算，技术生态的建立最终总是指向封闭与垄断。CUDA的成功也是这种逻辑的产物，而它形成的壁垒，与当前整个产业正在追求的低成本、高普及性存在根本分歧，也束缚了全球AI产业的创新活力。

以DeepSeek V4为代表的中国开源模型传递出一种截然不同的信号。它们不追求取代CUDA，也不打算成为新的壁垒，而是要证明另一条路，一条开放代码、开放适配权，让任何有能力的芯片厂商和云服务商平等接入，把选择权交还给开发者和用户的道路。这条路的尽头不会有新的垄断生态，而是一个真正社区共建、由市场选择的多元格局。

中国企业正在迈出的，或许是打破闭源藩篱、构建全球开源AI生态的关键一步。在这个意义上，我们看到的不是用一堵墙去推倒另一堵墙，而是打开一扇可以自由通行的门。门的背后，是一个算力来源多元、技术选择自由、合作多于对抗的新格局。（作者是科技与战略风云学会研究员）