AI硬件史诗级暴涨！算力“延安”更香了

科大讯飞的自主之路正吸引越来越多的追随者，国产算力正快速从可用向好用转变。

文/每日资本论

5月6日，中国资本市场上演了一场令全球投资者瞩目的AI硬件盛宴。科创50指数一度飙涨超过9%，最高触及1715.08点，距离历史最高点咫尺之遥。权重股集体井喷，海光信息以20cm涨停，寒武纪则迈过1900元/股大关。而此前一日收盘的数据宝AI应用50强榜单中，世纪华通与科大讯飞以千亿级市值名列前茅。

这一波行情的推力之一源于大洋彼岸。不久前，纳斯达克指数创下了历史新高，标普500指数刷新收盘纪录。美光科技CEO Sanjay Mehrotra在CNBC上直言，AI产业仍处于“early innings”——只是早期阶段。他认为，随着推理规模扩大，Token需求将持续攀升，而当前产业面临的核心矛盾并非需求或定价，而是供给本身的极度紧张且无法快速扩产。

有意思的是，有着美股“AI之王”英伟达的股价却在近日连续下挫。部分网友留言道，“讯飞业绩说明会，提及在国产算力华为950上训练出更大参数的模型，英伟达股价应声大跌。”

话或有调侃，但包括中国投资者在内的全球资本已经用脚投票宣告：算力就是新石油，内存才是硬道理。更为重要的是，网友的眼睛是雪亮的——科大讯飞在全国数千家上市公司中，看似普通的市值与排位背后，隐藏着一个极不平凡的事实：它是目前中国主流大模型中唯一一家坚持在全国产算力上完成全栈模型训练的厂商。

敲黑板！在资本市场上，部分投资者对全国产算力的认知常有偏颇：不少人认为只要在国产芯片上跑通推理便是自主可控，将“适配”误读为“训练”。但科大讯飞团队给出的答案清晰得如同数学公式——训和推，是两道难度截然不同的考题。能够轻松应付第二道，不代表就能解答第一道。只有同时完成两者，才称得上全栈自主可控。

在这个投资者将AI芯片视为战略资产的时代，在绝大多数同行仍在竞相囤积英伟达显卡、将国产算力当作“备胎”的当下，科大讯飞选择了这条没有退路的路，不仅避开了海外算力依赖的风险，更在技术突破与商业落地中展现出独特的竞争优势。正如股吧里的网友评论一样：“我来了，仰望吧！”

打造算力“延安”

故事要从两年前说起。2023年10月24日，科大讯飞在星火大模型发布会上首次明确提出“全国产算力训练”的技术路线，彼时行业内多数企业仍将海外算力视为大模型训练的唯一可行选择。这一决策并非一时冲动，而是基于对AI产业发展规律与国家战略需求的深刻洞察。

“能用国芯训出大模型才有未来。”科大讯飞董事长刘庆峰在多个场合强调这一观点。但训，从来比推更难。推可以像一个翻译家在台上流畅背诵演讲稿，训则是从零开始学习一门外语——需要大量试错、反复调校，稍有偏差便前功尽弃。这或许是国产算力生态系统中最不为外界所知的“硬骨头”。

而科大讯飞啃下的正是这块骨头。在华为昇腾910B集群上，科大讯飞经过了漫长的磨合与攻关。拆开来看，910B与英伟达H200芯片之间存在显著的硬件差距——前者的显存容量仅为64G，后者为141G；带宽方面，1.6TB/s与4.8TB/s的差距意味着数据传输效率几乎落后一半。这还不是全部。在远程带宽、多卡互联稳定性、对FP8等低精度格式的支持能力上，国产芯片与英伟达最新一代B系列芯片相比，更是被拉开了数代的距离。

如果说在英伟达的CUDA生态上训练大模型，像是开着一台自动挡轿车上了高速，那么在全国产算力上做同样的事，就像要自己从头组装一辆赛车，再开上一条尚未完全贯通的山路——随时可能遇到猝不及防的堵点和断层。

正是这样的现实，让绝大多数中国AI公司仍然选择在英伟达平台上完成模型训练，只在推理环节做本地化适配。这不是一个简单的商业选择，而是一个务实的技术路径。

但科大讯飞坚持走了另一条路。“过去几年我们联合华为做了非常多的国产化适配和创新工作。”刘庆峰在业绩说明会上回顾，“从开箱状态下的训练效率不足同规模A800集群的30%，到去年在910B集群上攻克长思维链强化学习和首个昇腾原生MoE（混合专家模型）的全链条训练效率难题，我们将训练效率分别提升至84%和93%。”

4月29日，科大讯飞还发布了一款备受瞩目的模型——星火X2-Flash。这款采用MoE架构、总参数30B的模型不仅完全基于华为昇腾910B集群训练完成，更在关键性能指标上实现了一项看似不可能的突破：它在深度研究报告、Skill管理与调用、系统控制与执行等多类智能体最常用任务上的效果，居然接近了业界万亿级参数模型的水平。

这就好比一个轻量级拳手打出了重量级拳王的力量。

其背后的技术密码，藏在三个层面。首先是数据。针对智能体数据轨迹长、逻辑复杂等难题，科大讯飞在国产算力上搭建了可自验证的星火大规模智能体数据自动合成平台。这个平台的独到之处在于，它依赖Agent自主搭建环境、检测结果准确性，形成了高效的数据闭环——不是人类给机器标注答案，而是让机器自己为自己建立验证标准。

其次是模型结构。这是科大讯飞在国产算力上首度实现DSA（稀疏注意力）与MTP（多token预测）结合的长文本高效训练，将上下文窗口拓展至256K。效果是惊人的——通过亲和国产芯片的算子和分布式训练策略的深度优化，训练效率与同规模A800集群相比，大幅提升。相当于以前要等五天的训练任务，现在一天多一点就能跑完。

最后是在智能体强化学习训练场景，通过算法创新与工程创新的叠加，采样推理效率在非DSA结构的基础上提升了2倍以上。这一突破帮助缓解了910B在长交互场景下采样效率过低制约强化学习训练的问题，为后续的大规模对齐训练扫清了关键障碍。

如今看来，这项工作从技术上对讯飞来说已经没有任何壁垒，但达成这句话背后的道路，是讯飞团队跨越的一个个技术鸿沟与“从0到1”的突破。

自主之路的商业可行性

当然，要达成技术突破持续高强度的研发投入必不可少。2025年公司研发投入金额达53.64亿元，同比增长17.12%，占营收比重高达19.79%。这一比例远超行业平均水平，即使在人工智能自主可控保持高强度投入的背景下，科大讯飞仍然实现了全年营业收入、毛利、归母净利润、扣非净利润、经营性现金流净额等各项核心经营指标的正向增长，展现出技术投入与商业回报的良性循环。

科大讯飞2025年年度的财报显示，其实现营收271.05亿元，同比增长16.12%；归母净利润8.39 亿元，同比大增49.85%；扣非净利润2.64亿元，同比增长40.47%。更为亮眼的是，销售回款总额超过274亿元，较去年同期增长超过45亿元，报告期末经营活动产生的现金流量净额32.08亿元，两项均创历史新高，彰显了业务的强劲活力与良好的现金流管理能力。

进入2026年一季度，科大讯飞收入、毛利、归母净利润均持续改善。一季度实现营收52.74亿元，同比增长13.23%；当期回款金额达57亿元，再次超过当期收入。此外，公司合同金额同比增长28.16%，境外收入同比增长167%，业务继续保持良好的发展态势。

值得注意的是，科大讯飞出海业务在2025年实现规模化增长，围绕数字营销、AI 硬件、多语种技术授权与B端产品方案等核心业务，聚焦东南亚、中东、美国、日韩等关键市场，实现营收同比暴增275%，增长态势强劲。这一成绩打破了“国产算力大模型难以走向国际市场” 的刻板印象，证明了自主可控技术路线同样具备全球竞争力。

从模型训练到应用落地的全链路贯通

令人惊喜的是，科大讯飞的自主之路并非闭门造车，而是构建了一个开放共赢的生态体系。

依托星辰 MaaS 底座及星火大模型，讯飞开放平台三方开发者大模型日均Tokens调用量同比增长4241%，三方开发者调用量实现跨越式增长，截至2026年3月底，这一数据仍在持续攀升。公开资料显示，国内目前日均Token调用量已经超过140万亿，比2024年初1000亿，两年增长超千倍。也因此，甚至有人认为台积电的芯片产能已经成为全球AI发展的瓶颈。

面对推理算力需求的井喷式增长，科大讯飞通过“软硬一体”战略提升效率。星火X2 依托讯飞“飞星二号”全国产智算训练平台，从数据采集到推理部署全链路采用国产算力，通过量化优化使单台昇腾服务器即可运行，大幅降低企业部署门槛与成本。在行业场景深度适配方面，基于X2 底座的医疗大模型在智能健康分析、报告解读等任务中达到、超越国际主流模型，展现出国产大模型在垂直领域的独特优势。

在AI应用落地方面，科大讯飞形成了“技术突破-行业适配-商业落地”的闭环。2025年，“星火行业分析师”成为国内首个通过工信部考试认证的行业分析AI应用，在《大数据分析师技术水平考试》中得分92分，超过85%的人类考生，标志着AI技术在专业领域的应用达到新高度。同时，公司以AI场景化落地作为技术研发重要方向，以AI Agent技术为核心抓手，打破“技术与业务脱节”的行业痛点，在教育、医疗、汽车等领域创造了真实价值。

这种生态构建的价值在AI应用市场中日益凸显。数据宝在AI应用概念板块中统计出AI应用50强股票，科大讯飞与世纪华通均以超千亿元市值位居榜首，市值最低的华凯易佰也在 50亿元以上，反映出市场对 AI 应用商业化前景的高度认可。多家券商表示，从中期来看，产业趋势向上的科技成长等高景气领域仍是重要方向，政策支持与产业突破共振，AI科技依然是A股的行业主线，未来AI应用落地有望加速。

量子计算+AI的颠覆性突破

站在算力革命的十字路口，刘庆峰对未来有着清晰的判断：“如果未来AI算法能与量子计算结合，那么有望一次性解决算力瓶颈与电力消耗问题，一台设备就能完成现在所有训练与推理需求。”他预测，未来5年左右，量子计算+AI有望出现重大颠覆性突破，这将彻底改变当前AI产业的算力格局。

在此之前，科大讯飞将进一步巩固“自主可控、行业落地、软硬一体、多语种”的独特战略生态位。2026年，科大讯飞将继续加大对国产算力的投入，优化“飞星二号”智算平台，提升训练效率与模型性能，同时推动星火大模型在更多行业场景的深度应用，特别是在教育、医疗、汽车等优势领域，打造更多标杆案例。

随着国产算力技术的不断成熟，科大讯飞的自主之路正吸引越来越多的追随者。国内市场方面，国产大模型DeepSeek V4宣布全面适配华为昇腾NPU，成为首个在官方文档中完成国产芯片认定的万亿参数模型，成功验证了昇腾承载顶级大模型的技术实力。这一趋势表明，国产算力正在从“可用”向“好用”转变，为中国AI产业的自主发展提供了坚实基础。

“唯一”这个词从来都分量极重。在经历了海外算力被反复卡脖子的窘境后，在中国企业越来越将自主可控视为生存底线的当下，这条独行、漫长却又日益宽广的道路，正从当年被认为的“备胎路线”，逐渐成长为AI本土化的战略航道。如果说几年前，人们还在追问“为什么要选择全国产算力”，那么今天的问题已经变成了“为什么还不选择全国产算力？”

【文章只供交流，并非投资建议，请注意投资风险。码字不易，若您手机还有电，请帮忙点赞、转发。祝，各位看官2026怀揣喜乐之心，迎接新年光景，积攒岁岁福气，奔赴四季顺遂！】