国产GPU新势力沐曦:IPO进度和技术布局

  芝能智芯出品


  沐曦集成电路(上海)股份有限公司披露了首轮问询函的相关回复,这家公司之前向上交所科创板提交了上市申请,计划募资39亿元,拟发行不超过4010万股。


  作为国内GPU领域初创企业,沐曦也是被看好的一位玩家,聚焦人工智能训练、推理和通用计算方向,推出了曦云C系列、曦思N系列和曦彩G系列产品,逐步建立起自己的技术路线。


  由于竞争激烈,目前尚未盈利,现金流压力较大,且在晶圆代工、HBM存储和EDA工具方面仍依赖海外供应商,还是有空间去拓展的。


国产GPU新势力沐曦:IPO进度和技术布局


  当然在目前的AI硬件缺少定海神针的情况下,需要多一些企业参与这个攻关,特别是GPU集群已成功支持国产类脑大模型SpikingBrain的训练与推理,这还是一家非常值得我们关注的企业。


  我们可以从技术和产业两个角度,梳理沐曦的产品进展、研发情况、实际应用及面临的问题。


  Part 1

  沐曦GPU技术布局与产业化进展


  沐曦成立于2020年,采用Fabless(无晶圆厂)模式,专注于GPU芯片的设计、研发和销售,并配套提供软件栈和计算平台,目标是构建从硬件到生态的完整解决方案。


  与传统以图形渲染为主的GPU厂商不同,沐曦从一开始就将重点放在人工智能和通用计算上,尤其是大模型训练、推理以及智能计算中心的应用场景。


国产GPU新势力沐曦:IPO进度和技术布局

国产GPU新势力沐曦:IPO进度和技术布局


  ● 产品体系与技术演进


  沐曦目前的产品分为三大系列:


  ◎ 曦思N系列:主打推理加速,强调能效比和低延迟,适用于边缘设备和在线服务场景。


  ◎ 曦云C系列:支持训练和推理一体化,同时兼顾通用计算任务,是当前主要收入来源。其中C500系列于2023年实现商业化后,收入增长明显,已在多个智算中心部署使用。C600和C700正在研发中,目标是进一步提升算力和互联能力。


  ◎ 曦彩G系列:面向图形渲染市场,目前仍在研发阶段,未来希望补足传统图形应用短板,增强产品的通用性。


国产GPU新势力沐曦:IPO进度和技术布局

国产GPU新势力沐曦:IPO进度和技术布局


  曦云C500采用训推一体架构,集成了高带宽显存通道,适合大规模矩阵运算,在实际部署中可以减少客户对多类型硬件的需求。


  2024年,公司还启动了万卡级集群的研发,为更大规模的MoE类大模型训练提供支持。

国产GPU新势力沐曦:IPO进度和技术布局


  ● 工程应用与生态适配


  截至目前,沐曦GPU累计出货超过2.5万颗,已在国内外多个AI算力平台和智算中心落地。除了销售芯片外,公司也在向板卡、服务器乃至一体机等整机方案延伸。2024年数据显示,板卡收入占比接近七成,服务器占三成左右,显示出向整体解决方案转型的趋势。


  软件生态方面,沐曦也在积极适配国产AI框架和主流开源体系,优化编译器、驱动程序和算子库,并提供行业专用SDK,帮助客户降低迁移成本。虽然生态建设还在初期,但已有一定进展。


  ● 产业化瓶颈与资金压力


  这家公司的情况,也是营收增长较快——从2022年的42.64万元增至2025年一季度的3.20亿元,报告期内累计净亏损超过30亿元,现金流持续紧张。


国产GPU新势力沐曦:IPO进度和技术布局


  主要原因包括:


  ◎ 研发投入高:GPU研发周期长,流片成本高,迭代频繁,导致长期投入巨大。


  ◎ 股权激励支出大:过去几年股份支付费用接近6亿元,加重了财务负担。


  ◎ 供应链预付款压力:为保障晶圆和HBM供应稳定,公司需提前支付大额货款,占用了大量流动资金。


  目前收入高度依赖曦云C500系列,2024年该系列产品贡献了超97%的营收。产品结构单一,加上关键材料和制造环节依赖外部,抗风险能力较弱。


国产GPU新势力沐曦:IPO进度和技术布局

国产GPU新势力沐曦:IPO进度和技术布局


  Part 2

  国产GPU集群

  与类脑大模型的进展


国产GPU新势力沐曦:IPO进度和技术布局


  沐曦的技术价值在与中国科学院自动化所合作的SpikingBrain-1.0类脑脉冲大模型项目中得到了验证,体现了国产GPU在新型AI架构探索中的可能性。


国产GPU新势力沐曦:IPO进度和技术布局


  SpikingBrain-1.0包含7B和76B两个版本,基于脉冲神经网络(SNN),不同于主流的Transformer架构。


  其主要技术特点包括:


国产GPU新势力沐曦:IPO进度和技术布局


  ◎ 混合注意力机制:7B版本采用线性注意力与SWA层间混合,76B则实现层内并行混合,融合softmax、线性和SWA机制,兼顾全局与局部信息处理。


  ◎ 稀疏化MoE结构:通过引入混合专家模块(MoE),并结合Upcycling技术,在减少计算量的同时保持模型性能,提升参数利用率。


  ◎ 自适应阈值神经元:改进传统LIF模型容易陷入激活或沉默的问题,提升模型稳定性和能效表现。


  模型仅使用主流模型约2%的训练数据,但在多项任务中性能达到甚至超过90%,尤其在百万token级别的长序列推理中,延迟显著降低。


  SpikingBrain的训练和推理全过程都在沐曦曦云C550 GPU集群上完成,连续运行两周未出现中断,这一结果说明:


国产GPU新势力沐曦:IPO进度和技术布局


  ◎ 国产GPU已具备支撑大规模AI训练的能力,不再是实验室级别的验证。


  ◎ 在适配新型AI架构方面具有潜力,尤其在长序列处理和能效优化上有优势。


  ◎ 从芯片、软件到模型的国产化链条正在形成闭环,自主可控程度有所提升。


  测试数据显示,SpikingBrain在推理阶段表现突出:首token生成时间下降96.2%,FP16精度下的能耗降低97.7%。


  这种高能效特性使其特别适合法律文书分析、医学文本处理、DNA序列比对等需要处理超长输入的任务。


  这为沐曦GPU打开了新的应用场景,增强了市场说服力。结合新兴AI架构,国产GPU或许能找到一条差异化的竞争路径。

  

  小结


  沐曦为代表,国产GPU企业正借助资本市场加速技术研发和生态建设。


  从曦云C系列的商业化落地,到支撑SpikingBrain这样的前沿模型,沐曦展示了技术和产业结合的可能性。


  长远来看,GPU不仅是大模型的底座,也将应用于自动驾驶、工业仿真等多个关键领域,这没什么可多说的。