“灵晟”刷新世界算力新高度

6月23日，国际超算大会ISC2026现场，新一期全球超级计算机TOP500榜单揭晓——中国超算“灵晟”（LineShine）以2.198EFlops的持续双精度浮点性能登顶榜首，成为世界上首台持续性能突破2EFlops的超算系统。

这是自2017年“神威·太湖之光”之后，中国超算重返世界之巅。

2.198EFlops到底有多快

EFlops是衡量算力规模的性能单位，表示每秒1018次（一百亿亿次）浮点运算。“灵晟”的2.198EFlops，就是每秒219.8亿亿次计算。

很多人不理解这个算力到底有多牛，央视给出通俗算力类比——灵晟1秒钟的运算总量，等同于全球70亿人每人每秒完成1次基础运算，昼夜不停整整十年才能完成同等工作量，家用电脑则需要数十万年才能跑完它单日的计算任务。

这个量级的算力，对应的是大气海洋模拟、核聚变装置建模、新药分子筛选、脑科学图谱构建、科学大模型训练这类问题。

不走GPU路线的“反向操作”

近两年，全球E级超算领域基本是美国领跑，且技术路子高度一致：CPU+GPU异构，靠英伟达系加速卡堆性能。“灵晟”偏偏反着来——首创“在线加速”全CPU架构，靠国产LX2处理器跑出世界第一。

简单来说，“灵晟”直接把AI矩阵加速单元做进CPU里，依托国产LX2 CPU，既跑双精度科学计算，又扛AI训练的半精度/整数运算，还集成了国产高带宽内存HBM，等于把GPU的那部分活儿在CPU内部消化掉了。

“灵晟”系统总设计师、国家超算深圳中心主任卢宇彤解释，在线加速的全CPU架构，打破传统CPU-GPU异构架构壁垒，内嵌AI矩阵加速单元，回归计算加速的本质，实现超算智算等多种计算模式的高效协同。

全栈自主意味着什么

2017年，“神威·太湖之光”登顶全球超算榜，是芯片单点突破；9年之后的“灵晟”，从处理器、互连网络、存储系统到整机架构，已经全是国产自研了。

目前，“灵晟”已经在大气海洋、工程仿真、材料、药物发现、脑科学、科学AI、大模型推理等多领域得到应用，还可以把整机全部算力调动起来，一次性开动上千万个计算核心，集中处理同一个超大型科研任务。

全球超算之争表面是榜单刷分，实际比拼的是国家能不能自己造出“科学发现的发动机”。行业人士认为，“灵晟”迈过了2EFlops这道坎，而且是用一条跟美系GPU异构完全不一样的架构——这显然比“第一”本身更有看头。