
6月23日,国际超算大会ISC2026现场,新一期全球超级计算机TOP500榜单揭晓——中国超算“灵晟”(LineShine)以2.198EFlops的持续双精度浮点性能登顶榜首,成为世界上首台持续性能突破2EFlops的超算系统。
这是自2017年“神威·太湖之光”之后,中国超算重返世界之巅。
2.198EFlops到底有多快
EFlops是衡量算力规模的性能单位,表示每秒1018次(一百亿亿次)浮点运算。“灵晟”的2.198EFlops,就是每秒219.8亿亿次计算。
很多人不理解这个算力到底有多牛,央视给出通俗算力类比——灵晟1秒钟的运算总量,等同于全球70亿人每人每秒完成1次基础运算,昼夜不停整整十年才能完成同等工作量,家用电脑则需要数十万年才能跑完它单日的计算任务。
这个量级的算力,对应的是大气海洋模拟、核聚变装置建模、新药分子筛选、脑科学图谱构建、科学大模型训练这类问题。
不走GPU路线的“反向操作”
近两年,全球E级超算领域基本是美国领跑,且技术路子高度一致:CPU+GPU异构,靠英伟达系加速卡堆性能。“灵晟”偏偏反着来——首创“在线加速”全CPU架构,靠国产LX2处理器跑出世界第一。
简单来说,“灵晟”直接把AI矩阵加速单元做进CPU里,依托国产LX2 CPU,既跑双精度科学计算,又扛AI训练的半精度/整数运算,还集成了国产高带宽内存HBM,等于把GPU的那部分活儿在CPU内部消化掉了。
“灵晟”系统总设计师、国家超算深圳中心主任卢宇彤解释,在线加速的全CPU架构,打破传统CPU-GPU异构架构壁垒,内嵌AI矩阵加速单元,回归计算加速的本质,实现超算智算等多种计算模式的高效协同。
全栈自主意味着什么
2017年,“神威·太湖之光”登顶全球超算榜,是芯片单点突破;9年之后的“灵晟”,从处理器、互连网络、存储系统到整机架构,已经全是国产自研了。
目前,“灵晟”已经在大气海洋、工程仿真、材料、药物发现、脑科学、科学AI、大模型推理等多领域得到应用,还可以把整机全部算力调动起来,一次性开动上千万个计算核心,集中处理同一个超大型科研任务。
全球超算之争表面是榜单刷分,实际比拼的是国家能不能自己造出“科学发现的发动机”。行业人士认为,“灵晟”迈过了2EFlops这道坎,而且是用一条跟美系GPU异构完全不一样的架构——这显然比“第一”本身更有看头。