神威超算夺冠的意义:需要以应用为导向

近年来中国的超算发展迅猛,十多年的时间竟可以赶超西方国家。国内许多大大小小的单位都不断建设自己不同规格的超算,不管有用没用,先把资金申请下来建了再说,可是结果呢?自建设起来后就没正常运行过的,应该不在少数,几年后这些设备就被当作一堆垃圾被丢弃,然后再申请经费更新设备。这是现状:资源很多,应用却很少,原因很多,其中一点是想用的人用不上,这些资源都被当做私产一样被霸占着。

这次神威的夺冠或许证明中国经济雄厚的意义更大。下面是”爱范儿”的评论文章《中国超级计算机:跑得比全世界都快,还是掩不住应用尴尬》

昨日,一台有着武侠味儿名字的超级计算机刷了各大平台的屏。但它背后的急速发展的超级计算机市场,并不像武侠小说中的江湖那么简单。

据新华社报道,6 月 20 日德国法兰克福国际超级计算机大会 (ISC)公布了新一期世界计算机 500 强榜单,我国最新的超级计算机“神威·太湖之光”登顶。最受关注的是,“神威·太湖之光”实现了核心处理器的全国产化。

“神威·太湖之光”超级计算机由国家并行计算机工程技术研究中心研制,安装在国家超级计算无锡中心。

124431528_meitu_10

运算神速

“神威·太湖之光”击败的是霸占榜首 3 年的“天河 2 号”。“神威·太湖之光”运算速度达到 93 petaflop(每秒运算一千万亿次),理论最高速达 125.4 petaflops。这一数值约为“天河 2 号”的两倍。

区别于“天河 2 号”采用的英特尔 Xeon E5-2692v2 12 核处理器,“神威·太湖之光”首次采用国产核心处理器“申威 26010”。

9300009ba8d067bbb04

新华社记者称,“申威 26010” 大小约 25 平方厘米,集成了 260 个运算核心,内置数十亿晶体管。每块“申威 26010”运算能力为每秒3万多亿次,约等于 20 台家用计算机。

然后可以做一题简单的乘法题:

  • “神威·太湖之光”由 40 个运算机柜和 8 个网络机柜组成
  • 每个柜门内有 4 块超节点
  • 每块超节点由 32 块运算插件组成
  • 每个插件由 4 个运算节点板组成
  • 每个运算节点板又含 2 块“申威 26010”处理器
  • 整台“神威·太湖之光”共有 40960 块“申威 26010”处理器

叠加之下,“神威·太湖之光”一分钟的计算能力相当于全球 72 亿人口用计算器不间断计算 32 年。

数量增速神速1463711500792327

榜单前十名除了“神威·太湖之光”与“天河二号”外,分别为美国的“泰坦”与“红杉”、日本的“京”、美国的“米拉”和“三一”、瑞士的“代恩特峰”、德国的“花尾榛鸡”和沙特阿拉伯的“沙欣II”。

 

在上榜计算机数量上,中国以 167 台超越美国 165 台成为上榜最多的国家,而这 167 台计算机全部是近 15 年研发的——2001 年前这一数字为 0 。

2016-06-21 11.21.00

“没有国家能有这速度。“排行榜主要编撰者兼美国田纳西大学计算机学教授 Jack Dongarra 接受《华尔街日报》采访说:“中国超级计算机不断增多已成为一个趋势。”

运算速度快,数量增加速度也快,除了在高中历史课本和新闻上感受到它的“快”之外,我们真的能用到这种“快”吗?

建构方式决定应用

虽然同为超级计算机,但中国和国外的建造目的存在区别。

目前我国的超级计算机主要有银河、天河、曙光、神威四个系列,除了军用的“银河 V”和“神威 Ⅱ”(在研)之外,主要应用方式都是租用。租用对象主要是高校、科研院所、商业企业等。

1_640_427

而美国超级计算机的建设方一般都是使用方。在榜单上排名第三、也是美国最快的 Titan 建设方是美国能源部,主要应用于美国能源部内部的核试验模拟。

定位不同,建设方式自然就不同。国外超级计算机建设方一般是先有计算量需求,根据所需计算量设计系统,根据需求设计超级计算机的架构方式。中国是先进行建设,尽力提高建能,尝试满足更高的计算需求。

titan-large_meitu_8

因此,“泰坦”与“红杉”等国外超级计算机用途较为单一,基本只能适配某一方向的应用,但针对性、专业性更强。而国内超级计算机则更为开放,可以匹配不同使用者的需求。

问题是,如果没法用起来,再高的计算能力只是一个让人迷醉的数字,意义在哪?

从人体血流模拟到气候预报

超级计算机的应用领域其实非常广阔,代码破解和核武器发展(核爆炸模拟)等都需要高速处理大量复杂计算。

1-130930091Q3_meitu_13

民用用途上,超级计算机可以用在气候预报,石油勘探、药物开发和汽车设计等方面。在医学领域,对人体血流进行模拟与分析,可以及时有效地判定一个病人是否会发生脑梗塞的风险,超级计算机的运算能力可以提供快速的预判。

另外,我国庞大的人口对网络公共设施造成的沉重负担也可能得到解决。

问题是从银河系列到天河系列再到神威系列,我国超算数量快速增长的这 10 年来,除了一间间看起来神秘的房间,超级计算机具体应用在哪里呢?

应用缺位+高耗能

去年 6 月《南方日报》就报道过“天河 2 号”所在的广州超算中心的“业务荒”

自 2014 年落户广州以来,广州超算中心已成为广东最大的科技基础设施,但高昂的能耗费用,宣传推广不力,国际交流与合作不足,嫁接国家重大领域的科研项目较少,应用软件开发的周期过长,人才梯队与技术支撑尚未形成系统。

去年 6 月,广州超算中心主任袁学锋透露,广州超算中心利用率为 60%。用户占比上,83% 是政府机关、高校、科研院所,企业用户只有 17%。

91006

中科院计算机网络信息中心研究员张鉴表示,我国利用超算系统解决问题的能力长期不足,相关商业应用软件仍为国外垄断。

除了资源闲置外,超级计算机的高耗能问题无可回避。

“天河二号”年耗电量达到 2 亿度,每天耗费电费 10 万元。另外,为了应对机柜因为高负荷产生的高温,广州超级计算机中心专门为“天河二号”建设了冷水厂,不间断运送 8 摄氏度的水进入超算中心的“水冷”系统。

小结

113445428_meitu_7在 2014 年接受南方网采访时,中科院超算中心主任迟学斌坦言:“脱离开发利用,超算就是一堆破铜烂铁。光有高性能机器,没有人才做高水平的服务,那效果是一样的,机器过 5 年就过时了。”

 

以我国近十年的超算数量增速来看,5 年已经足够完成一个系列研发。然而专业性的缺失,应用的缺位,并不能靠一个个“听起来爽”的超算占有量和运算速度数字去填补。

当然占有量和运算速度是一个技术指标,但我们还在追逐这些“内功”、获得各个第一的“声望”之余,应用软件开发的“招式”正在被急速抢占着。

 

 

原创文章,如若转载,请注明出处。