探秘全球最强超级计算机“神威·太湖之光”

【环球时报 环球科技赴无锡特派记者刘扬】就在中国的最新型超级计算机“神威?太湖之光”(以下简称“太湖之光”)前不久赶超中国蝉联六届TOP500全球超算冠军的“天河二号”,成为全球运算速度最快的超级计算机(以下简称超算),全世界就对中国这一“神秘机器”充满高度关注与好奇,坊间还传出各种各样有关国家超级计算无锡中心(以下简称无锡超算中心)以及它拥有的“太湖之光”的传闻,国内外超算业界与媒体也在不断通过公开与私下的渠道搜集着“太湖之光”的点滴新闻。到底这个神秘的“超级运算巨无霸”什么样?而拥有这一超级机器的“机窝”(业内对于超算中心的昵称)又是什么样呢?《环球时报》记者几经联系,日前终于走进全球最强超算——“太湖之光”的“机窝”无锡超算中心一探究竟。

全球最强“机窝”的低调程度超乎想象

很多人可能认为运营着全球最强超算的无锡超算中心一定非常高大上,但《环球时报》记者从无锡高铁站下车之后,几乎横穿了整个无锡市,才在无锡西南方向一个并不是很起眼的科技园区内找到无锡超算中心的所在地。而它所在的大楼也非常低调,门口并没有摆放或挂设任何表明身份的标识,只是在大堂正中墙壁上挂着的一个液晶屏上显示:国家超级计算无锡中心欢迎您。而在液晶屏的右侧是一个需要指纹开锁才能进入的玻璃门,上面写着国家超级计算无锡中心,后来记者才知道这就是通往“太湖之光”机房的大门。而在保持低调的同时,这个国家级第六大超算中心的简朴程度也让《环球时报》记者大吃一惊。在乘坐电梯前往无锡超算中心当家人杨广文主任的办公室时,记者看到电梯厢体上的保护材料还没有拆除,而杨广文办公用的转椅底座上竟然还保留着出厂时的塑料泡沫。

探秘全球最强超级计算机“神威·太湖之光”

谈起无锡超算中心的成立,杨广文的自豪之情溢于言表。据他介绍,“十二五”期间,科技部支持了两个十亿亿次级的超算项目,其中一个是先期启动的“天河二号”项目,而后在2014年,“太湖之光”也在科技部正式立项,2014年底就已完成原型机的验证,而在2015年底就已经完成“太湖之光”系统的研制与组装。由于当时科技部的要求是建“全球一流的超级计算机和全球一流的超算中心”,所以在超算研制完成的同时,超算中心也就成立了。

探秘全球最强超级计算机“神威·太湖之光”

用两年左右的时间就能研制出世界第一的超算,这个速度是不是太惊人了?杨广文回应称,“太湖之光”的具体研制时间虽然短,但它之前经过了很长时间的技术预研。它采用的是国家“核高基”重点科技专项支持的由国家高性能集成电路设计中心通过自主核心技术开发的全国产“申威”CPU。“申威”系列的技术路线比较明晰而稳定,而且采用上一代“申威”CPU的“神威蓝光”超算为“太湖之光”的发展做了很好的铺垫和尝试。没有它,“太湖之光”也就不会那么快研制出来。

探秘全球最强超级计算机“神威·太湖之光”

那这个世界一流的“机窝”又有哪些优势呢?杨广文表示,因为当时中国最高水平的超算“天河二号”采用的是美国英特尔公司的“至强”处理器,所以国家希望能采用另一种技术路线来研制新的超算,从布局之初的思路就是要打造拥有全国产架构、自主可控软硬件的新超算,因此无锡超算中心最大的优势就是拥有全部自主的核心技术,还有一个优势就是“太湖之光”从原型机研制阶段就开始与应用方一起讨论互动,否则也不可能在首次夺得TOP500冠军时,就有三大应用入围世界高性能计算应用最高奖——“戈登贝尔”奖提名,而此时距离“太湖之光”完成研制还不到半年时间。

零距离探访“太湖之光”

随后《环球时报》记者被允许进入无锡超算中心最核心的区域——“太湖之光”的机房。所有进入机房区域的人员都必须穿上防尘鞋套,墙壁上到处贴着禁止拍照摄像的标识。不过,据杨广文介绍,这些都是在今年6月TOP500榜单发布之前贴出来的,因为当时“太湖之光”还处于严格保密阶段,6月20日机器发布后,整个无锡超算中心无论对于国内外同行,还是有意合作的应用方,都抱着一种开放的态度。记者在整个采访过程中也深刻体会到这一点,记者采访时,还遇到广州番禺区的代表正在进行参观,据介绍,“天河二号”所在的广州超算中心就位于番禺区。记者还目睹了好几拨外国的专家与相关企业到这里寻求合作。

探秘全球最强超级计算机“神威·太湖之光”

在机房外面,以实物形式展示了“太湖之光”采用的申威众核处理器,单个处理器看起来非常小巧,大概就是一个相机SD存储卡那么大,但它所蕴藏的运算潜力以及全部国产的技术含金量,不亚于一块钻石,而正是这一个个小钻石排列在一起构成了“太湖之光”峰值运算速度每秒12.54亿亿次、持续计算速度每秒9.3亿亿次的全球最强运算能力。走进机房内部,首先映入《环球时报》记者眼帘的是三组巨大的机柜,中间一组机柜的正面用中文写着巨大的神威太湖之光,在每个机舱上也用中文与拼音写着这一名字。而在机箱的上部边缘还有着不断闪烁的LED光条,这些光条总体上是蓝色的,但每隔几秒会出现红色、绿色或者黄色光条的快速律动。《环球时报》记者提出“这些光条颜色的变化是代表超算的运算状态吗?”,杨广文表示,这和超算的运算状态完全没有关系,只是为了展示一种比较神秘的科技感效果。

探秘全球最强超级计算机“神威·太湖之光”

据杨广文介绍,该机房的面积约1000平方米,三组机柜是以0、1、0的顺序摆放,其中两个“0”是由每组20个机舱组成的运算设备,中间的“1”是由8个机舱构成的网络设备(用来实现处理单元的互联互通),一共加起来是48个机舱。记者提出,机柜之所以以“0、1、0”的顺序摆放是不是因为计算机的代码就是由0和1组成的,杨广文说,主要是这方面的考虑,当然也同时考虑空间的充分利用和布局的整体效果。

工作人员随机打开一个机舱,看起来很像一个宽体式家用双开门冰箱,而里面排列着密密麻麻的运算单元则很像抽拉式档案柜。据介绍,每个机舱里面有4组超节点,每组超节点有32块运算插件板,每个插件板上有8个CPU,而这8个CPU的运算能力就可以达到每秒25万亿以上,所以一个机舱的运算能力是3.2千万亿次,相当于“神威蓝光”整体运算能力的3.2倍。记者又走到机柜的后面,看到这些运算设备除了连接着大量网线外,每组运算单元上都接着两根水管,据介绍,这是用来冷却运算设备的重要组成部分,而这一水冷技术是“神威系列”超算的一大特点,它可以充分保证对高速运转芯片的降温效果,这一技术对于未来中国研制下一代百亿亿次级超算也将带来巨大的帮助,因为百亿亿次级超算高速运转产生的热量可以通过这种方式很好地降温。

那这么强大的运算机器在运转起来是不是噪音很大呢?记者在一进入机房就听到一种不太吵人的嗡嗡声,记者以为这是超算运转的声音,不过工作人员向记者介绍,这其实是环境空调出风的声音,超算本身基本不产生噪音。记者在贴近机柜时,确实基本听不到机器运转的声音,只有水冷设备工作时非常轻微的流水声。

中国造“太湖之光”只为拿世界第一?

中国超算的发展长久以来一直受到关注,但外界对于这个很烧钱的战略项目也有不少质疑,其中很重要的一个依据就是中国花大价钱造出了全球性能最好的超算,但在应用方面却“吃不饱”,甚至有用“十车道高速路上跑着很少的车辆”来形容中国超算性能与应用水平之间的关系。对此杨广文认为,在21世纪头几年,中国的超算应用能力确实比较弱,但在2005年之后,则进入一个快速成长期,主要是因为超算越来越受到科研单位与产业的重视,从事超算的人才也越来越多。而国家“十一五”布局的那几台机器出来之后,中国超算的应用水平得到了极大的提升。目前中国的有些超算可能处于“吃不饱”的状态,但这可能是与中国超算的运营思路有关,国内的发展趋势是机器牵引着应用走。这就要看国家是基于什么来考虑发展超算了,如果是想要让国家的重点基础研究、核心装备研发甚至产业发展都用上超算,那超算的需求是无止境的。所以只要是根据国家的这种战略需求来发展,就完全不用担心“太湖之光”跑不满。

探秘全球最强超级计算机“神威·太湖之光”

据杨广文介绍,按照目前的统计,“太湖之光”半年来的利用率已经超过50%,目前已经累计拥有超过50多项应用,比6月获得世界冠军时又增加了10多项,目前有一些重大项目正在“太湖之光”上进行全机测试,比如获得了“戈登贝尔”奖的三大应用,还有一些应用目前正在“太湖之光”上一边进行小规模测试,一边排队等待更大规模应用的档期。目前,包括国家气象局等多个国家专业机构与研究院所都在“太湖之光”上开展应用研究,并进一步与无锡超算中心寻求全面合作,因此我们完全不担心“太湖之光”跑不满,因为现在已经有不少应用方开始排队了。目前最核心的问题不是如何让它跑满,而是如何把它用好,可以多出重量级的成果。此外,需要考虑在拥有大量科研用户的同时,如何能够培养更多有意愿长期合作且需求旺盛的产业界用户。

探秘全球最强超级计算机“神威·太湖之光”

对于“太湖之光”正在开展或未来将有哪些重大应用项目的提问,杨广文表示,科研用户都有自己的应用软件,所以依托“太湖之光”强大的运算能力开展研究,完全没有问题。除此之外,这些运算能力如何为江苏省这个制造大省带来帮助也是他们正在考虑的一个重要应用方向。国家提出“中国制造2025”计划,而江苏的苏南制造对于国家的制造业转型具有风向标式的意义,我们也希望能更好地支持当地制造业的发展,将无锡超算中心建成江苏省一个产业科技创新中心。他表示,目前,中国制造业有一个很大的问题就是大部分应用软件都是国外的商用软件,而在这方面无锡超算中心也在布局,同时还在汽车制造业、船舶制造、新药研发等方面开展研究。《环球时报》记者在无锡超算的应用成果展示区看到,中国航空、航天的相关研究机构目前正与无锡超算合作进行C919大飞机多种飞行状态的模拟,天宫系列航天飞行器的飞行状态模拟。山东的一家公司还在利用“太湖之光”的超强能力进行动漫制作,据介绍,这样不仅可以制作出更加逼真的动漫渲染效果,而且可以大幅缩短制作周期。未来很有可能会看到依托“太湖之光”运算能力制作出的国产动画大片。

探秘全球最强超级计算机“神威·太湖之光”

杨广文还还介绍了他们快速提升超算应用水平的两大经验。他说,如果能够在超算研制初期就开始布局应用,将大大提高应用水平,“太湖之光”之所以在这么短的时间内,就能有目前这么高的利用率,就是因为采用了这样的操作模式。“我们在机器研制过程中就充分与应用方进行互动,充分考虑他们的需求,在设备组装过程中,则是每增加一个机柜,都使用应用课题进行系统的功能与性能测试,稳定后直接提供应用使用,而不是全部组装完成之后才开始应用。”他认为,设备研制的同时就布局应用可能是未来中国超算发展的一个很重要的经验。而超算是一个交叉性很强的学科,需要一大批多领域专家集中在一起共同研发,但如果全靠超算中心自己来招聘人才将是难以承受的。所以无锡超算中心正在运作一种全新的机制:与应用部门共同成立专题联合实验室,比如流体力学实验室、新药研发实验室、汽车碰撞实验室等。而联合实验室的主任由应用方的学科带头人来担当,就是要让相关领域最强的专家来引领这一联合实验室的工作,而无锡超算中心则利用全球最强的运算能力为他们提供支持,并指导与协助进行程续移植,自主研发大型并行应用软件。此外,还可以与有需求的企业进行联合开发应用软件。这样超算中心不用招聘那么多的应用人才,而是需求方带着他们自己的应用软件与研究团队到无锡超算中心一起工作,这就好像一个个项目组的概念。

今年长江中下游的洪涝灾害很严重,北京前不久也发生了严重的暴雨,那“太湖之光”在天气预报与灾害预警方面有些什么应用前景吗?杨广文介绍,这是目前正在进行的非常重要的应用方向,目前无锡超算中心和清华大学正在合作研制全球最大的地球系统数值模拟器,从全球角度研究气候变化,为防灾减灾、雾霾治理以及国际气候谈判提供数据支撑,目前在“太湖之光”计算能力的支持下,实现了全球10公里的地球系统数值模拟。虽然无锡超算中心目前没有直接参与今年的灾害预警,但未来这方面将是研究与应用的重点。灾害预警方面将与国家气象、环保部门合作,而且空气质量监测方面的研究也正在进行。“我们不仅提供机器,还会邀请国内相关专业的专家一起来进行研究,比如气象、海洋等等,基于这些研究成果,还会开发一些应用系统,比如粮食预警,可利用“太湖之光”预测未来洪涝或者旱情对粮食产量的影响”。杨广文介绍称。

杨广文表示,随着国家对于海洋权益的关注,这方面的研究也是未来无锡超算中心的一大重点方向。目前主要是和国家海洋局合作的高分辨率海浪数值模拟,这个项目也是今年入围“戈登贝尔”奖的三个项目之一,关注点是对全球海浪变化规律的研究,对于中国周边的重点海域也会有针对地进行研究。据他介绍,还有一系列近海预报等应用也在“太湖之光”上运行,总体而言,国家海洋口在无锡超算已经有了布局,目前的相关合作单位有国家海洋局、国家气象局以及海洋大学等。现在合作的海洋单位的相关研究已经应用在中国相关海域的具体实践中了。据他介绍,“太湖之光”还有可能会应用于代表未来“黑科技”发展方向的研究领域,比如“人造小太阳”,也就是核聚变发电的相关理论与实验方面的模拟。