天河二号:运算1小时相当13亿人用计算器算1000年

2013年06月18日10:20 | 中国发展门户网 www.chinagate.cn | 给编辑写信 字号:T|T
关键词: 天河 冷却方案 计算器计算 超级计算机 计算能力

中新网长沙6月17日电 题:天河二号:运算1小时相当于13亿人同时用计算器算1000年

作者 李治 吴亚轩

北京时间6月17日下午,正在德国莱比锡召开的2013国际超级计算大会上,世界超级计算机TOP500组织正式发布了第41届世界超级计算机500强排名榜,国防科技大学研制的天河二号超级计算机,以峰值计算速度每秒5.49亿亿次、持续计算速度每秒3.39亿亿次双精度浮点运算的优异性能位居榜首。

中国超级计算机继天河一号之后,第二次登上了世界第一的宝座。天河二号成为当今世界运算速度最快、综合技术领先的超级计算机,中国超级计算机研制水平继续处于世界领先行列。

在被超越中再攀世界超算新高峰

2010年11月17日,国防科技大学研制的天河一号以每秒4700万亿次的峰值速度和每秒2566万亿次的持续速度,在世界超级计算机500强中位居第一,中国人首次站到了超级计算机世界冠军的领奖台上。

然而,仅仅过了不到8个月,日本一台名为“京”的超级计算机就将天河一号挤下冠军台。之后,美国研制的“红杉”、“泰坦”超级计算机先后坐上世界第一的交椅,天河一号排名滑落至第8名。

当外界还在为天河一号夺得世界第一而赞赏不已之时,该校计算机学院迅速做出再攀超算新高峰的决策部署。广大科研人员奋力攻关,突破了一系列核心关键技术,于今年5月将运算速度达到5.49亿亿次的天河二号超级计算机呈现在世人面前。

今年5月底在中国主办的“高性能计算国际论坛”上,国际超算领域的权威专家实地考察了天河二号,纷纷给予高度评价。世界TOP500组织专家、美国田纳西大学杰克·唐加拉教授说:“天河二号与美国的‘泰坦’大小相当,速度却是它的两倍,制造这样强大的系统需要很强的技术。”德国尤利希科学中心的塞巴斯第安·施密特教授说:“天河二号是世界最好的计算机之一,它有着非常出色的表现。”日本筑波大学参加过“京”系统研制的大介博库教授说:“这是一部非常紧凑的机器,具有巅峰的性能表现,它真的是技术上的很大进步”。

创新驱动超算迈上新台阶

在该校“天河”大楼一间近800平方米的机房,由170个机柜组成的天河二号整齐排列,气势恢宏。

天河二号工程副总指挥李楠研究员告诉记者:“天河二号有五大特点:一是高性能,峰值速度和持续速度都创造了新的世界纪录。二是低能耗,能效比为每瓦特19亿次,达到了世界先进水平。三是应用广,主打科学工程计算,兼顾了云计算。四是易使用,创新发展了异构融合体系结构,提高了软件兼容性和易编程性。五是性价比高。”

天河二号占地面积720平方米,内存总容量1400万亿字节,存储总容量12400万亿字节,最大运行功耗17.8兆瓦。打个形象的近似比喻,天河二号运算1小时,相当于13亿人同时用计算器计算一千年,其存储总容量相当于可存储每册10万字的图书600亿册。相比此前排名世界第一的美国“泰坦”超级计算机,天河二号计算速度是“泰坦”的2倍,计算密度是“泰坦”的2.5倍,能效比相当。与该校此前研制的天河一号相比,天河二号计算性能和计算密度均提升了10倍以上,能效比提升了2倍,二者占地面积相当,执行相同计算任务的耗电量只有天河一号的三分之一。

高性能、高能效从何而来?天河二号工程总指挥、总设计师廖湘科研究员说:一切源于瞄准国际前沿的自主创新,是自主创新推动了中国超算的跨越式发展。

记者在现场看到,计算能力比天河一号提升了10倍以上的天河二号,占地面积却相差无几。科研人员告诉记者,如果不能有效解决超级计算机的体积问题,系统的安装调试、运行管理等都将成为很大的难题。天河二号设计实现了高密度、高精度的结构工艺,采用了多机柜封闭循环的水风混合冷却方案,有效缩减了系统体积,与美国“泰坦”相比,计算能力是它的2倍,体积却比它小了15%。

天河二号还在高速互连、新型层次式加速存储架构、容错设计与故障管理、综合化能效控制、高密度高精度结构工艺等方面取得了一系列创新和突破。

让天河二号更加实用好用

“超级计算机研制难,用好更难。”这是国际超算领域的普遍认识。天河二号副总设计师朱小谦研究员说:“我们不仅要研制世界性能最高的超级计算机,而且要研制稳定可靠、应用广泛的超级计算机。”

2010年,天河一号在国家超级计算天津中心投入使用后,构建形成了石油勘探、生物医药、动漫与影视特效渲染、高端装备制造和地理信息五大高性能计算应用平台,先后为国内外600多家用户提供了超级计算服务,取得了一批具有国际先进水平的创新成果。

与国外超级计算机主要针对科学工程计算不同,天河二号在强化科学工程计算的同时,可高效支持大数据处理、高吞吐率和高安全信息服务等多类应用,使得天河二号应用面更宽、易用性更好。

系统容错性能是评价超级计算机稳定性的重要指标。在天河二号中,科研人员通过采用多层次容错设计,实现了超大系统的智能化管理,可自动监控、检测、诊断、隔离系统运行时出现的故障,与天河一号相比,全系统连续稳定时间提高了1.5倍以上,可靠性和可用性迈上了一个新台阶。

据朱小谦介绍,近年来,中国超级计算机需求迅猛增长,为中国超级计算机研制、应用的快速发展提供了强劲动力,同时推动着科技创新、产业升级、经济社会发展。

广州超级计算中心先导系统技术负责人卢泽新研究员说,天河二号具有强大的计算能力,以500人规模的全基因组信息关联性分析为例,华大基因利用原有计算机需1年时间,利用天河二号只需3个小时。在新车研发中,采用传统设计手段,一般要经过上百次的真实碰撞实验,历时两年多才能完成一款新车的结构设计,而利用天河二号对汽车碰撞模拟和空气动力学模拟结果,只需3到5次实车碰撞,两个月即可完成任务。

追逐强国梦的创新团队

三年之内,两度问鼎。该校“天河”高性能计算创新团队一次次创造着让世界震惊、令国人骄傲的科技奇迹。奥秘何在?该校计算机学院政委刘学民说:“把五星红旗插上世界科技高峰,是‘天河人’始终追逐的超算梦。”

在天河二号攻关的日子里,每天晚上天河楼的灯火都是彻夜长明。“周周5加2,天天白加黑”,成为科研人员的工作常态。为了突破系统规模扩大带来的稳定性问题,他们经常把自己封闭起来攻关,潜心研究,直到找到解决问题的办法。

在天河二号的研制过程中,每当遇到技术瓶颈时,大家总是群策群力,集智攻关,以致于很多设计思想、创新点子说不清到底该属于谁,成果即便获奖,也只能署少数人的名字。面对荣誉得失,大家总是胸怀坦荡:“能参与这样大的国家工程,我们感到无比自豪。”(完)

返回顶部文章来源: 中国开云网页版-开云(中国)官方在线登录网