[资讯]美国AMD超级计算机Titan十年后获冠 中国银河和日本富士通稳居先列(图)
据国外媒体消息,美国能源部Oak Ridge国家实验室(ORNL)近日发布了世界上最强大超级计算机——Titan。这个超级计算机大如篮球场,它的水冷式电路可以进行每秒20千万亿次浮点运算。该运算能力是前一辈超级计算机Jaguar 的十倍,是普通计算机的20万亿倍。值得一提的是,该计算机的部分部件原本是打算应用在游戏型计算机上。
Titan超级计算机是一个拥有200个机柜,18688个节点的Cray XK7系统。每一个计算机节点由一个16核心AMD Opteron 6274处理器和一个英伟达 Tesla K20 GPU加速器组成,并配备700 TB内存。另外,Titan的299008个CPU将被用于引导模拟,同时GPU用来做强力数据处理。
计算机与计算机科学部联合实验室总监Jeff Nichols说,拥有前所未有超强计算能力的Titan将被应用在能源、气候变化、材料以及其他需要超级计算机的领域。
目前Titan已经开始应用在美国能源部的一个名为“创新和新计算对理论与实验影响”的项目上,这个项目可以简称为INCITE项目。在该项目中,Titan主要负责新电动机和发动机磁性材料和纳米研究。此外,Titan超级计算机还将应用在内燃机内部湍流燃烧的计算机模型创造和大分子碳氢燃料研究上,提高燃油效率。
除了高科技领域可以从Titan超级计算机获益之外,在不久的将来,Titan的GPU技术或有可能应用在消费类显卡领域。
泡泡网显卡频道11月1日 在去年6月份日本“京”(K Computer)超级计算机凭借最大峰值性能8.77363 PFlops、最大性能8.162PFlops成功夺得新一届TOP500超级计算及榜首,时隔一年多来自美国能源部橡树岭国家实验室(Oak Ridge National Laboratory (ORNL))在Jaguar的基础上新增NVIDIA Kepler GPU变身Titan一跃成为全球顶级超计算机。
Titan由橡树岭国家实验室运营,而橡树岭国家实验室是美国能源部所属的一个大型国家实验室,成立于1943年,成立于1943年,最初是作为美国曼哈顿计划的一部分,以生产和分离铀和钚为主要目的建造的,原称克林顿实验室。2000年4月以后由田纳西大学和Battelle纪念研究所共同管理。他们的使命是攻克美国当下面临的最严峻的科学难题,并且开发新技术,为人类创造更加美好的生活,保护人类。
Titan拥有18688个计算节点,每个计算节点拥有1颗AMD Opteron处理器和1块NVIDIA Tesla K20 Kepler(GK110)加速卡,使用的AMD Opteron处理器为Opteron 6274,产品基于16核设计,所有Titan共拥有299008个处理器核心,而每个处理器配备32GB DDR3内存,内存总容量为598TB。
加速卡方面,Titan共配备18688块,产品来自NVIDIA Tesla K20,基于最新的28nm Kepler架构,配备6GB GDDR5显存,总显存容量为112TB。这样算上加速卡的显存容量,Titan的系统总容量为710TB。
性能方面,Titan相比前辈Jaguar提升了近10倍,达到了20+ PFlops的峰值计算性能,也远远超过了K Computer的8.77363 PFlops。
存储容量方面,Titan使用了10000块标准1TB 7200RPM 2.5吋硬盘,IO系统数据速率高达240GB/s,而针对SSD的高速优势,橡树岭国家实验室打算在未来升级SSD作为存储,下一步存储容量将扩容至20-30PB,而峰值数据速率将突破1TB/s。
Titan是由200台机柜组成,每个机柜都有数组Cray XK7计算单元,每个Cray XK7计算单元则有4个AMD G34插槽和4个PCI-E插槽(4路主板),不过为了保证较小的体积占用,PCI-E插槽并没有和我们常见的PCI-Express x16插槽一样,而是设计成类似于笔记本的SXM水平插槽,由于是用于计算,所以Tesla K20并不提供显示输出接口。
而在过去的数周,为了让Titan能够运行起来,工作人员升级了总共18688处理器和18688块计算卡,不得不说是一件繁重的任务,对于DIY用户的我们一辈子都不会见到这么多的处理器和显卡。
● 操作系统和软件
Titan运行为为Cray Linux环境,它基于SUSE 11,这个系统它支持大规模的操作和修改,能够有效避免系列化引起的中断。
● 处理器和加速卡
处理器来自AMD的16核Operton芯片,值得注意的是上一代Jaguar使用的为12核Operton芯片,同样为Socket G34接口。
计算卡来自NVIDIA Tesla K20 GPU,产品基于28nm Kepler架构,拥有2688 CUDA单元,提供384bit显存位宽,并配备6GB GDDR5显存。
● 供电和散热
供电系统,Titan使用了480V电压输入,以降低电缆的负载。而Titan满负载功耗高达9000KW,典型负载为7000KW。
散热系统方面,机柜还是采用了风冷散热设计,不过在风冷进入机柜之前都使用液态降温,以保证稳定运行,而整个散热系统的重量则达到了6600吨。
Titan主要进行科学研究计算,不过它是公开对外开放的,但是在预定Titan使用时间的时候,你还是需要通过一个提案程序才能够获得使用时间。
如果你想获得Titan的使用时间,你需要通过程序写一个提案,它被称作“Incite”,你需要描述你正在试图解决的问题是重要的,而要求使用这么多核心也是非常严格的,首先你的问题的运行代码还必须在比Titan小的机器上运行过(证明需要使用Titan这样强大的机器)。
即便如此你的提议也要被继续审核两次,首先你的计算代码必须能够在Titan上运行,另外就是精英科学家的筛选。审查委员会根据所有收到的提议,对这些需要使用超级计算机的提议进行排序。
而提议请求的数量达到了计算时间的3被,因此提议的竞争是非常激烈的,每年的提议日期从4月份到6月截至。获得提议的计算机使用时间是10月份到第二年的1月份,提议能够在1-3年内使用。
而对于私人公司的专利工作,你必须付费才能使用,价格为0.05美元/核心小时。
● Titan的应用
在游戏世界里,我们使用更强的计算模型是为了获得更加精确的物理图形,而在超级计算机情况则不同,许多橡树岭国家实验室的超级计算机项目是一些无法验证的模型、或者是更精确的计量、大气、核反应堆等工作。
橡树岭国家实验室也有一个灵活的可视化的房间,在那里你可以绘制,3D,土卫六上的输出工作。在超级计算机上运行的工作负载的输出可以是TB级的数据 - 这往往是难以分析,而通过三维可视化,你就可以得到一个更好的概览。它类似于我们的图形建模解决一些实际问题。
Titan运行的一些数据--模拟高压水核反应堆。
从Jaguar到Titan,超级计算机的性能发生了质的飞跃,而每瓦性能比也得到了显著的提升,在Jaguar上18688(224256核心)个处理器提供了2.3 PFlops的计算性能,而功耗是7000KW,而Titan借助18688个处理器和18688颗GPU就可以提供20 PFlops的计算性能,而功耗也只有9000KW。
超级计算基本是以4年提升10倍的速率发展,而到2016年,橡树岭国家实验室有望推出200 PFlops计算性能的超级计算机,而功耗可能继续维持在Titan相当的水平上,从CPU和GPU的搭配我们看到了超级计算机能效的改变,性能提升了约10倍,而在接下来一些年你将看到更多的GPU和CPU通过光纤数据交互的例子。
在4年内,超级计算机增强10倍的性能可能不是很困难,不够要在2020-2022年突破1 EFlops多少有点让人浮想联翩,一个可行的方案就是将现有负载x86架构内核变成数十亿的简单内核,从橡树岭国家实验室和NVIDIA的密切关系,很有可能是受到智能手机的启发。
人或许对于简单核心的定义不同,不过Titan的替代者似乎并不是比Titan更快更大,而要使Titan计算性能实现两个数量级的提升,将不得不进行更大的转变,幸运的是目前还有很多研究项目没有实现,诸如量子计算机,甚至我们需要的远不止这些。