在半个世纪以前,科学家已经发现当氘原子和氚原子聚变为一个氦原子核和一个中子时会释放巨大的能量。由于其能量释放机理与太阳一样,所以该工程俗称“人造太阳”。这就是惯性约束聚变,目的是在可受控的范围内实现聚变,和平利用人类的终极能源——聚变能。
在中国,用于支撑俗称“人造太阳”的惯性约束核聚变项目的超级计算机,也有一个超酷的名字:“π”,它是在上海交通大学上线运行的,由浪潮公司设计构建,峰值性能达到263万亿次,也曾位列当时的全球Top500榜单第158名。
如今,一台性能远超“π”的全新超算系统,即将在上海交通大学上线,它采用英特尔最新的Cascade Lake 6248 CPU处理器,是国内高校首创,浮点计算峰值速度超过2千万亿次,性能几乎提升了八倍。
这台全新的超算系统,也将是英特尔代号为Cascade Lake的全新至强可扩展处理器发布后的首个超算平台落地项目,它的缔造者浪潮正在与英特尔,共同演绎智慧计算的速度与激情。
Cascade Lake为高性能计算和AI而来
英特尔的Cascade Lake可谓是千呼万唤始出来。去年中旬就已经传出英特尔将发布Cascade Lake至强处理器的消息,直到去年11月英特尔才正式公布了时间表。
4月3日,英特尔正式发布了Cascade Lake。从公布的诸多细节看,Cascade Lake支持傲腾数据中心持久内存(Optane DC persistent memory),以及Intel DLBoost加速技术,可加速人工智能深度学习推理。
作为第二代英特尔的可扩展处理器,它集成核心数量更多,最高可最高达到48核。并实现了对AEP持久内存的支持,使得单CPU最大支持内存容量从1.5TB提高到4.5TB,数据库、数据仓库等关键计算应用,以及大数据等其他对内存依赖较大的应用,会出现明显的性能提升;另外,第二代可扩展处理器还增加了VNNI指令,机器学习性能相比Sky Lake提升了14倍。
不难发现,英特尔Cascade Lake,很明显针对高性能计算、AI相关负载等领域的要求进行了更多的改善。
为了让国内客户最快速度体会到Cascade Lake的高性能,浪潮服务器产品部副总经理陈彦灵不仅参与了Cascade Lake的现场首发,浪潮也同时宣布:配置全新第二代英特尔®至强®可扩展处理器的M5系列服务器已经完成测试评估,进入量产阶段,可以同步向用户批量供货。
首套Cascade Lake超算,将极速落地
浪潮不仅是业内首个宣布配置Cascade Lake服务器量产的厂家,更是国内首个基于Cascade Lake处理器建设的天梭TS10000高性能集群系统,在上海交通大学正式落地的厂家,做到这样的极速背后其实有几个原因。
第一,浪潮长期与英特尔保持了深层次的合作与沟通,双方在实验室阶段就有协作。比如在去年11月浪潮和英特尔的联合实验室就宣布:双方将汇集浪潮与英特尔的优秀工程与研发团队,专注于AI计算、算法和应用的联合创新,包括英特尔下一代至强可扩展处理器(代号为"Cascade Lake")的AI软件优化。这是浪潮之所以能够快人一步的基础。
第二,在客户层面,浪潮与上海交通大学在高性能计算上有多年合作,赢得了客户足够的信任。早在2013年,上海交通大学的一期“π”超算系统就是由浪潮建设的,此系统一直为全校师生服务,支持重要科研项目,在超算的大力支持下,共有72篇论文得到发表,浪潮深受客户的信任。
第三,在系统设计层面,围绕Cascade Lake处理器,浪潮为上海交通大学进行了全面的系统优化。计算集群总计656台双路节点共26240计算核心,浮点计算峰值速度达到了2.1千万亿次。并且,浪潮采用了业界最大的计算网络,Intel OmniPath 1152端口核心交换机,为每一台节点提供点对点100Gb带宽的高速网络,满足计算和存储过程中全线速、无阻塞的通信需求。光有计算和网络还不够,浪潮还为用户构建了一套Lustre全闪分布式存储系统,仅5台存储节点就能够提供70GB/s以上的聚合读写带宽,能够承载临时计算或生产测试环境下的计算任务,还能应对海量小文件并发的需求。
第四,在系统落地层面,根据上海交通大学的机房考察情况,实际落地的考验还是很多的。因为,本次集群系统需要部署在与π超算系统紧邻的156平方米机房内,要不影响原系统正常使用,还要充分考虑集群PUE、供电和机房空间。由于本次超算集群系统规模巨大,时间紧任务重,浪潮采用了封闭冷通道+LCP列间空调构建了2套浪潮MDC模块化数据中心,包含30台机柜、2台配电柜和12台LCP列间空调,每台列间空调能提供66kW制冷量,总共能持续为500kW功率的设备输出制冷和供电条件。
所以,在国内首个基于Cascade Lake处理器的高性能集群系统落地,实则蕴含了浪潮全方位的经验和优势。
将核心经验分享开源社区,赋能更多客户
在浪潮明星产品中,NF5280系列一直是最经典和闪耀的那一个,NF5280M5是为智慧计算而生,适应各种应用场景要求,可谓是高品质、高可靠、高性能业内最顶尖2路旗舰产品。
通常来讲,传统2U双路服务器的扩展性和适用性非常有限,但NF5280M5的设计理念恰是可以通过组件升级实现弹性配置,灵活应对不同应用场景的需求。
如浪潮服务器产品部副总经理陈彦灵所说,采用极致化场景设计的M5系列服务器可以更好地将CPU的性能转变成客户实际应用效能的提升。浪潮M5服务器分为关键计算、通用计算、融合架构以及应用优化等四个系列,每个系列计算、存储、I/O各类资源针对具体应用场景进行优化配置,可以为第二代至强可扩展处理器提供同步配套的内外部I/O、存储等资源保障,使其发挥出性能等方面的优势。
毫无疑问,顶级的旗舰必然匹配顶级的处理器,所以浪潮2路通用服务器NF5280M5率先采用了Cascade Lake。据了解,此前NF5280M5就达到了英特尔至强可扩展计算平台的最大扩展性,通过不同类型的模块组合来面向不同的应用,共有24个内存插槽,其中12个可以支持AEP内存。采用了Cascade Lake之后,可配套扩展网络和存储模块,在分布式数据库、在线交易处理、数据仓库等应用中,性能提升十分明显。
与此同时,浪潮也在积极推动第二代至强可扩展处理器在开放计算社区的应用。
比如在今年的OCP Summit上,浪潮发布全球首款面向云计算场景优化的高密度四路服务器参考设计CraneMountain(NF8260M5),基于Intel下一代可扩展处理器的四路服务器参考设计。
它的创新之处在于:将单个2U平台中的核的数量增加至112个,内存带宽增加,可节约的成本达到双位数。这不仅能为客户在计算密度和计算力方面带来提升和收益,同时也会把原来面对关键应用的可靠性、稳定性的设计思想和方案进行传承和推广。
这个全新设计将为云计算的IaaS平台提供计算能力更强、密度更高的解决方案,浪潮与Intel将该产品在OCP社区开源,并将相关技术文档开放到OCP,后续将作为OCP参考设计可以被其他更多服务器厂商借鉴。
浪潮一直以来都以开放的态度拥抱开源,NF8260M5的成功经验浪潮没有选择独享,而是分享给其他服务器厂商,并以此来赋能更多的客户。这也是因为,浪潮对自己的研发和迭代速度有了充分的自信。