能否概括下浪潮AI液冷服务器?

  浪潮在领域有着丰富的经验和技术体系,推出的各种受到海内外权威机构的一致认可。4月22日,全球权威AI基准评测MLPerf公布了2021年最新榜单,在全部有效41个项目中,浪潮获得18项性能第一,是获得冠军数量最多的品牌。

  此次竞赛可谓高手云集,总共有包括浪潮、NVIDIA、Intel、高通、阿里巴巴、戴尔、HPE等在内的17家厂家,此次竞赛基于最新MLPerf Inference V1.0基准,会对参赛服务器从数据中心和边缘两个主赛道进行评测,涵盖了图像分类、目标检测、医疗图像分割、自然语言处理、语音转文字和推荐系统6类AI应用场景,并且每个主赛道细分为固定任务(Closed)和开放优化(Open)两类性能竞赛。浪潮在数据中心固定任务(Closed)的16个赛项中获得11项冠军,在边缘固定任务(Closed)的17个赛项中获得7项冠军。

  经过多年的发展,浪潮在服务器的系统层面、软件层面和硬件层面均取得了突破性的进展,浪潮能够在此次竞赛中取得骄人的成绩,很大程度上就得益于此。在系统层面,浪潮服务器具有卓越的系统设计能力和全栈优化能力,在硬件层面,CPU和GPU的性能和数据互通能力有了明显提升,在软件层面,单卡至多卡性能达到近似性扩展。浪潮服务器NF5488A5和浪潮服务器NE5260M5正是聚合了这些特性,才得以在此次竞赛中表现出色。

  浪潮服务器NF5488A5是数据中心AI卫冕冠军,是业界率先实现8颗高性能GPU液冷散热的超强AI服务器,并通过深度优化系统设计,AI计算效能显著提升,可在高温、高负载环境下稳定运行。而浪潮服务器则是边缘AI性能冠军,获得边缘固定任务(Closed)7项性能第一。此款服务器采用极致优化的信号传输,结构散热,供电等设计,完美兼容高性能CPU和多种AI加速卡。机箱是普通服务器的二分之一,可最大程度上提升部署体验。

  浪潮在此次竞赛当中获得了18个项目冠军,这不仅是对浪潮服务器性能的认可,更是对浪潮品牌实力的肯定。在未来,浪潮将以此为动力,致力于算力行业的发展,为用户提供更加可靠的产品。

4月7日,全球权威AI基准测试MLPerf公布了本年度首次性能评测榜单,聚焦数据中心(固定任务)赛道,浪潮信息依托旗下AI服务器的卓越表现一举囊括16项冠军。

MLPerf是世界上影响力最大的国际AI性能基准评测,由图灵奖得主大卫帕特森(David Patterson)发起,谷歌、Facebook、英伟达、英特尔、浪潮信息、哈佛大学、斯坦福大学、加州大学伯克利分校等50余家全球AI领军机构共同组成的MLCommons推动,并致力于推进机器学习和人工智能标准及衡量指标。

本次评测中,在竞争最激烈的数据中心(固定任务)赛道,共有926项成绩提交,数量较上次比试翻倍,竞争非常激烈,浪潮AI服务器此次表现出色,以最高性能包揽了此次MLPerf数据中心(固定任务)赛道的全部16项冠军。浪潮信息能够夺冠,该公司的AI服务器NF5468M6J功不可没,同时也得益于浪潮信息卓越的AI系统设计能力和全栈优化能力。

浪潮AI服务器NF5468M6J拥有出色的系统设计,以分层可扩展计算架构在业界率先实现对12颗NVIDIA A100 Tensor Core GPU的支持,并以极佳的性能成绩一举揽获12项冠军。浪潮信息也是本次MLPerf竞赛中可以唯一提供服务器支持8颗500W NVIDIA A100 GPU的厂商,并实现了风冷及液冷两种散热方式。在此次参赛的8颗GPU NVLink高端主流机型中,浪潮AI服务器在数据中心16个任务中斩获14项最佳成绩,展现出在高端机型中的领先优势。

在硬件层面,浪潮AI服务器通过对CPU、GPU硬件性能的精细校准和全面优化,使CPU性能、GPU性能、CPU与GPU之间的数据通路均处于对AI推理最优状态;在软件层面,结合GPU硬件拓扑对多GPU的轮询调度优化使单卡至多卡性能达到了近似线性扩展;在深度学习算法层面,结合GPU Tensor Core 单元的计算特征,通过自研通道压缩算法成功实现了模型的极致性能优化。

多年来,浪潮信息在MLPerf基准测试中屡获佳绩,无疑是其卓越实力的最好体现。当前,AI平台已经是各个行业数字化、智能化转型的关键,浪潮信息作为全球领先的AI服务器厂商,在未来的发展中将加大在AI服务器领域的投入,让AI真正产生价值,造福于整个社会。

原标题:浪潮信息:高性能AI服务器将成为智算中心生产算力的“动力机组”

“智算中心,不管我们看得见,还是看不见,它将源源不断提供智慧时代的动力——计算力”。

4月9日,在IPF2020浪潮云数据中心合作伙伴大会上,浪潮集团执行总裁、浪潮集团首席科学家王恩东提出,智算中心是经济社会运行所必须的重要基础设施,是智慧时代的新基建。

智算中心是智慧时代最主要的计算力生产中心和供应中心,它以融合架构计算系统为平台,以数据为资源,能够以强大算力驱动AI模型来对数据进行深度加工,源源不断产生各种智慧计算服务,并通过网络以云服务形式向组织及个人进行供应。

智算中心之于智慧社会,就像水利之于农业社会,“铁公基”之于工业社会,都是必不可少的基础设施,而人工智能和开放计算是发展智算中心的两大方向。

开放计算,ICT产业的未来

从硬件开放到软件开源,ICT产业开放的边界越来越广阔,开放计算不仅是ICT产业的未来趋势,也是智算中心的产业基石。所有顶级互联网数据中心已经大规模落地了开放计算服务器,通信、金融、能源等关键领域的TOP企业也纷纷加入这些开源组织并在数据中心建设中加以实践。

开放计算以模块化、标准化,推动智算中心降本增效、互联互通,获得高质量发展。以浪潮的某个大型数据中心客户为例,使用开放计算架构能够节约电力 30%,系统故障率降低 90%,投资收益提高33%;并且运维效率提升3倍以上,交付速度可达到每天1万台。

多年来,浪潮一直践行开放计算理念,作为全球三大开放组织ODCC、OCP、Open19的发起成员或白金会员,牵头了服务器全部国标;是OpenStack黄金会员,社区贡献中国第一,同时还是SPEC ML 主席。浪潮拥有全球唯一符合三大开放标准组织的整机柜产品,拥有全球架构最全、配置最多、规格最高的开放计算服务器。IPF2020,浪潮发布了全球首款AI开放加速计算系统MX1。

王恩东表示,浪潮作为全球领先的智慧计算企业,将以开放开源为原则,在智算中心IT基础设施方面向更深、更广发展,形成硬件重构的智算中心算力系统和软件定义的智算中心操作系统。

未来,浪潮将持续引领开放计算体系,打造智算中心基石,构建从模式开放到技术开放,从产品开放到服务开放的开放计算体系。模式开放,就是以客户场景为核心,与合作伙伴一起联合规划、协同设计、敏捷研发、快速交付。技术开放,是指无论是以液冷、循环利用为代表的冷却技术,还是以RISC-V、FPGA、CXL、智能网卡为代表的基础技术,坚持技术领先。产品开放,即以开放架构和开源为指导,基于先进的开放硬件架构,模块化、标准化构建MDC,并引领其发展方向。基于先进的开源软件,打造标准、高效、敏捷的智算中心基础软件平台和统一管理平台,并最终形成开放的云数智一体化服务。

刷新AI算力关键作业环节

AI计算是智慧计算的核心,也是智算中心生产的主要计算力。AI技术将深入应用到智算中心内部,参与算力从生产到释放的全部作业环节。在智算中心,浪潮将围绕AI算力的四大关键作业环节持续创新,即生产算力、聚合算力、调度算力、释放算力,实现AI计算力的全流程、一体化的高效交付。

生产算力,高性能AI服务器将成为智算中心生产算力的“动力机组”,产出强大计算力。浪潮拥有业内最强最全的AI计算产品阵列,浪潮AGX-5是全球最高性能的AI计算主机之一、AGX-2是性能密度最高的服务器。

聚合算力,优化的计算平台、框架和底层算法将进一步完成算力的聚合。浪潮构建了高性能的NVMe存储池,深度优化软件栈,性能提升3.5倍。在数据中心网络加速方面,推出N20X智能网络加速方案,最高可释放50%的CPU资源,IOPS延迟降低30%。

调度算力,通过AIStation管理平台对算力进行调度,实现从模型开发、训练、部署、测试、发布的“流水式生产”与一站式交付。浪潮全新发布AIStation推理平台,是业界功能最强大和全面的AI管理平台,可支持AI训练和推理,可提供AI模型开发和部署的一站式交付。

释放算力,通过AutoML Suite,快速释放AI算力,推动AI在不同产业和行业的应用。浪潮将持续升级AutoML Suite,降低AI应用门槛,快速落地进化AI。同时它还支持本地化和云端部署,已在智慧城市、高铁等客户成功应用。

同时,AI算力需要与行业应用结合,发展智慧计算关键是生态。“元脑生态”由浪潮在2019年提出,元脑旨在联接具备AI开发核心能力的左手伙伴和具备行业整体方案交付能力的右手伙伴,聚合AI最强算力平台、最优质的算法模型开发能力和最优质的集成、部署和服务能力,支撑和加速各行业、各产业与人工智能的融合落地。

目前,已经有50多家左手伙伴和120多家右手伙伴加入了元脑生态,在金融、铁路、电力、交通、智慧城市、石油石化等行业开发了一系列解决方案并实现应用。2020年是元脑生态从能力聚合到产业落地的关键一年,为此,浪潮将投入亿元成立元脑生态发展专项基金 “E基金”。该基金将从联合技术创新、联合市场推广、AI人才培养等维度对生态伙伴提供支撑。返回搜狐,查看更多

我要回帖

更多关于 如何部署一个AI服务器 的文章

 

随机推荐