S9200WK:关于56核400W Xeon服务器的几点疑问

本文内容非商业用途可无需授权转载,请务必注明作者及本微信公众号、微博 @唐僧\_huangliang,以便更好地与读者互动。

目录

CPU规格、Optane Persistent Memory支持疑问

2U全高双节点反而不支持56核400W CPU

4200W电源输出:超过高密度GPU服务器

Xeon Platinum 9200合作伙伴:都是集成商?

昨天给大家分享《_Intel第二代Xeon Scalable发布:最多56核多芯片封装_》时,我写明了只是从国外网站截几个图并简单整理,有朋友提醒我其中有CPU具体规格不准确的地方,因为我写的时候Intel官网上相关信息还没放出来。请大家以下面ark.intel.com网站为准。

https://ark.intel.com/content…

看过我几篇文章(可能只算得上随笔)的朋友应该会注意到,我重点关注或者想推荐给大家的技术点都会标黄色突出。

具体到这次的发布,我觉得比较有意的除了400W TDP的Xeon Platinum 9200系列(代号Cascade Lake-AP)本身之外,还有BGA封装(焊在主板上,不像LGA-3647那样有个插座)以及Intel只卖服务器系统整机(S9200WK)的销售模式,以及目标应用——HPC和AI。

公众号更新发出来之后,有时我也会补充调侃两句:)

上面截图是一位友人在朋友圈的留言,没征求人家意见故隐去了名字。BGA封装可以做到更薄,CPU发热部分离上盖可以贴的更近,确实有助于提高散热效率。比如有些笔记本CPU甚至不加保护盖,Die与散热片直接接触。

今天就想围绕Intel S9200WK这个系统跟大家聊聊。首先Xeon Platinum 9200系列CPU是焊在主板上这个不用多说了,上图中是1U半宽液冷的双路节点,整个2U机箱就是4节点。

注:下文中我还会列出详细规格并讨论。

1U半宽应该还有风冷的选择,这时只支持32核250W CPU,和之前那些2U 4节点服务器支持的28核205W Xeon SP就差距不大了。

扩展阅读:《_2U 4节点Xeon SP服务器设计:扩展性与散热的权衡_》

此外Intel在S9200WK上还提供两种2U半宽节点——风冷和液冷,即2U机箱内容纳2个双路节点。这里我有一点没太看明白的地方。下面先看CPU方面的疑问:

Xeon9200 CPU规格、Optane PersistentMemory支持疑问

 

大家有没有觉得Xeon Platinum 9222和9221有点奇怪吗?这个图我是从下面链接截的,与我昨天文中引用的不同,到底应该以哪个为准呢?

https://www.intel.com/content…

 

第2个小问题与9200系列CPU的内存通道有关,由于“胶水封装”的原因,2个Die的内存控制器加起来一共12通道(也有类似AMD EPYC Socket内部NUMA问题),每通道支持1条内存。这样应该就不支持同时发布的Optane PM持久化内存了。因为3D Xpoint还是与DRAM不同,无论性能还是写寿命啥的,应该不能完全替代内存使用。

扩展阅读:《_多级NUMA:AMD EPYC互连速率、位宽与功耗的关系_》

2U全高双节点反而不支持56核400W CPU

_点开后双击可放大,以下同

我针对S9200WK 2U半宽节点有个疑问:风冷散热能够比1U的250W支持更高功耗达到350W很正常,为什么液冷的也只支持48核350W而没有56核400W呢?只是产品策略原因吗?

内存的情况刚讨论过,我看到1U半宽节点上只提供2个M.2 SATA/NVMe SSD存储选项,类似于启动盘的用途对于HPC倒也还合适,毕竟还可以接Lustre、GPFS等文件系统存储节点。2U半宽节点增加了2个U.2热插拔SSD支持,同时PCIe 3.0 x16插槽从2个增加到4个。

不过由于CPU实在是耗电大户,S9200WK应该没有考虑支持GPU啥的,Intel资料中甚至直接写这些PCIe是用于高速网络互连的。

不出所料,风冷机型是High-Flow Air-Cooling,想玩的朋友要做好高速风扇噪音的心理准备。

4200W电源输出:超过高密度GPU服务器

 

如上图,Intel S9200WK选择了冷板式液冷,同时还会保留3个60mm风扇辅助外围组件散热。液冷通常建议整机架部署或者对机房设施进行改造,因为铜管只负责将热量带出服务器机箱,接下来往往还是要借助风冷和精密空调,如果浸入式液冷部署会更麻烦。

我关注的最后一个技术点是2+1冗余电源模块——3个1600W或者2100W,看来1+1冗余的功率已经不够了。这样2U机箱耗电可能达到4200W(光是8个400W CPU就有3200W),比许多高密度GPU服务器还要猛啊。

扩展阅读:《_九条大道通GPU:HPC服务器PCIe之灵活应用_》介绍的1U 4__计算卡机型,是1600W__或者2000W 1+1__冗余电源,支持4块300W GPU。

大家有没有算过,如果按照220V 32A(双路)的机柜供电来计算,一个机架能放几台满配的?

XeonPlatinum 9200合作伙伴:都是集成商?

在Intel网站上还可以看到Intel S9200WK的合作伙伴,下图是美洲区域的。

不仅没有Dell、HP、Cisco,连“白牌大王”SuperMicro也不再。看来不只是Intel不给OEM供货零组件,Intel都做好S9200WK整机对外卖,ODM也没法玩啊。感觉Xeon Platinum 9200更像是在HPC市场先小规模试下水(大规模就成本敏感了,这个性价比…),技术实现和宣传标杆的意义可能确实要大于卖机器。

另一方面,BGA封装CPU一旦焊到主板上几乎就无法改配(难度太大),S9200WK似乎按照接单再生产合适一些,不然合作伙伴也不太好备库存。看来为了改善散热这代价也不容易,TDP太高了不好玩啊。

推荐阅读

  • CPU Pmax和GPU峰值功耗——你需要多大电源功率?
  • AMD EPYC二代服务器预览:Dell扩展2U 4节点HPC机型

本文转载自企业存储技术微信公众号,[原文链接点这里]。
注:本文只代表作者个人观点,与任何组织机构无关,如有错误和不足之处欢迎在留言中批评指正。 进一步交流技术可以加我的微信/QQ:490834312。
尊重知识,转载时请保留全文,并包括本行及如下二维码。感谢您的阅读和支持!《企业存储技术》微信公众号:HL_Storage,也欢迎关注企业存储技术极术专栏,定期更新。

发表评论

邮箱地址不会被公开。 必填项已用*标注