2021年3月15日,AMD正式发布了第三代EPYC处理器。其支持8通道DDR4-3200内存、最大4TB内存容量、拥有128条PCIe 4通道,采用了Zen 3架构,IPC提升19%,频率相比前代产品也有所提升。架构更新给第三代AMD EPYC处理器带来了多大的性能提升?面对英特尔第三代可扩展至强处理器时是否具备竞争优势呢?结合国外专业媒体servethehome.com(STH)与phoronix.com的测试,我们一起来了解一下第三代AMD EPYC处理器的实际表现。
EPYC 7763性能测试
第三代AMD EPYC处理器的产品线非常庞大,包括64核心、56和48核心、32核心、28核心、24核心、16核心以及8核心总计19款产品。其中顶级的是64核心的EPYC 7763和EPYC 7713,其中前者TDP功耗最高280W,默认频率2.45GHz、Boost频率3.5GHz;后者基准频率略低,Boost频率则提高到了3.675GHz,功耗降低至225W,这也是媒体测试通常使用的型号。另外考虑到为了便于与28核心的英特尔至强处理器进行对比,此次测试的型号还包括了32核心的EPYC 75F3,带“F”字母意味着这是单核心性能优化版本,拥有更高的核心频率和更大的核心缓存。
SPEC基准测试
首先是基准性能,先来看看AMD官方整理的双路服务器成绩对比。第三代AMD EPYC处理器相比前代普遍拥有20%以上的性能提升,其中在8核心产品线的性能提升幅度高达40.8%,64核心产品线的性能提升幅度也达到了20%。另外我们也注意到,带“F”字母的高频版处理器拥有更强的性能,相比前代产品提升的幅度更大。
再看STH进行的SPECrate2017_int_base测试。拉通比较各个平台在SPECrate2017_int_base测试中的成绩,我们可以比较清晰地看到第三代AMD EPYC处理器相比前代产品以及竞争对手,在理论性能方面的优劣。
从测试成绩来看,AMD EPYC 7763称得上目前最强大的X86架构服务器处理器,双路AMD EPYC 7763的成绩全面领先四路英特尔至强铂金8380H/8376HL;双路AMD EPYC 7713的成绩也优于四路英特尔至强铂金8280。另外我们也可以清晰地看到,AMD EPYC处理器的每一次迭代,都意味着性能的大幅提升,其提升幅度远高于行业常规水平。
Python Linux 4.4.2内核编译
这是STH在过去几年中需求最大的基准测试之一。测试很简单:设定一个标准的配置文件,然后利用系统中的每个线程,对来自kernel.org的Linux 4.4.2内核进行编译并自动生成标准配置。测试成绩为每小时的编译次数,次数越高说明服务器性能越强。
Linux内核编译基准测试不仅受线程数量影响,同时也受单线程性能甚至内存带宽影响。从测试结果来看,双路AMD EPYC 7763的成绩已经超过了四路英特尔至强铂金8380H,而双路AMD EPYC 7713的性能则略低于四路英特尔至强铂金8380H。从测试成绩来看,AMD EPYC 7763拥有更高的核心数量,并且单核性能也达到了优秀水平。相对来说,四路英特尔至强铂金8380H只有在需要18TB以上内存或者傲腾持久内存的场景才有竞争力。
7-zip压缩性能
7-zip是一种广泛使用的跨平台压缩解压程序,该项测试早期主要基于Windows平台,目前也是Linux平台测试的一部分。此项测试主要是根据压缩、解压的速度来排序,MIPS数值越大越好。
从测试结果来看,AMD EPYC系列表现非常优秀,双路AMD EPYC 7763与双路AMD EPYC 7713的成绩均明显优于四路英特尔至强铂金8380H。STH还对比了基于ARM Neoverse N1企业级内核架构的双路Ampere Altra Q80-33,面对TDP功耗250W、拥有80个原生核心的后者,AMD EPYC系列依然显示出来明显的优势。从这个角度上讲,ARM架构想要挑战第三代AMD EPYC处理器,还为时尚早。
c-ray 1.1 8K性能
c-ray是一种常用的光线追踪基准测试,可以显示多线程工作负载下处理器的差异,时间越短说明系统性能越强。光线追踪负载与视频分辨率直接相关,在早期平台测试时使用4K分辨率,目前则基本统一采用8K分辨率,未来则有可能提高到32K分辨率。
作为基准测试,C-ray对核心数量、时钟速度和缓存差异都非常敏感。从结果来看,双路AMD EPYC 7763与双路AMD EPYC 7713的成绩均明显优于四路英特尔至强铂金8380H,相比前代AMD EPYC 7742的提升幅度也比较明显。相对来说,双路Ampere Altra Q80-33反而落后并不多。
国际象棋测试
国际象棋的特点是几乎拥有无限的复杂性,此次STH加入了国际象棋测试。在实际测试中,双路AMD EPYC 7763明显领先于四路英特尔至强铂金8380H;双路AMD EPYC 7713的成绩也好于双路AMD EPYC 7742。此外,即便是AMD EPYC 75F3的成绩,也高出AMD EPYC 7601和英特尔至强Gold 6258R。
这样的提升,不仅仅源自频率、缓存,还来自新的架构以及新指令集的运行效率。第三代AMD EPYC处理器在运行国际象棋测试时采用了bmi2指令集,表现出了更加优秀的性能。而在前几代产品上,采用了popcnt指令集,计算效率要略差一些。从这个角度上讲,第三代AMD EPYC处理器的提升是多角度的。
MariaDB数据库定价分析
STH结合自己实际中的一个工作负载设计了此项测试,其用途主要是对一组从数据中心原始设备制造商获取的脱敏数据进行交易管理定价分析。该负载会寻找并分析MariaDB数据库中的产品线、区域、渠道、价格数据,从而根据市场趋势判断交易的优劣,并同步实时的产品配置建议。
这是一种已经具备人工智能推理特性的应用,也是在实际中会在云端运行的负载。更重要的是,其数据量达到了100GB,因此不可能被存储在256MB的三级缓存中。这意味着,其计算结果接近于实际表现,而不会被第三代AMD EPYC处理器的超大缓存过度放大优势。不过即便如此,AMD EPYC 7763在实际测试中相比英特尔至强金牌 6258R也拥有巨大优势,并且明显领先于Ampere Altra Q80-33。
nginx CDN性能
STH使用其网站上的旧快照和访问模式测试了nginx CDN性能,用以体现各个平台可以提供的服务级别。实际测试中,其禁用了内存中的缓存,用以真实体现从磁盘读取数据时的性能。实际应用中,nginx操作需要低延迟,结合服务器上的低延迟I/O访问,就会体现实际网站数据访问时的性能表现。
从结果来看,更高的频率有助于提高数据响应的性能,而高性能的存储也有助于提高nginx CDN性能。从这个角度来看,第三代AMD EPYC处理器搭配PCIe 4.0接口的高性能SSD,可以显著提高整体系统的性能。
KVM虚拟化
STH采用了一项实际工作负载来测试服务器的KVM虚拟化性能,该应用程序来自其演示客户非开源项目。这个测试的目的性非常强,就是在保持SLO服务等级目标的情况下,测试可同时在线的虚拟机数量,这些虚拟机需要彼此独立。
实际测试结果有几个点非常有趣。首先,双路AMD EPYC 7763在不同规模虚拟机的情况下,成绩都优于四路英特尔至强铂金8380H,即便后者拥有高出50%的内存容量。其次,在虚拟机规模逐渐变大后,AMD EPYC 7H12的表现相比AMD EPYC 7763/7713有明显的下滑,这或许是因为虚拟机负载超过了CCX的极限,从而带来了一定的性能损失。而第三代EPYC处理器一个CCX就是一个CCD,拥有8核心和最大32MB缓存,因此可以承载更大规模的虚拟机。
面对英特尔Ice Lake-SP至强
在这个时间节点,评判第三代AMD EPYC处理器的性能表现,与英特尔最新的Ice Lake-SP至强处理器的PK是必不可少的环节。毕竟,后者是英特尔近几年提升幅度最大的一代服务器处理器,同时也可以看作是英特尔为了应对AMD挑战而带来的产品。
SPEC基准测试
首先来看看SPEC的测试成绩对比。SPEC官网的数据显示,在各自的双路系统中,拥有32核的AMD EPYC 75F3 在SPECint 2017 Base Rate的性能上超过拥有40核的英特尔至强铂金8380以及拥有38核的英特尔至强铂金8368。此外,同为旗舰级产品,EPYC 7763在这一测试中的性能领先英特尔至强铂金 8380高约50%。在32核心产品的较量中,EPYC 7543的SPECint 2017 Base Rate性能比英特尔至强铂金8358高15%,并比英特尔至强铂金8352Y高25%。不仅如此,在SPECfp 2017 Base Rate中,相比英特尔的Ice Lake-SP至强处理器,第三代AMD EPYC处理器也表现出了非常明显的性能优势。
LLVM套件编译时间
Anandtech使用当下比较流行的 LLVM 测试套件测试了编译代码的时间。得益于更高的核心密度,双路AMD EPYC 7763以 35% 的优势击败双路英特尔至强铂金8380。此外即使核心数更少,双路EPYC 75F3 的性能也非常接近双路英特尔至强铂金8380。
OSPRay光线追踪
不久前,phoronix.com针对英特尔至强铂金8380与AMD EPYC 7763进行了对比测试,下面我们来看看phoronix.com的测试结果。
OSPRay是英特尔oneAPI渲染工具包当中的开源便携式光线跟踪引擎,其提供了一个开放易用的渲染库,并主要基于CPU进行运算。在科学可视化渲染测试中,双路AMD EPYC 7763的性能大幅领先于其他平台,双路AMD EPYC 7713就可以打平双路英特尔至强铂金8380。双路英特尔至强铂金8380比双路英特尔至强铂金8280快57%,而前者的核心数相比后者增加了42%,从这个角度来看似乎其单核心性能提升并不明显。而在OSPray路径跟踪测试中,双路英特尔至强铂金8380相比前代产品有接近56%的提升。不过在与第三代AMD EPYC处理器的对决中,英特尔平台全面落败,双路英特尔至强铂金8380甚至与双路AMD EPYC 7713都有明显的差距。
Blender与LuxCoreRender渲染
Blender与LuxCoreRender是目前应用比较广泛的免费开源视频渲染器,在这里主要测试了基于CPU的场景渲染。从实际测试结果看,双路英特尔至强铂金8380相比上代产品的提升比较明显,但是相比第三代AMD EPYC处理器依然差距明显,即便是表现最好的情况下也仅仅是接近双路AMD EPYC 75F3。
第三代AMD EPYC处理器性能和定位分析
下面我们再结合第三代AMD EPYC处理器和第三代至强可扩展处理器的价格,来综合对比一下它们的性价比。可以看到,同为当下的旗舰级产品,AMD EPYC 7763的综合性能更高,但其每千片价格比英特尔至强铂金8380更低;同样采用32核心设计,AMD EPYC 7543的每千片价格也低于英特尔至强铂金8358。不仅如此,在性能一致的前提下,12台双路EPYC 7763的3年TCO预估比18台双路英特尔至强铂金8380低36%之多。而在性价比上,第三代AMD EPYC处理器相比竞品的优势更是足以改变格局—单路EPYC 7543的性价比是双路英特尔至强金牌 6346处理器的1.7倍,双路EPYC 7763的性价比是英特尔至强铂金8380H处理器的3.4倍。
结论
虽然英特尔Ice Lake-SP至强处理器已经发布,同样支持PCIe 4.0和8通道DDR4内存,采用10nm工艺,在一定程度上弥补了与第三代AMD EPYC处理器之间最大的差距。但是第三代AMD EPYC处理器在核心密度和缓存容量方面保有优势,同时核心频率较高,其在综合性能方面相比前代有显著的提升。毫无疑问,第三代AMD EPYC处理器是服务器高密度整合的首选,特别是随着软件调优工作的推进,第三代AMD EPYC处理器的性能优势将会进一步得到体现。