MCPLive > 杂志文章 > 全新英特尔至强E5 v4系列处理器解读

全新英特尔至强E5 v4系列处理器解读

2016-06-03特约作者 张山《微型计算机》2016年5月上

处理器性能实测——至强E5 v4对比E5 v3提升几何?

为了一探究竟,MC评测室在同一台英特尔双路服务器上分别安装了至强E5 v3的旗舰型号E5 2699 v3和至强E5 v4的旗舰型号即至强E5 2699 v4;内存统一为8条32GB DDR4 2400组成的256GB四通道内存—由于E5 v3的内存控制器最大支持DDR4 2133,因此测试时内存工作在DDR4 2133频率;在升级完厂商提供的最新BIOS之后,该服务器搭载的S2600WT主板可以正常识别总计44核心、88线程的的双路E5 2699 v4处理器。

测试环境及软件

本次测试以行业公允的SPEC cpu2006为主要考察对象。SPEC cpu2006 是一个应用广泛的大型 CPU 性能测试项目。它是由多个机构组成的非营利性组织建立并维护的一套用于评估计算机系统的标准。为了运行SPEC cpu2006测试,我们为测试平台安装了Windows Server 2012 R2系统,还安装了Visual Studio、C++/Fortran Compiler编译器。SPEC Cpu2006 采用最新的v1.2版本,此外我们还额外加入了SiSoftware Sandra、CineBench R15测试以观察新老两代E5 2699在内存带宽、内存延迟等项目的差异。

测试点评

对于SPEC cpu2006测试,我们一般关心 SPECint_base2006 和 SPECfp_base2006、SPECint_rate_base2006 和 SPECfp_rate_base2006 这 4 个得分,前一组(_base)得分衡量平台完成单个任务的快慢,后一组(_rate_base)得分衡量平台的运算吞吐性能。此外,SPEC CPU 测试还会给出两种类型的结果:Base 基准测试结果和 Peak 峰值测试结果,Base 测试要求编译器套件按照指定的规则进行优化,而 Peak 测试则可以允许使用更多地优化技术,作为平台对比,我们均选择 Base 测试结果。最终测试结果显示新一代至强E5处理器比上一代产品在性能方面有显著提升,例如在SPEC cpu2006 int rate性能测试中,E5 2699 v4的性能得分1690,比上一代型号E5-2699 v3的1261高出了429,性能提升了约34%。通过对比,E5 2699 v3 的单个任务处理能力相比上一代产品分别提升14.9%(SPECint_base2006得分)和25%(SPECfp_base2006得分),由于该项测试大部分时候仅使用到单个核心(处理器运行在最高睿频),E5 2699 v4(3.5GHz)相比 E5 2699 v3(3.6GHz),在频率稍低的情况下,性能却有所提升,证明了 Broadwell- EP 的架构优势确实存在;在多核心满载测试时,两者都工作在2.8GHz频率,但凭架构以及更多核心的优势,E5 2699 v4依然获得了30%左右的综合性能提升。

而从SiSoftware Sandra和CineBench R15的测试结果我们可以一窥至强E5处理器与普通家用处理器在性能上的巨大差异,以及E5 v4相比上一代产品在内存带宽、延迟、内联核带宽等方面可观的的提升幅度。E5 v4的DDR4 2400内存控制器比前一代产品的DDR4 2133控制器在内存带宽上取得了约14%的优势;而新一代Broadwell-EP的三级缓存性能更是比前一代产品有了40%的提升。

SPEC Cpu2006 v1.2对比测试结果

SPEC Cpu2006 v1.2对比测试结果

CineBench R15对比测试结果

CineBench R15对比测试结果

SiSoftware Sandra对比测试结果

SiSoftware Sandra对比测试结果

SPEC cpu2006是行业公允的服务器、工作站处理器性能测试软件。

SPEC cpu2006是行业公允的服务器、工作站处理器性能测试软件。

至强E5v4处理器的前沿应用实例

单纯的基准性能分析看起来难免略显枯燥,接下来让我看来看看至强E5 v4处理器在最终行业用户手中发挥出的实际作用。

中国移动通信研究院首席科学家易芝玲博士

中国移动通信研究院首席科学家易芝玲博士

中国移动:RDT助力展望5G时代

“从4G跨到5G和我们之前的端到端的跨越,他们是有区别的,最大的区别是在于我们新的技术并不是无线电方向的,现在我们发现这些新的演进并不是硬件的,而是软件的,而是云端的。正是因为我们不仅仅需要非常完美的基站的功能,能够非常好的一些虚机的功能。我们希望这些基站在未来能够成为一个小的数据中心,成为一个小的虚拟机,与此同时这些网络上的虚机和基站,在这些基站上我们需在上面施加更多的应用。这样的功能是需要我们减少它的延迟时间,能够让它们更加的灵活,能够更好的去调节一些本地需求。”

    “基于我们的经验,是否能够减缓延迟是对我们很大的挑战。这些软件、这些CET和CMT的技术都是利用了RDT(来自至强E5 v4处理器)的技术。有了和英特尔的深度合作伙伴关系,我认为它会给我们带来一个全新的合作愿景,我们可以去从头看到这些表现和性能,不管是吞吐量还是丢包率,我们会发现他们有非常大的提升,提升率在10%-30%,当然这是取决于我们所遇到的困难,取决于我们所处在不同的条件和场景下。总的来说平均提升了18%,提升上限是50%,这是一块巨大的数字,非常了不起的数字。”

百度开放云副总经理谢广军

百度开放云副总经理谢广军

百度开放云:底层技术+创新能力=收益

“百度的开放云,我们的目标是融合了云计算技术、大数据技术和人工智能技术于一身,我们希望能够把这样的一些技术,不仅是百度能用,也希望第三方我们的合作伙伴,我们的客户,我们的一些创业者也能够使用这些能力以及使用这些技术E5 v4的性能比上一代E5 v3提升在15%-20%之间,但功耗下降却是5%-15%。这样就驱动着我们TCO的节省。我们机器学习方面的产品,CTR预估这样一个子模块,在这样的产品当中我们使用英特尔的E5 2699 v4处理器以及AVX2指令集,比传统的方式有67%的性能的提升。除了性能的提升、功耗的降低,在E5 v4这样一个平台上,我们还用到了英特尔CPU很多特性,比如刚才说到资源管理技术,也就是L3 CAT的一个管理技术,那么我们把它用起来之后,其实是和我们的QUS混布起来的程序QUS更加可控。”
“英特尔的底层的技术和我们软硬件优化协同技术和我们联合起来在数据中心的创新能力,这几点结合起来,在百度的数据中心,在性能、功耗、TCO和我们业务场景上都产生了非常大的一个收益。”

写在最后

从初代E5到如今的E5 v4,英特尔在能效、稳定性、功能和智能化革新方面一直在前进。处理器作为云时代的基石,也是英特尔Cloud For All即“云承万物”理念的有力支撑。无论是架构改进、规格提升,还是看实际性能表现、用户反馈,至强E5 v4交出的答卷无疑是令人满意的。除了“中流砥柱”E5系列,英特尔还通过各个级别、定位清晰的庞大家族式产品线完成了x86阵营对ARM等阵营的卡位阻击。4月份举行的IDF上,英特尔表示将为一小部分客户测试其首批集成FPGA和至强处理器的解决方案。这种将Altera Arria 10 FPGA和英特尔至强E5 v4处理器封装在一起的芯片是可定制的处理器,其接口延迟更低,一致性更好—对下一代网络设备、通信基础设施和数据中心的负载加速具有革命性意义。这种定制处理器的性能很强悍,在业界标准的FPGA加速测试中其性能可获得10倍提升,在此不做赘述,重点在于它让我们看到了至强处理器新的应用形态。

在“生态”概念大行其道的今天,至强E5 v4对英特尔生态系统而言无疑又是一次有益的添砖加瓦。而无论是定制化至强处理器,还是通过与合作伙伴共同打造高性能计算平台,英特尔在下一代大数据、云计算、机器学习以及虚拟应用环境之路上的耕耘无疑已经更加深化。

分享到:

用户评论

用户名:

密码: