MCPLive > 杂志文章 > Avoton平台新凌动逆袭ARM

Avoton平台新凌动逆袭ARM

2013-11-25陈增林 袁怡男 盘骏 曾智强 黄博文《微型计算机》2013年10月下

以“开放”之名:服务器市场争夺

据IDC的资料显示,去年的全球服务器交付量中,x86服务器占到98%,收入占到了70%。在数据中心领域,英特尔几乎获得了全面的胜利。回想2000年左右,英特尔一统消费级PC市场,正寻求新的利益增长点。当时互联网行业开始崛起,涌现出一大批诸如Google之类的初创企业。而当时在企业市场占据主导地位的RISC方案采用纵向扩展(Scale up)的方式,即追求单机性能的强大稳健,但初始投入成本高,且扩展难度大,当应用提出的需求超过一定级别,会遭遇性能瓶颈,而系统的更新换代则会涉及数据迁移等高风险操作。

Avoton平台新凌动逆袭ARM

当时英特尔从PC开始就提出了“开放的标准化”策略,随后致力于推动x86处理器成为事实上的工业标准。英特尔除了保留CPU的设计权限之外,周边设备都可开放,以此构建一个x86独有的生态环境。英特尔x86这一相对廉价的解决方案却吸引了Google等互联网企业的关注。经过Google等公司的推动,终让横向扩展(Scale out)成为x86有别于RISC的一大优势。x86所具备的这一基因被英特尔发现,并迅速放大,作为特色优势推出,逐步受到大多数企业用户的认可,终以英特尔为代表的x86服务器占据了企业市场。

在英特尔攻掠高端RISC市场的同时,其后院却遭到了RISC小弟ARM的袭击。在不经意间,ARM复制了英特尔的成功模式。但ARM比英特尔更加开放,在保留专利的基础之上,连处理器架构技术都对外授权,以此成功构建一个全新的RISC生态系统。并且,ARM生态圈成功地抓住了移动终端爆炸式增长的机遇,以低功耗、支持智能系统为特点的ARM架构移动处理器占领了新兴的手机、平板等市场,成功地在英特尔的后花园开辟了新的战场。

历史总是惊人的相似。十年前,英特尔以桌面级市场为依托,用“开放、以量取胜、满足应用需求”三大法宝逼得以IBM、Sun为代表的RISC服务器节节败退。如今,以A RM为代表的新RI SC处理器厂商用几乎同样的策略完成了对英特尔消费移动客户端领域的“包抄”,然后开始打算进入利润率高、以英特尔和IBM Power为代表的传统企业级战场——数据中心。那么ARM能成功吗?云计算与大数据时代来临,使得数据中心相关行业的需求再次发生变革。随着大规模数据中心的不断增长,能耗成为不可避免的话题之一。以英特尔至强处理器为代表的系列产品,其发展路线是在保持能耗一定的基础之上,尽可能地追求更高的性能。而以Google、Facebook为代表的互联网厂商却希望能够在性能满足应用的基础上,在一部分应用上将能耗尽量降低,例如冷存储和一些SDN服务器。

据IDC公布报告预计,到2020年,全球数据总量将达到40ZB,即相当于人均5247GB。在这之中,IDC认为,文件、电子邮件和视频等非结构化信息约占未来十年数据产生量的9 0%,即非结构化数据的增幅将远远超过传统的关系型结构化数据。而这些非结构化数据一经保存(不可删除),通常长期不再访问,如何尽可能降低这类型应用的能耗以节省成本,成为数据中心提供商所关心的话题。而这也给以低功耗著称的ARM带来了机会。

Avoton:英特尔的强势反击

其实英特尔也察觉了这样的需求,并且敏锐地认为:在这个低功耗服务器处理器市场,决胜局将在64位产品。于是,英特尔在去年就率先面向数据中心发布了首款64位凌动处理器—S1200。只不过,这款采用32nm工艺制程和顺序执行架构的处理器虽然在支持64位方面是领先的,但综合性能在与ARM的竞争中并不算出色,没能给28nm制程、低功耗、多采用乱序执行架构的ARM阵营产品带来致命的威胁。但英特尔的优势在于从技术储备到实际产品的转化速度非常快。今年9月,英特尔又发布了面向数据中心的第二代64位凌动处理器——C2000(内部代号Avoton平台,以下简称Avoton)。

不到十年时间,英特尔 x86与RISC在服务器市场的份额对调
不到十年时间,英特尔 x86与RISC在服务器市场的份额对调

凌动C2000系列处理器确实被英特尔寄予了厚望。首先C2000系列采用了新的22nm 3D晶体管制程工艺,相对于ARM阵营目前主流的28nm制程,制程领先的优势立即显现出来,同时也一定程度上解决了此前的功耗问题。在性能方面,C2000采用乱序执行的全新Silvermont架构核心,带来的效果就是性能显著提升。与上一代采用顺序执行架构的S1200相比,据英特尔官方资料显示,其速度提升达7倍,每瓦性能则提升达6倍。

虽然ARM阵营一年多以前早早就宣布了64位ARM v8架构的CortexA53/57服务器处理器计划,但其首款真正上市的产品却要到2014年才正式生产。也许,新产品会采用20nm工艺制程(并不一定是3D晶体管),但因此优势会重新回到ARM阵营吗?且不说ARM阵营多数没有自己的晶圆厂,在制造工艺方面面临各种挑战,即使完全实现这个进度,根据英特尔公布的线路图,明年第三代64位凌动服务器处理器又将发布,会采用14nm工艺。也就是说,届时英特尔服务器凌动处理器的工艺会赶上桌面级产品,实现同步制程升级,拉大领先优势。显然,英特尔已经不再是警惕ARM,而是试图利用更快的制程和微架构更新速度将ARM“驱逐”出数据中心市场。

所谓Scale out横向扩展架构,即用户可在较小的初始投入成本之下,以少量服务器起步,随着业务的不断扩张,利用“分布式”的方法逐台添加服务器实现性能的增长,用软件架构解决单机性能不足的问题,终形成由多台设备构建的服务器集群,在逻辑上可看做一个大的“服务器”,其性能远比单台基于RISC设计的服务器高得多。

Avoton的变革在哪里?

代号Avoton的凌动C2000系列新处理器是否能给ARM阵营一个下马威、将ARM进军数据中心的“野心”扼杀于萌芽之中呢?这肯定还需要市场的检验,要看它是否能够满足这些低功耗应用数据中心的性能及功耗需求。下面我们就来看看Avoton平台究竟带来了哪些不同。

Avoton的反击非常犀利
Avoton的反击非常犀利

ARM以更加开放的姿态进入服务器市场
ARM以更加开放的姿态进入服务器市场

上述应用就是适用于凌动处理器的新兴、多样化负载环境
上述应用就是适用于凌动处理器的新兴、多样化负载环境

Silvermont架构图
Silvermont架构图

Cortex-A15架构图
Cortex-A15架构图

Avoton组成模块
Avoton组成模块

内核架构大幅度优化

此前的凌动处理器一直采用顺序执行架构,这在一定程度上是为了降低功耗,但确实对性能有影响。但在ARM阵营宣布其64位服务器CPU提供乱序执行的高端Cortex A57与低端顺序执行的Cortex A53之后,英特尔要关注的就不仅仅是功耗了,性能上也不能给竞争对手口实。于是,新一代Avoton平台的核心架构升级到了Silvermont。这个架构第一次在凌动阵营中引入了众望所归的乱序执行。由于目前关于Cortex A57的资料非常有限,在下文的架构对比中,我们更多地是与ARM目前32位处理器中强的Cortex A15进行对比研究,虽然它与Cortex A57可能存在一定的差异,但两者的设计思路是接近的。

Silvermont的整体结构上仍然保持双发射设计,理论高IPC(每时钟周期执行指令数量)为2。也许有人会问,消费领域的Cortex-A15就已经支持乱序三发射了,这是否意味着ARM的架构性能一定领先Silvermont呢?未必。流水线的宽度仅仅是衡量处理器性能的指标之一,一般来说实际IPC受制于多种因素,访存停顿、分支预测失败、乱序执行所需的保留站、重排序缓冲区满载等情况都会使实际IPC大大低于理论值,况且CISC指令集的密度高于RISC指令,二者的IPC不可直接比较。但有一点是肯定的,二者都在试图通过乱序多发射提升单线程性能,后端指令执行的能力都大幅加强,这意味着这两个微架构都必须加强前端的指令交付能力,以保证后端的流水线满载。

那么就让我们首先对比前端设计。从分支预测上看,双方采用了近似的架构,整个分支预测器都由一个主预测器和一个从预测器构成。从预测器较小,预测准确率较低但是延迟也低,Silvermont和Cortex-A15都选择在指令读取部件内安插这个从预测器来帮助快速预判分支。而在主预测器上,双方也都采用了gshare预测器的哈希技巧,都囊括返回栈预测器和间接跳转预测器,而且这个主预测器也都被安排在指令解码阶段,通过指令解码获取的信息进一步提高分支预测准确率。由于主预测器的历史记录表较大,能够记录更多过往的分支指令执行情况,当主预测器与从预测器的预测结果不符时,主预测器的输出将盖过从预测器。从分支预测的整体结构上看,二者颇为相似,只是由于Cortex-A15的流水线拉的更长,因此分支预测失败损失达到13周期,而Silvermont则缩短到10周期。在指令读取上,Silvermont与A15的指令读取带宽均为16字节,但考虑到代码密度不同,带宽直接对比同样没有意义。值得一提的是Silvermont还在流水线前端安排了六个缓冲区,将指令读取与指令解码隔离,在读取指令发生停顿的时候,将不会有新指令被送进缓冲区,但是只要缓冲区中还留有未解码指令,指令解码单元就不会闲置。指令读取器可以趁着缓冲的时间恢复交付。在ARM的文档中笔者未见到类似的设计描述。

接着看指令解码阶段,A15和Silvermont都在这个阶段中部署了循环指令检测。这是一种能够降低功耗同时提高单线程性能的技术,但需要一定的面积开销,也会提升设计复杂度。这种技术的可行性研究出现于上世纪90年代,其理论基础是,程序代码中存在许多循环,并且这些循环的局部性较好,少部分循环会执行许多次,并且执行次数也能够预测,因此若是在硬件中引入一个循环指令检测器,在检测到进入循环执行之后,将循环内部的已解码指令全部保存到缓冲区里,随后就可以将前端关闭,以后每次发射循环指令都从缓冲区中送出,相当于硬件自动进行的循环展开,既降低了指令执行延迟也降低了功耗,可谓一石二鸟。Silvermont和Cortex-A15都引入了这项技术,这是嵌入式处理器微架构逐步向高性能微架构靠拢的又一个例证。

后看流水线的乱序执行部分,Silvermont的乱序执行窗口大小为32,A15为40+左右,乱序执行窗口大小代表着乱序执行阶段所能同时容纳的指令数目,这是衡量乱序能力的重要指标之一。同时乱序执行的指令越多,代表处理器的指令调度能力越强,越能够容忍缓存缺失的情况,但是设计上也越复杂。不过,考虑到二者指令集不同,乱序执行窗口大小同样不能直接用字面值衡量。这两个架构都采用了便于提高能耗效率的分布式保留站设计,五个流水化执行单元都配备自己的独立保留站,在具体的保留站大小上,仅知ARM的访存指令保留站比Silvermont更大但是不能完全乱序,其余不明。两个架构都具备一个流水较短的执行单元用于分支的快速判断,从分布式保留站的发射能力总和上来说,A15为8发射,要高于Silvermont的5发射,可以说A15的乱序指令框架的设计更加激进一些,但这种设计能否提高实际执行能力还有待实测数据的检验。

英特尔宣称Silvermont相比前代Saltwell单线程性能提高了1倍,这并非一个夸大的数字,由于低功耗市场的性能起点较低,加之引入了乱序执行这样的重大架构变化,单线程性能有飞跃性进步是可以实现的。作为一个感性的对比,Core微架构的乱序执行窗口字面值为96(考虑到宏指令融合,实际容纳能力要更高一些),从保留站到多个执行单元可以进行6发射,其SPECint 2006得分大约为2000+,而Silvermont的得分大约为Core的一半,可见嵌入式高性能微架构还有较大的潜力可挖。

另外,由于CISC和RISC的指令集差异巨大,我们并不能简单地通过一些架构参数值来判断性能的强弱,而ARM架构的服务器产品又很少见,所以终两者性能的差异需要等到未来Cortex A57上市之后的具体测试来验证。本文中我们会给出一些Avoton凌动与Xeon E5的性能对比,来帮助大家理解低功耗服务器处理器的性能究竟处于怎样的水准。

多核心的弹性扩展方案

对于服务器和数据中心而言,增加每个节点的核心数量是提升服务器密度的重要方法。上一代凌动S1200系列只有双核心配置,所以很多OEM厂商和用户并不是特别积极地选择。英特尔显然也看到了问题所在,在这一次Avoton平台中,对此已有针对性的考虑。Avoton的设计中,每两个Silvermont架构核心组成一个模块,模块内共享一块1MB大小的二级缓存,模块层次上允许灵活配置,可以通过连接1、2、4个模块形成2核心、4核心和8核心的不同规格多核心处理器,功耗区间为5~20W上下。对比ARM,Cortex-A15的做法是每四个核心形成一个集群,集群内部可以配置多4MB的二级缓存,每块芯片可以选择配置1-2个集群,因此在多核心的可配置性上,英特尔的组合更多。

Avoton实现了高度整合,核心面积更小,功耗控制更高。
Avoton实现了高度整合,核心面积更小,功耗控制更高。

向多核心的扩展并非是简单地加入多个模块就能解决。当核心数量增多时,维护缓存一致性的压力也将同时增大。Avoton多允许四个模块,一共八个核心,分别共享四块二级缓存。这四块缓存会统一连接到一个crossbar上,通过这个crossbar来维护多核计算的缓存一致性。这个crossbar被英特尔称为SSA,对内存的连接,和对所有I/O的连接都将经由这个SSA来进行,这个SSA能够提供25.6GB/s的带宽,正好与内存控制器的峰值带宽齐平。反观ARM,Cortex-A15每个集群内部四个核心有一层一致性维护机制,通过AMBA4接口还有另一层一致性维护机制,AMBA4接口的宽度为128位。至于扩展效率和一致性维护的方法是否高效,还是要等ARM的产品投入实用测试之后才能证明。

这部分的后我们要谈一谈虚拟化。新的Avoton处理器首次开始支持英特尔VT-x2硬件虚拟化技术,这对于数据中心来说也是极其重要的一点,有利于弹性分配计算资源,而且基于x86架构的软件一致性设计优势也非常重要。毕竟不用软件迁移,能够大大节省成本,还能加快应用和服务的部署及交付。

内存与I/O的优化

Avoton配备了双通道DDR3内存控制器,支持1.5V电压下运行的普通ECC内存和1.3V电压下运行的低功耗内存,支持ECC内存。每个控制器有两个内存插槽,总共四个插槽。每颗处理器大支持64GB内存,能够以25.6GB/s的峰值速度将数据取入二级缓存。在I/O接口方面,Avoton支持更强大和主流的外部设备接口。两个SATA 6Gb/s接口、四个SATA 3.0Gb/s接口、四个USB2.0接口以及多4个千兆网卡接口都让它与外部设备连接的能力大幅度提升。而且它还具备四个PCI-E 2.0控制器,可以实现各种PCI-E通道的组合。为了有效管理这些可能连接的I/O设备,在Avoton上英特尔特别设计了被称为IOSF的内置片上系统总线结构,将对速度要求较高的PCI-E总线直接连接到高速总线上,而其它设备则连接在中速总线上,避免低速设备干扰和影响高速设备。由于目前ARM产品的信息非常有限,我们无法直接对比,只有ECC校验方面,我们知道ARM也是有相关设计的,作为服务器产品来说这是必备条件。

专为提升性能功耗比而设计

Silvermont微架构由于引入了乱序执行,并且将睿频状态下的主频提高到了2.4GHz甚至以上,其性能比前代Saltwell有了较大提升,但先进的架构和制程、电路级功耗管理设计使得它在同等性能下的功耗降低了4.7倍。

由于是针对特定应用的服务器产品,英特尔也在Avoton上提供了各种规格来适应不同的需求。有偏重性能的八核心、2.4GHz运行频率以及20W功耗的旗舰,适合对性能有较高要求的通用性能服务器或者Web前端服务器。但对于冷存储来说,也许更关注的是机架密度和性能功耗比,因此Avoton也提供了四核心或者双核心的产品去适应用户需求。新的Atom C2000系列SOC所占的空间和功耗开销都将只有低端Xeon E3的一半。根据英特尔按现有产品测试后估算的数据,Avoton在性能功耗比上将是竞争对手ARM v8架构产品的1.8倍以上。至于是否真是如此,只有等明年ARM产品上市才知道究竟了。

单线程性能和功耗对比

单线程性能和功耗对比

Avoton平台新凌动逆袭ARM

Avoton测试性能大揭秘

我们使用了SPEC CPU2006测试套件,对8核Atom C2750与16核32线程的双路Xeon E5-2690进行了测试。SPEC CPU是一个应用广泛的大型CPU性能测试项目,由SPEC(Standard Performance Evaluation Corporation,标准性能评估公司)推出。SPEC是由计算机厂商、系统集成商、大学、研究机构、咨询等多家公司组成的非营利性组织,这个组织的目标是建立、维护一套用于评估计算机系统的标准。SPEC CPU2006包括12项整数运算和17项浮点运算,以一台Sun Ultra Enterpirse 2工作站作为基准参考系统,系统基于一颗29 6MHz的UltraSPARC Ⅱ处理器。

SPEC CPU 2006会给出8个数字,我们一般关心的是base调优的4个得分,分别是整数int和浮点fp的SPEED测试,以及整数int和浮点fp的R ATE测试,前者衡量平台完成单个任务的快慢,后者衡量平台的运算吞吐量。测试结果是Avoton平台的SPECint_base2006为15.9,SPECfp_base2006为22.8,SPECint_rate_base2006为97.9,SPECfp_rate_base2006为76.4,作为对比,基准频率达到2.9GHz并可以Turbo到3.8GHz的双路、16核32线程Xeon E5-2690的成绩分别为51.8、88.8、661和484。从速度上来说,2.4GHz的8核Avoton可以达到2.9GHz的16核32线程的双路Xeon E5-2690的30%和25%,从吞吐量上来,可以达到14%和16%。限于时间关系,我们没有拿到Xeon E3单路平台,用单路和顶级双路平台来对比有些不公平。按照英特尔的做法,Avoton应该是用来与单路E3来对比,这样Avoton大概可以达到60%的计算速度,对比上一代Atom的提升非常巨大。

从计算能力看,Avoton对比上一代有了巨大的提升,它支持和Westmere Xeon一致的SSE4.2浮点SIMD指令集和AES加密指令集,能给网络、存储方面的运算带来极大的加速,并且还具有很低的功耗,在入门服务器市场将会有很大的前景。

CSBi企业解决方案中心高级评 测工程师师 盘俊
CSBi企业解决方案中心高级评 测工程师师 盘俊

金山云的存储平台除了金山快盘,还与小米和蓝汛达成了合作,成为了它们的云存储技术提供商。我们经常说自己是大数据公司,职责是把数据存好。还有一个关键的要点,存储成本一定要低。

金山云首席技术官 杨钢 先生
金山云首席技术官 杨钢 先生

既要把数据保存得很好,不能丢失数据,数据响应又要很快,这实际上涉及到巨大的成本,面临很大的技术挑战。这事实上是要兼顾数据的访问能力和TCO控制这两个要素。我们发现,各种数据在使用上都有一个规律:绝大部分的数据是属于我们要保管好的冷数据。就好像现在数码相机普及之后,大家拍了很多照片,实际上大家不会每天都把照片拿出看一遍。而这些照片的容量又很大,大家又都不希望拍的照片数据丢掉。我们在技术上做了很多改造,首先重要的是对这些数据进行了冷、热分层,按照一些统计规律,根据数据使用情况分很多层。现在问题来了,分层冷热数据之后,冷数据部分如何降低成本呢?

存储访问不像数据库运算,首先它的TDS落实到每块硬盘上是非常低的,事实上冷数据存储时TDS可以低到个位数,用户的性能需求不是整个系统要考虑的,反而要考虑数据的修复。现在随着硬盘越来越大,明年单盘可能达到8TB,但对于存储来说,硬盘是很容易坏的。所以把数据放在云存储上比硬盘上更安全,因为云存储本身有专门的解决方案。修复反而是存储系统设计关键的一环。现在存储系统比较主流的做法有两个,一个是三倍镜像,它的好处是直接对拷不需要太大的计算量,但是存储份数比较多,成本自然比较多;另外就是EMC在采用的擦除码方式,主要是会涉及到高阶运算,所以对CPU综合性能的要求比较高。数据的修复是我们选择CPU重要的一环,在任何情况下数据本身不丢是核心的需求。

盛大游戏有限公司数据中心运营经理 季青 先生
盛大游戏有限公司数据中心运营经理 季青 先生

在满足这个条件的基础上,我们再考虑一个系统能带多少块硬盘,同时并发的I/O、同时并发的修复是多少。如果一个芯片只带四块硬盘,从性能来说足够了,但是存储密度太低了,这样在集群里机器的数目非常多,会使得整个系统效率也有一定的下降。我们在评估上一代凌动的时候认为,可能性能上存在问题。我们也评测过非英特尔的服务器CPU架构,在计算密度等方面,也都遇到了一些问题。所以,长期以来我们都是使用至强作为存储服务器的CPU。要知道,单颗CPU要管理那么多的硬盘,并且还要及时提供实时修复,这是非常大的挑战。

当我们知道有Avoton这个产品要发布的时候,觉得很可能在冷数据存储上找到曙光。在常规的I/O处理和数据计算上,相比Xeon E3,Avoton确实存在性能差别。在绝对速度上,E3确实比Avoton快出一半多一些,但如果综合考虑功耗、计算能力和I/O能力之间的平衡,我们发现Avoton的性能提升已经让它足够我们使用。它提供了完成一个系统所需要的性能,正好是冷数据处理软件设计非常舒服的区间。而在测试上一代的凌动或者与其他架构产品时,我们确实遇到了一些抉择:是不是要为了这个CPU,改变我们的存储数据结构,但是Avoton提供了足够的空间,不用改变。举例来说,如果说第一代服务器凌动带4块硬盘,基本是一个满足性能的极限,那么这次Avoton测试中,即使是到了8块硬盘,Avoton也没问题,而且这还只是用到8核其中的一个核心,它还有很大的潜力可挖。我们已经按照计划把它引到生产系统中,它是我们正式引入到生产系统中的、第一个不需要主动散热的一款服务器。未来我们在做自己的冷数据机房时,这可以做很多的联动。而从用电量上来看,Avoton也至少可以节省25%,大概在25%~30%之间。再加上硬件上Avoton的强劲性能,我们认为:新的Avoton凌动C2000系列平台就是金山云一直正在寻找的冷数据存储解决方案。

盛大是老牌的游戏运营商,旗下的游戏超过100款,运行这些游戏需要非常多的服务器,所以很不幸,我们部门现在已经成为整个公司里花钱多的部门,老板每个月付费的时候总是非常心痛。如何降低数据中心的TCO,是我们面临的困难和挑战。通过职业敏感性,我们觉得低功耗或者绿色计算将成为整个数据中心的趋势,而这一次我们提前测试的Avoton正是印证了这一趋势。

可能有人有这样的疑问,什么样的环境适合用Avoton。根据我的理解,Avoton的定位是非常清晰的,如果你的应用对CPU的计算能力需求是中等或者中等偏下,同时对功耗或者高密度非常敏感,就非常适合Avoton。盛大的所有业务中我们找出了三种业务适合这样的需求:Web接入服务器、CDN服务器、Hadoop的数据存储分析服务器,也就是冷存储应用。目前盛大的Web服务器、冷存储服务器的单位负载的CPU负载非常低,大概只有10%,并不是说这些业务没有负载,而是这种业务对CPU计算需求比较小,大部分CPU资源只是用来响应I/O请求之类的操作。这就造成服务器功耗很高,但利用率很低,机柜密度很低,终导致我们的IT成本非常高。

我们使用Avoton的服务器进行了一些测试。测试结果表明,对于同样级别的客户端请求,Avoton的CPU利用率大概在21%左右,可以说非常轻松胜任这类工作,也就是说这种类型的应用它的压力并不在CPU上。另一个测试则是针对高并发I/O时的CPU负载测试。其结果是,IOPS达到10万的时候,CPU负载大概在50%。10万IOPS是什么概念?目前的CDN服务器后落到SSD上的IOPS是一千到三千,冷存储服务器用于数据备份的大概在十万左右。也就是说,如果你的应用以消耗I/O请求为主,这种业务Avoton非常适合。

在英特尔的阵营里,我们原来把基于凌动的服务器看作小弟弟的角色,但如今有点不一样了,Avoton的定位非常清晰,我们更愿意把它看成奇兵一样的角色。在特定的领域里,它的优势非常大。其次,Avoton能提供更好的能效比。我们对比两台Web配置服务器,基于Avoton服务器的功耗不到现有Web服务器的一半,能提供的能效比是目前服务器的2.2倍,当然计算能力是相当的。

说具体一点,如果说我们把现有的Web业务服务器改为Avoton架构,比如原来需要三个机柜,现在只需要一个机柜就可以了,因为它还提供了更高的计算密度。另外一个是冷存储业务,它能够使单台服务器的功耗下降25%~35%,如果把盛大现有业务中适合Avoton平台的Web服务器、CDN服务器、冷存储服务器以及Hadoop大数据服务器全部迁移,每年可以给我们的机房租用成本节省上百万元,非常可观。

后是相对非x86架构处理器来说的,Avoton和现有的平台是完全兼容的,对于运维人员来说,这非常方便。设备的部署、系统的实现和现在是完全一样的,不用做另外的东西。对于开发者来说代码也不需要重写,这样人力成本就会得到很大的改善,对于企业来说也至关重要。

写在后

整体来说,凌动C2000产品系列的表现足以应对微型服务器、冷数据存储以及入门级网络平台的需求,而且其SoC单芯片的设计也更符合低成本、低功耗的趋势。这次发布的凌动C2000产品系列包括“Avoton”和“Rangeley”在内的13款型号,足以覆盖Xeon E3以下的x86服务器市场,而且凭借针对入门级专用托管服务、分布式内存缓存、静态网络服务与内容分发等特定的轻量型工作负载进行的特性优化,新的凌动服务器补上了x86服务器的后一块版图。相信该处理器的出现,将再度引领服务器处理器市场进入更低功耗、更高性能的竞争之中,对于更加节能环保的微服务器发展也具有重要意义。

分享到:

用户评论

用户名:

密码: