MCPLive > 杂志文章 > 见证"芯"路 30年CPU架构发展史(一)

见证"芯"路 30年CPU架构发展史(一)

2011-11-28Janlen《微型计算机》2011年11月上

P4-Netburst架构:频率至上的歧途

2000年11月,备受瞩目的Pentium 4处理器发布,也就是著名的奔腾4。Pentium 4属于英特尔生产的第七代x86处理器,并且也是继1995年出品的Pentium Pro之后的第一次微架构重新设计。

第一款Pentium 4的核心代号是Willamette,它采用0.18微米工艺生产,集成4200万个晶体管,接口方式为Socket 423。Pentium 4的起步频率就达到1.4GHz,前端总线频率也达到400MHz ,这些指标都要比Pentium Ⅲ高出许多,也优于对手Athlon的266MHz速度。但令人意外的是,Pentium 4没有在“整数处理速度”和“浮点性能”这两方面性能上表现出任何优势,原因在于Pentium 4为了追求高频率,采用多达20级的长流水线设计——流水线越长,提高工作频率就越容易,但每个时钟能处理的任务就会变少。因此尽管拥有1.4GHz的高频率,但它的性能却不如高频率的Pentium Ⅲ,基本上属于不进反退的类型。而在实际测试中,Willamet te的表现几乎让人大失所望,它几乎在所有的测试应用中都无法超过AMD Athlon和高频率的Pent ium Ⅲ,甚至对于AMD低端产品Duron处理器也没有太大的优势。而英特尔此时野心膨胀,妄图通过Pentium 4平台控制内存市场,采用了当时技术前卫,但价格奇贵无比的RDRAM作为搭配对象,导致Pentium 4平台的价格更为高昂。幸亏英特尔有众多PC厂商的死撑,Pentium 4平台在高阶PC市场还是获得不错的业绩。

但是从产品层面来看,Willamette绝对是失败之作,姑且不说与RDRAM搭配的做法,就是Willamette核心本身也不够完善。许多业界专家都认为,初1.4GHz和1.5GHz的Pentium 4只是赶工之作,而未能真正体现出它的应有能力。根据这些专家的观点,Willamette的发布是因为当时竞争对手AMD Athlon处理器的性能已经超过了Pentium Ⅲ,并且英特尔之前并没有考虑对Pentium Ⅲ进行深度改进,面对竞争对咄咄逼人的态势,及早推出Pentium 4就显得非常有必要。

英特尔将这套架构称为“Netburst”,号称“网际爆发”,宣传它是与互联网应用佳匹配的架构。事实上,Netburst的美名更多只是市场营销的需要。而在技术理念上,Netbur st的精髓就是通过高频率的法则终获得性能优势,英特尔在发表Pentium 4时向大众宣布说,NetBurst架构能够运行在10GHz。然而,NetBurst架构终在4GHz就遇到了无法解决的高功耗问题。终迫使英特尔在2005年年中放弃了这套架构,转向能效比更高的Pentium-M架构;而在之后的Core架构开发上,英特尔从过去的“频率至上”180度转变到“能效至上”,其实只是对Netburst错误开发思路的反思。

图7 Pentium 4强调“网际爆发”的概念一度深入人心,但无法掩饰其技术失败的事实。
图7 Pentium 4强调“网际爆发”的概念一度深入人心,但无法掩饰其技术失败的事实。

第一代Willamette被公认为失败之作,不过第二代Nor thwood内核则获得一致肯定。这一次,Pentium 4终于表现出性能上的优势,搭配的内存也改用平易的DDR SDRAM——当频率突破2GHz时,Pentium 4终于在性能上击败了对手。这一次,英特尔可以松了口气。Nor thwood的主要改进包括0.13微米工艺、512KB二级缓存,并改用Socket 478接口。

Nor thwood架构寿命较长,早期的400MHz FSB版本,后来的533MHz FSB,后的800MHz FSB,以及Hyper-Threading超线程技术的引入,高频率甚至到了3.4GHz。

Netburst架构的第三位成员就是“Prescott”,它发布于2004年1月,采用了先进的90纳米工艺制作,流水线长度从20级增加到31级,并且支持SSE3指令集,改用饱受争议的LGA 775接口。Prescot t的目标依然是追求更高的工作频率,但更长的流水线设计让它效率更低,加上早期90纳米工艺并不完美,导致Prescott每个时钟周期比Northwood多产生大约60%的热量;插座类型的转换(从Socket 478到LGA 775)原本希望能够将发热降低到可以接受的水平,但是实际上却是产生了相反的效果,同时功率消耗也增加大约10%—终,Prescott的整体功耗轻松超过百瓦大关,基本上属于火炉的标准,几乎所有的评论都是负面的。如果说Prescott有什么新特点,那就是它拥有很多新技术的引入,比如硬件防病毒技术Execute Disable Bit(EDB)、节能省电技术Enhanced Intel SpeedStep Technology(EIST)、虚拟化技术Intel Virtualization Technology(Intel VT),等等,另外在2005年第一季度,英特尔发布了代号为“Prescott 2M”的编号6x0的新版Prescott内核,这让Pentium 4获得了执行64位x86代码的能力。

图8 Pentium D处理器简单的将两颗芯片封装在一起,被对手讥讽为“伪双核”。
图8 Pentium D处理器简单的将两颗芯片封装在一起,被对手讥讽为“伪双核”。

Cedar Mill是Pentium 4家族中后的成员,它发布于2006年第一季度,采用65纳米工艺制作,将处理器的功耗降低到86瓦的水准,但在内部架构上,Cedar Mill没有多少建树,它只是修改了Prescott内核电路上的一些Bug,性能未有进步,Cedar Mill的高频率止于3.8GHz,这也是Netburst家族后的光荣。

在2005年第二季度,我们看到双内核Pentium D处理器的诞生——Pentium D在一颗芯片中集成了两个Prescott内核,与传统的多处理器没有什么区别,功耗超过150瓦,可想而知它是一个可怕的电老虎。到Cedar Mill时代,英特尔干脆采用更简单的做法,即将两枚Cedar Mill芯片封装在一块晶片上,达到提高良品率和降低成本的目的,当然,这一代Pentium D的功耗也是相当可怕的。

AMD在2003年9月发布了K8架构,籍由64位指令和整合内存控制器的创新设计,加之在性能、功耗方面的不凡表现,开始给英特尔造成巨大的麻烦。基本上在这个时代,双方打成了平手,AMD一直保持强势的姿态,这种局面直到后来Core微架构的出现才被重新改变。

Pentium-M架构的崛起

Pentium 4的高功耗在笔记本电脑市场就遭遇麻烦,Pentium 4-M的功耗达到35瓦,这个数字显然太高了,而架构的先天限制,让Pentium 4根本无法进一步改善节能。为此,英特尔一方面还是依赖Pentium Ⅲ-M来撑撑场面,另一方面则开发新的架构解决问题—英特尔的官方决策是让台式机、服务器选择高频率的Netburst,移动市场则采用新的低功耗架构,这便是后来的Pentium-M。

Pentium-M其实并不是英特尔的正式开发计划,而是英特尔位于以色列研发中心的一些工程师的构想。大约在90年代末,笔记本电脑市场刚刚开始喷涌,以色列研发中心的一些工程师和欧德宁就谈论专门开发笔记本电脑芯片的想法,其目的在于,在提供较长电池使用时间的条件下,也能够获得较高的性能。这个想法获得高层的支持,当Pentium 4毁誉参半的时候,该计划的结晶,也就是Pentium-M却成为新希望所在。

尽管英特尔的官员曾表示Pent ium-M是一款全新设计的芯片。但真相却是,Pentium-M其实是基于Pentium Ⅲ架构之上的重大修改版。当初第一版的Pentium 4反而不如Pentium Ⅲ,饱受外界诟病,以至于AMD的官员嘲笑说:“如何使Pentium 4表现更好?那就采用Pentium Ⅲ。”据英特尔的前首席芯片设计师鲍勃回忆说,当时他们曾经提出了改进Pentium Ⅲ的20~30项措施,使之能够实现显著的性能提升,但计划并没有真正付诸实施,后以色列的设计人员对它进行了改进。Pent ium-M就是在这样的背景下诞生,因此它确实不是一款全新的芯片。该芯片的设计师之一埃登在谈到Pentium-M时说:“它不再强调速度(频率),而是对客户需求的响应。”

Pentium-M的流水线仅有14级,比Pentium 4的20级小得多,只比Pentium Ⅲ的12级略多,这种设计保证了在频率提升空间的同时,又能做到出色的指令性能。其次,Pentium-M的分支预测和预取机制获得大量改进,简单点说它采用了Prescott核心的成果,终使得Pentium-M的分支预测效能比Pentium Ⅲ高出20%。第三,Pentium-M引入Micro Fusion(微操作融合)技术,一些相关性的微操作指令被捆绑在一起执行,此举显著提升了硬件的执行效率——根据测试,这项技术让整数数据的处理速度提升5%,浮点数据的处理速度提升9%。第四,Pentium-M拥有一个1MB的L2 Cahce,并且它被划分为4个部分,每个部分都可以单独访问,这样在运行中的某个时刻,只要有一部分L2 Cahce开启即可,此举将L2 Cahce的功耗降低1/4。而作为Cache的SRAM过去一向是耗能大户。第五,Pentium-M采用Pentium 4的QPB型前端总线,这就让内存与CPU之间拥有更大的数据吞吐量。

上述改进的效果立竿见影,Pentium-M在较低的频率下就表现出强劲的性能——比如说Pentium-M 1.6GHz的实际性能就可以同Pentium 4 2.8GHz相媲美,巨大的反差足以让Pentium 4被判了死刑。

第一代Pentium-M代号为Banias,它发布于2003年2月,采用0.13微米制造工艺,集成了7700万个晶体管,工作频率从1.3GHz~1.6GHz。英特尔标新立异地提出“Centrino(迅驰)”平台的概念:将英特尔的Pentium-M CPU、i855系列芯片组和802.11b无线网卡捆绑在一起,这种行销策略大获成功,也推动了802.11b无线网络的普及。另外,Pentium-M的TDP功耗只有24.5瓦,配合其他节能措施,将笔记本电脑的电池时间提升到3小时以上—而过去无论Pentium Ⅲ-M还是Pentium 4-M,都只有2小时左右的水平。

图9 CPU、芯片组、无线网络的捆绑式设计让迅驰平台大获成功。
图9 CPU、芯片组、无线网络的捆绑式设计让迅驰平台大获成功。

2004年10月,代号为Dothan的第二代Pentium-M发布,它采用90纳米工艺制造,二级缓存提高到2MB的规格,晶体管总数也飙升到1.4亿个。相比Banias多出来的那部分,其实基本都用于二级缓存。Dothan的工作频率在1.7GHz~2.0GHz之间,它的性能表现更令人刮目相看,同时芯片TDP功耗还降低到21瓦的水准。基于Dothan的第二代迅驰平台,拥有54Mb/s的802.11g无线网络,带动了整个无线设备市场的更新换代。

后一代Pentium-M架构代号为“Yonah”,它也是英特尔史上第一种原生双核心x86处理器。Yonah以Core品牌发行,国内称之为“酷睿”,但它在本质上只是两个Dothan的整合,主要革新点在于两个CPU可以共享2MB二级缓存,而不是独自占有,此举显著提升了双核处理器的任务配合能力。其次,Yonah加入了SSE3指令集、英特尔虚拟化技术(Intel Virtualization Technology)与英特尔病毒防护技术(Intel Execute Disable Bit),功能特性也比较丰富。

Yonah Core平台发布于2006年1月,制造工艺为65纳米,尽管整合了双核心,它依然保有24瓦的超低功耗水平。Yona h的高频率达到2.33GHz,不过此时其TDP功耗提升到31瓦。此时此刻,Pentium 4即便拥有3.8GHz的高频率,也无法同Yonah相提并论。当然,到此为止,Pentium Ⅲ时代或者说Pentium Pro架构的后荣光,也就划上了句号。

Pentium-M的成功令Pentium 4无地自容,终驱使Pentium 4开发团队引咎辞职,这些人另立门户成立了一个名为Stexar的小公司,其CEO兰迪·斯特克,是Pentium Pro、Pentium Ⅱ、Pentium Ⅲ和Pentium 4开发小组领导人;工程部副总裁Gary Brown,曾任Northwood设计和编程经理;首席架构设计师Darrell Boggs也是Netburst架构的首席设计师,并曾参与Hyperthreading的开发。Stexar公司在2006年9月份被NVIDIA收购,现在这些人估计正在为NVIDIA的Denver计划努力。

分享到:

用户评论

共有评论(4)

  • 2012.03.21 16:15
    4楼

    说的很精彩嘛

    (0) (0) 回复
  • 2011.11.28 21:58
    3楼

    好吧,说错了,还有AMD。但是IBM呢?不要讲IBM没做什么啊。

    (0) (0) 回复
  • 2011.11.28 21:57
    2楼

    只讲Intel一家太过于偏颇,不知道为什么MC近总是这样的文章,五年前可不是这样。

    (0) (0) 回复
  • 2011.11.28 12:56
    1楼

    支持NVIDIA,看来以后会用到该公司的PC了,嘿嘿

    (0) (0) 回复

用户名:

密码: