处理器和奔腾III处理器(242触点)。
S。E。P。封装
“S。E。P。”是“SingleEdgeProcessor”的缩写,是单边处理器的缩写。“S。E。P。”封装类似于“S。E。C。C。”或者“S。E。C。C。2”封装,也是采用单边插入到Slot插槽中,以金手指与插槽接触,但是它没有全包装外壳,底板电路从处理器底部是可见的。“S。E。P。”封装应用于早期的242根金手指的IntelCeleron处理器。
PLGA封装
PLGA是PlasticLandGridArray的缩写,即塑料焊盘栅格阵列封装。由于没有使用针脚,而是使用了细小的点式接口,所以PLGA封装明显比以前的FC…PGA2等封装具有更小的体积、更少的信号传输损失和更低的生产成本,可以有效提升处理器的信号强度、提升处理器频率,同时也可以提高处理器生产的良品率、降低生产成本。目前Intel公司Socket775接口的CPU采用了此封装。
CuPGA封装
CuPGA是LiddedCeramicPackageGridArray的缩写,即有盖陶瓷栅格阵列封装。其与普通陶瓷封装最大的区别是增加了一个顶盖,能提供更好的散热性能以及能保护CPU核心免受损坏。目前AMD64系列CPU采用了此封装。
超线程技术HT
CPU生产商为了提高CPU的性能,通常做法是提高CPU的时钟频率和增加缓存容量。不过目前CPU的频率越来越快,如果再通过提升CPU频率和增加缓存的方法来提高性能,往往会受到制造工艺上的限制以及成本过高的制约。
尽管提高CPU的时钟频率和增加缓存容量后的确可以改善性能,但这样的CPU性能提高在技术上存在较大的难度。实际上在应用中基于很多原因,CPU的执行单元都没有被充分使用。如果CPU不能正常读取数据(总线/内存的瓶颈),其执行单元利用率会明显下降。另外就是目前大多数执行线程缺乏ILP(Instruction…LevelParallelism,多种指令同时执行)支持。这些都造成了目前CPU的性能没有得到全部的发挥。因此,Intel则采用另一个思路去提高CPU的性能,让CPU可以同时执行多重线程,就能够让CPU发挥更大效率,即所谓“超线程(Hyper…Threading,简称“HT”)”技术。超线程技术就是利用特殊的硬件指令,把两个逻辑内核模拟成两个物理芯片,让单个处理器都能使用线程级并行计算,进而兼容多线程操作系统和软件,减少了CPU的闲置时间,提高的CPU的运行效率。
采用超线程及时可在同一时间里,应用程序可以使用芯片的不同部分。虽然单线程芯片每秒钟能够处理成千上万条指令,但是在任一时刻只能够对一条指令进行操作。而超线程技术可以使芯片同时进行多线程处理,使芯片性能得到提升。
超线程技术是在一颗CPU同时执行多个程序而共同分享一颗CPU内的资源,理论上要像两颗CPU一样在同一时间执行两个线程,P4处理器需要多加入一个LogicalCPUPointer(逻辑处理单元)。因此新一代的P4HT的die的面积比以往的P4增大了5%。而其余部分如ALU(整数运算单元)、FPU(浮点运算单元)、L2Cache(二级缓存)则保持不变,这些部分是被分享的。
虽然采用超线程技术能同时执行两个线程,但它并不象两个真正的CPU那样,每各CPU都具有独立的资源。当两个线程都同时需要某一个资源时,其中一个要暂时停止,并让出资源,直到这些资源闲置后才能继续。因此超线程的性能并不等于两颗CPU的性能。
英特尔P4超线程有两个运行模式,SingleTaskMode(单任务模式)及MultiTaskMode(多任务模式),当程序不支持Multi…Processing(多处理器作业)时,系统会停止其中一个逻辑CPU的运行,把资源集中于单个逻辑CPU中,让单线程程序不会因其中一个逻辑CPU闲置而减低性能,但由于被停止运行的逻辑CPU还是会等待工作,占用一定的资源,因此Hyper…ThreadingCPU运行SingleTaskMode程序模式时,有可能达不到不带超线程功能的CPU性能,但性能差距不会太大。也就是说,当运行单线程运用软件时,超线程技术甚至会降低系统性能,尤其在多线程操作系统运行单线程软件时容易出现此问题。
需要注意的是,含有超线程技术的CPU需要芯片组、软件支持,才能比较理想的发挥该项技术的优势。目前支持超线程技术的芯片组包括如:英特尔i845GE、PE及矽统iSR658RDRAM、SiS645DX、SiS651可直接支持超线程;英特尔i845E、i850E通过升级BIOS后可支持;威盛P4X400、P4X400A可支持,但未获得正式授权。操作系统如:MicrosoftWindowsXP、MicrosoftWindows2003,Linuxkernel2。4。x以后的版本也支持超线程技术。
系列型号
CPU厂商会根据CPU产品的市场定位来给属于同一系列的CPU产品确定一个系列型号以便于分类和管理,一般而言系列型号可以说是用于区分CPU性能的重要标识。
早期的CPU系列型号并没有明显的高低端之分,例如Intel的面向主流桌面市场的Pentium和PentiumMMX以及面向高端服务器生产的PentiumPro;AMD的面向主流桌面市场的K5、K6、K6…2和K6…III以及面向移动市场的K6…2+和K6…III+等等。
随着CPU技术和IT市场的发展,Intel和AMD两大CPU生产厂商出于细分市场的目的,都不约而同的将自己旗下的CPU产品细分为高低端,从而以性能高低来细分市场。而高低端CPU系列型号之间的区别无非就是二级缓存容量(一般都只具有高端产品的四分之一)、外频、前端总线频率、支持的指令集以及支持的特殊技术等几个重要方面,基本上可以认为低端CPU产品就是高端CPU产品的缩水版。例如Intel方面的Celeron系列除了最初的产品没有二级缓存之外,就始终只具有128KB的二级缓存和66MHz以及100MHz的外频,比同时代的PentiumII/III/4系列都要差得多,而AMD方面的Duron也始终只具有64KB的二级缓存,外频也始终要比同时代的Athlon和AthlonXP要低一个数量级。
CPU系列划分为高低端之后,两大CPU厂商分别都推出了自己的一系列产品。在桌面平台方面,有Intel面向主流桌面市场的PentiumII、PentiumIII和Pentium4以及面向低端桌面市场的Celeron系列(包括俗称的I/II/III/IV代);而AMD方面则有面向主流桌面市场Athlon、AthlonXP以及面向低端桌面市场的Duron和Sempron等等。在移动平台方面,Intel则有面向高端移动市场的MobilePentiumII、MobilePentiumIII、MobilePentium4…M、MobilePentium4和PentiumM以及面向低端移动市场的MobileCeleron和CeleronM;AMD方面也有面向高端移动市场的MobileAthlon4、MobileAthlonXP…M和MobileAthlon64以及面向低端移动市场的MobileDuron和MobileSempron等等。
目前,CPU的系列型号更是被进一步细分为高中低三种类型。就以台式机CPU而言,Intel方面,高端的是双核心的PentiumEE以及单核心的Pentium4EE,中端的是双核心的PentiumD和单核心的Pentium4,低端的则是CeleronD以及已经被淘汰掉的Celeron(即俗称的CeleronIV);而AMD方面,高端的是Athlon64FX(包括单核心和双核心),中端的则是双核心的Athlon64X2和单核心的Athlon64,低端就是Sempron。以笔记本CPU而言,Intel方面高端的是CoreDuo,中端的是CoreSolo和即将被淘汰的PentiumM,低端的则是CeleronM;而AMD方面,高端的则是Turion64,中端的是MobileAthlon64,低端的则是MobileSempron。
但在购买CPU产品时需要注意的是,以系列型号来区分CPU性能的高低也只对同时期的产品才有效,任何事物都是相对的,今天的高端就是明天的中端、后天的低端,例如昔日的高端产品Pentium4和PentiumM现在已经降为了中端产品,AMD的Turion64在Turion64X2发布之后也将降为中端产品。另外某些系列型号的时间跨度非常大,例如Intel的Pentium4系列从2000年11月发布至今已经过了6个年头,而当时属于高端的早期的Pentium4其性能还远远不及现在属于低端的CeleronD。而且低端CPU产品中也出现过不少以超频性能著称或者能修改的精品,例如Intel方面早期的Celeron300A,中期的图拉丁核心的CeleronIII系列,以及现在的CeleronD系列等等;AMD方面也有早期的Duron由于可以依靠连接金桥而修改为Athlon和AthlonXP而风靡一时,中期的Barton核心AthlonXP2500+和现在的64位Sempron2500+都以超频性能著称。这些低端产品其修改后和超频后的性能也并不比同时期主流的高端型号差,性价比非常高。
多媒体指令集
CPU依靠指令来计算和控制系统,每款CPU在设计时就规定了一系列与其硬件电路相配合的指令系统。指令的强弱也是CPU的重要指标,指令集是提高微处理器效率的最有效工具之一。从现阶段的主流体系结构讲,指令集可分为复杂指令集和精简指令集两部分,而从具体运用看,如Intel的MMX(MultiMediaExtended)、SSE、SSE2(Streaming…Singleinstructionmultipledata…Extensions2)和AMD的3DNow!等都是CPU的扩展指令集,分别增强了CPU的多媒体、图形图象和Internet等的处理能力。我们通常会把CPU的扩展指令集称为〃CPU的指令集〃。
1、精简指令集的运用
在最初发明计算机的数十年里,随着计算机功能日趋增大,性能日趋变强,内部元器件也越来越多,指令集日趋复杂,过于冗杂的指令严重的影响了计算机的工作效率。后来经过研究发现,在计算机中,80%程序只用到了20%的指令集,基于这一发现,RISC精简指令集被提了出来,这是计算机系统架构的一次深刻革命。RISC体系结构的基本思路是:抓住CISC指令系统指令种类太多、指令格式不规范、寻址方式太多的缺点,通过减少指令种类、规范指令格式和简化寻址方式,方便处理器内部的并行处理,提高VLSI器件的使用效率,从而大幅度地提高处理器的性能。
RISC指令集有许多特征,其中最重要的有:
指令种类少,指令格式规范:RISC指令集通常只使用一种或少数几种格式。指令长度单一(一般4个字节),并且在字边界上对齐,字段位置、特别是操作码的位置是固定的。
寻址方式简化:几乎所有指令都使用寄存器寻址方式,寻址方式总数一般不超过5个。其他更为复杂的寻址方式,如间接寻址等则由软件利用简单的寻址方式来合成。
大量利用寄存器间操作:RISC指令集中大多数操作都是寄存器到寄存器操作,只以简单的Load和Store操作访问内存。因此,每条指令中访问的内存地址不会超过1个,访问内存的操作不会与算术操作混在一起。
简化处理器结构:使用RISC指令集,可以大大简化处理器的控制器和其他功能单元的设计,不必使用大量专用寄存器,特别是允许以硬件线路来实现指令操作,而不必像CISC处理器那样使用微程序来实现指令操作。因此RISC处理器不必像CISC处理器那样设置微程序控制存储器,就能够快速地直接执行指令。
便于使用VLSI技术:随着LSI和VLSI技术的发展,整个处理器(甚至多个处理器)都可以放在一个芯片上。RISC体系结构可以给设计单芯片处理器带来很多好处,有利于提高性能,简化VLSI芯片的设计和实现。基于VLSI技术,制造RISC处理器要比CISC处理器工作量小得多,成本也低得多。
加强了处理器并行能力:RISC指令集能够非常有效地适合于采用流水线、超流水线和超标量技术,从而实现指令级并行操作,提高处理器的性能。目前常用的处理器内部并行操作技术基本上是基于RISC体系结构发展和走向成熟的。
正由于RISC体系所具有的优势,它在高端系统得到了广泛的应用,而CISC体系则在桌面系统中占据统治地位。而在如今,在桌面领域,RISC也不断渗透,预计未来,RISC将要一统江湖。
2、CPU的扩展指令集
对于CPU来说,在基本功能方面,它们的差别并不太大,基本的指令集也都差不多,但是许多厂家为了提升某一方面性能,又开发了扩展指令集,扩展指令集定义了新的数据和指令,能够大大提高某方面数据处理能力,但必需要有软件支持。
MMX指令集
MMX(MultiMediaeXtension,多媒体扩展指令集)指令集是Intel公司于1996年推出的一项多媒体指令增强技术。MMX指令集中包括有57条多媒体指令,通过这些指令可以一次处理多个数据,在处理结果超过实际处理能力的时候也能进行正常处理,这样在软件的配合下,就可以得到更高的性能。MMX的益处在于,当时存在的操作系统不必为此而做出任何修改便可以轻松地执行MMX程序。但是,问题也比较明显,那就是MMX指令集与x87浮点运算指令不能够同时执行,必须做密集式的交错切换才可以正常执行,这种情况就势必造成整个系统运行质量的下降。
SSE指令集
SSE(StreamingSIMDExtensions,单指令多数据流扩展)指令集是Intel在PentiumIII处理器中率先推出的。其实,早在PIII正式推出之前,Intel公司就曾经通过各种渠道公布过所谓的KNI(KatmaiNewInstruction)指令集,这个指令集也就是SSE指令集的前身,并一度被很多传媒称之为MMX指令集的下一个版本,即MMX2指令集。究其背景,原来〃KNI〃指令集是Intel公司最早为其下一代芯片命名的指令集名称,而所谓的〃MMX2〃则完全是硬件评论家们和媒体凭感觉和印象对〃KNI〃的评价,Intel公司从未正式发布过关于MMX2的消息。
而最终推出的SSE指令集也就是所谓胜出的〃互联网SSE〃指令集。SSE指令集包括了70条指令,其中包含提高3D图形运算效率的50条SIMD(单指令多数据技术)浮点运算指令、12条MMX整数运算增强指令、8条优化