下载
加入VIP
  • 专属下载特权
  • 现金文档折扣购买
  • VIP免费专区
  • 千万文档免费下载

上传资料

关闭

关闭

关闭

封号提示

内容

首页 CPU

CPU.doc

CPU

ihopeage
2010-12-05 0人阅读 举报 0 0 暂无简介

简介:本文档为《CPUdoc》,可适用于人文社科领域

CPU在百度百科中为本词条的同义词已为您做自动跳转。中央处理器百科名片  HYPERLINK"http:baikebaiducomimagedcfdabbeabfd"t"blank"intel和AMD主流CPU和CPU插槽中央处理器(CentralProcessingUnit)的缩写即CPUCPU是电脑中的核心配件只有火柴盒那么大几十张纸那么厚但它却是一台计算机的运算核心和控制核心。电脑中所有操作都由CPU负责读取指令对指令译码并执行指令的核心部件。目录简介工作原理​ 基本原理​ 基本结构发展过程​ 诞生​ 起步的角逐​ 微机时代的来临​ 高速CPU时代的腾飞性能指标​ 主频​ 外频​ 前端总线(FSB)频率​ CPU的位和字长​ 倍频系数​ 缓存​ CPU扩展指令集​ CPU内核和IO工作电压​ 制造工艺​ 指令集​ 超流水线与超标量​ 封装形式​ 多线程​ 多核心​ SMP​ NUMA技术​ 乱序执行技术​ CPU内部的内存控制器CPU的厂商​ Intel公司​ AMD公司​ IBM和Cyrix​ IDT公司​ VIA威盛公司​ 国产龙芯​ ARMLtd​ FreescaleSemiconductor各品牌的双核处理器各种包装简介工作原理​ 基本原理​ 基本结构发展过程​ 诞生​ 起步的角逐​ 微机时代的来临​ 高速CPU时代的腾飞性能指标​ 主频​ 外频​ 前端总线(FSB)频率​ CPU的位和字长​ 倍频系数​ 缓存​ CPU扩展指令集​ CPU内核和IO工作电压​ 制造工艺​ 指令集​ 超流水线与超标量​ 封装形式​ 多线程​ 多核心​ SMP​ NUMA技术​ 乱序执行技术​ CPU内部的内存控制器CPU的厂商​ Intel公司​ AMD公司​ IBM和Cyrix​ IDT公司​ VIA威盛公司​ 国产龙芯​ ARMLtd​ FreescaleSemiconductor各品牌的双核处理器各种包装展开编辑本段简介  中央处理器(CentralProcessingUnitCPU)是电子计算机的主要设备之一。其功能主要是解释计算机指令以及处理计算机软件中的数据。所谓的计算机的可编程性主要是指对CPU的编程。    HYPERLINK"http:baikebaiducomimageaefbdfdbf"t"blank"CPUCPU是计算机中的核心配件只有火柴盒那么大几十张纸那么厚但它却是一台计算机的运算核心和控制核心。计算机中所有操作都由CPU负责读取指令对指令译码并执行指令的核心部件。  CPU、内部存储器和输入输出设备是电子计算机的三大核心部件。  同时中国药科大学的英语简称也是CPU(ChinaPharmaceuticalUniversity)编辑本段工作原理基本原理  CPU的主要运作原理不论其外观都是执行储存于被称为程式里的一系列指令。在此讨论的是遵循普遍的架构设计的装置。程式以一系列数字储存在电脑记忆体中。差不多所有的CPU的运作原理可分为四个阶段:提取(Fetch)、解码(Decode)、执行(Execute)和写回(Writeback)。    HYPERLINK"http:baikebaiducomimageddffdaf"t"blank"Intel公司生产的Core牌CPU第一阶段提取从程式记忆体中检索指令(为数值或一系列数值)。由程式计数器(ProgramCounter)指定程式记忆体的位置程式计数器保存供识别目前程式位置的数值。换言之程式计数器记录了CPU在目前程式里的踪迹。  提取指令之后程式计数器根据指令式长度增加记忆体单元。指令的提取常常必须从相对较慢的记忆体寻找导致CPU等候指令的送入。这个问题主要被论及在现代处理器的快取和管线化架构(见下)。  CPU根据从记忆体提取到的指令来决定其执行行为。在解码阶段指令被拆解为有意义的片断。根据CPU的指令集架构(ISA)定义将数值解译为指令。  一部分的指令数值为运算码(Opcode)其指示要进行哪些运算。其它的数值通常供给指令必要的资讯诸如一个加法(Addition)运算的运算目标。这样的运算目标也许提供一个常数值(即立即值)或是一个空间的定址值:暂存器或记忆体位址以定址模式决定。  在旧的设计中CPU里的指令解码部分是无法改变的硬体装置。不过在众多抽象且复杂的CPU和指令集架构中一个微程式时常用来帮助转换指令为各种形态的讯号。这些微程式在已成品的CPU中往往可以重写方便变更解码指令。  在提取和解码阶段之后接着进入执行阶段。该阶段中连接到各种能够进行所需运算的CPU部件。  例如要求一个加法运算算数逻辑单元(ALUArithmeticLogicUnit)将会连接到一组输入和一组输出。输入提供了要相加的数值而且在输出将含有总和结果。ALU内含电路系统以于输出端完成简单的普通运算和逻辑运算(比如加法和位元运算)。如果加法运算产生一个对该CPU处理而言过大的结果在标志暂存器里运算溢出(ArithmeticOverflow)标志可能会被设置(参见以下的数值精度探讨)。  最终阶段写回以一定格式将执行阶段的结果简单的写回。运算结果极常被写进CPU内部的暂存器以供随后指令快速存取。在其它案例中运算结果可能写进速度较慢但容量较大且较便宜的主记忆体。某些类型的指令会操作程式计数器而不直接产生结果资料。这些一般称作“跳转”(Jumps)并在程式中带来循环行为、条件性执行(透过条件跳转)和函式。  许多指令也会改变标志暂存器的状态位元。这些标志可用来影响程式行为缘由于它们时常显出各种运算结果。  例如以一个“比较”指令判断两个值的大小根据比较结果在标志暂存器上设置一个数值。这个标志可藉由随后的跳转指令来决定程式动向。  在执行指令并写回结果资料之后程式计数器的值会递增反覆整个过程下一个指令周期正常的提取下一个顺序指令。如果完成的是跳转指令程式计数器将会修改成跳转到的指令位址且程式继续正常执行。许多复杂的CPU可以一次提取多个指令、解码并且同时执行。这个部分一般涉及“经典RISC管线”那些实际上是在众多使用简单CPU的电子装置中快速普及(常称为微控制(Microcontrollers))。基本结构  CPU包括运算逻辑部件、寄存器部件和控制部件。CPU从存储器或高速缓冲存储器中取出指令放入指令寄存器并对指令译码。它把指令分解成一系列的微操作然后发出各种控制命令执行微操作系列从而完成一条指令的执行。  指令是计算机规定执行操作的类型和操作数的基本命令。指令是由一个字节或者多个字节组成其中包括操作码字段、一个或多个有关操作数地址的字段以及一些表征机器状态的状态字和特征码。有的指令中也直接包含操作数本身。  运算逻辑部件  运算逻辑部件可以执行定点或浮点的算术运算操作、移位操作以及逻辑操作也可执行地址的运算和转换。  寄存器部件  寄存器部件包括通用寄存器、专用寄存器和控制寄存器。    HYPERLINK"http:baikebaiducomimagedddfdfed"t"blank"位CPU的寄存器通用寄存器又可分定点数和浮点数两类它们用来保存指令中的寄存器操作数和操作结果。  通用寄存器是中央处理器的重要组成部分大多数指令都要访问到通用寄存器。通用寄存器的宽度决定计算机内部的数据通路宽度其端口数目往往可影响内部操作的并行性。  专用寄存器是为了执行一些特殊操作所需用的寄存器。  控制寄存器通常用来指示机器执行的状态或者保持某些指针有处理状态寄存器、地址转换目录的基地址寄存器、特权状态寄存器、条件码寄存器、处理异常事故寄存器以及检错寄存器等。  有的时候中央处理器中还有一些缓存用来暂时存放一些数据指令缓存越大说明CPU的运算速度越快目前市场上的中高端中央处理器都有M左右的二级缓存。  控制部件  控制部件主要负责对指令译码并且发出为完成每条指令所要执行的各个操作的控制信号。  其结构有两种:一种是以微存储为核心的微程序控制方式一种是以逻辑硬布线结构为主的控制方式。  微存储中保持微码每一个微码对应于一个最基本的微操作又称微指令各条指令是由不同序列的微码组成这种微码序列构成微程序。中央处理器在对指令译码以后即发出一定时序的控制信号按给定序列的顺序以微周期为节拍执行由这些微码确定的若干个微操作即可完成某条指令的执行。  简单指令是由(~)个微操作组成复杂指令则要由几十个微操作甚至几百个微操作组成。  逻辑硬布线控制器则完全是由随机逻辑组成。指令译码后控制器通过不同的逻辑门的组合发出不同序列的控制时序信号直接去执行一条指令中的各个操作。  其他  应用大型、小型和微型计算机的中央处理器的规模和实现方式很不相同工作速度也变化较大。中央处理器可以由几块电路块甚至由整个机架组成。如果中央处理器的电路集成在一片或少数几片大规模集成电路芯片上则称为微处理器(见微型机)。    HYPERLINK"http:baikebaiducomimageacebbabb"t"blank"中央处理器现状  中央处理器的工作速度与工作主频和体系结构都有关系。中央处理器的速度一般都在几个MIPS(每秒执行万条指令)以上。有的已经达到几百MIPS。  速度最快的中央处理器的电路已采用砷shēn化镓jiā工艺。在提高速度方面流水线结构是几乎所有现代中央处理器设计中都已采用的重要措施。未来中央处理器工作频率的提高已逐渐受到物理上的限制而内部执行性(指利用中央处理器内部的硬件资源)的进一步改进是提高中央处理器工作速度而维持软件兼容的一个重要方向。编辑本段发展过程  CPU这个名称早期是对一系列可以执行复杂的计算机程序或电脑程式的逻辑机器的描述。这个空泛的定义很容易在“CPU”这个名称被普遍使用之前将计算机本身也包括在内。诞生    HYPERLINK"http:baikebaiducomimageefccfbcb"t"blank"中央处理器但从世纪年代开始由于集成电路的大规模使用把本来需要由数个独立单元构成的CPU集成为一块微小但功能空前强大的微处理器时。这个名称及其缩写才真正在电子计算机产业中得到广泛应用。尽管与早期相比CPU在物理形态、设计制造和具体任务的执行上都有了戏剧性的发展但是其基本的操作原理一直没有改变。  年当时还处在发展阶段的Intel公司推出了世界上第一台真正的微处理器--。这不但是第一个用于计算器的位微处理器也是第一款个人有能力买得起的电脑处理器!  含有个晶体管功能相当有限而且速度还很慢被当时的蓝色巨人IBM以及大部分商业用户不屑一顾但是它毕竟是划时代的产品从此以后Intel公司便与微处理器结下了不解之缘。可以这么说CPU的历史发展历程其实也就是Intel公司X系列CPU的发展历程就通过它来展开的“CPU历史之旅”。起步的角逐    HYPERLINK"http:baikebaiducomimageadabaabc"t"blank"中央处理器年Intel公司再次领导潮流首次生产出位的微处理器并命名为i同时还生产出与之相配合的数学协处理器i这两种芯片使用相互兼容的指令集但在i指令集中增加了一些专门用于对数、指数和三角函数等数学计算的指令。由于这些指令集应用于i和i所以人们也把这些指令集中统一称之为X指令集。  虽然以后Intel公司又陆续生产出第二代、第三代等更先进和更快的新型CPU但都仍然兼容原来的X指令而且Intel公司在后续CPU的命名上沿用了原先的X序列直到后来因商标注册问题才放弃了继续用阿拉伯数字命名。至于在后来发展壮大的其他公司例如AMD和Cyrix等在以前(包括)的CPU都是按Intel的命名方式为自己的X系列CPU命名但到了时代市场竞争越来越厉害了由于商标注册问题它们已经无法继续使用与Intel的X系列相同或相似的命名只好另外为自己的、兼容CPU命名了。  年Intel公司推出了芯片它仍旧是属于位微处理器内含个晶体管时钟频率为MHz地址总线为位可使用MB内存。内部数据总线都是位外部数据总线是位而它的兄弟是位。微机时代的来临    HYPERLINK"http:baikebaiducomimagefeabfbbd"t"blank"中央处理器年芯片首次用于IBM的PC(个人电脑PersonalComputer)机中开创了全新的微机时代。也正是从开始PC的概念开始在全世界范围内发展起来。  早期的CPU通常是为大型及特定应用的计算机而订制。但是这种昂贵为特定应用定制CPU的方法很大程度上已经让位于开发便宜、标准化、适用于一个或多个目的的处理器类。  这个标准化趋势始于由单个晶体管组成的大型机和微机年代随着集成电路的出现而加速。集成电路使得更为复杂的CPU可以在很小的空间中设计和制造出来(在微米的量级)。  年许多年轻的读者尚在襁褓之中的时候Intel公司已经推出了划时代的最新产品枣芯片该芯片比和都有了飞跃的发展虽然它仍旧是位结构但是在CPU的内部含有万个晶体管时钟频率由最初的MHz逐步提高到MHz。其内部和外部数据总线皆为位地址总线位可寻址MB内存。从开始CPU的工作方式也演变出两种来:实模式和保护模式。    HYPERLINK"http:baikebaiducomimagebbdcaebe"t"blank"中央处理器年Intel公司推出了芯片它是X系列中的第一种位微处理器而且制造工艺也有了很大的进步与相比内部内含万个晶体管时钟频率为MHz后提高到MHz、MHz、MHz。的内部和外部数据总线都是位地址总线也是位可寻址高达GB内存。它除具有实模式和保护模式外还增加了一种叫虚拟的工作方式可以通过同时模拟多个处理器来提供多任务能力。  除了标准的芯片也就是经常说的DX外出于不同的市场和应用考虑Intel又陆续推出了一些其它类型的芯片:SX、SL、DL等。  年Intel推出的SX是市场定位在和DX之间的一种芯片其与DX的不同在于外部数据总线和地址总线皆与相同分别是位和位(即寻址能力为MB)。高速CPU时代的腾飞  年Intel公司推出的SL和DL都是低功耗、节能型芯片主要用于便携机和节能型台式机。SL与DL的不同在于前者是基于SX的后者是基于DX的但两者皆增加了一种新的工作方式:系统管理方式。当进入系统管理方式后CPU就自动降低运行速度、控制显示屏和硬盘等其它部件暂停工作甚至停止运行进入“休眠”状态以达到节能目的。  年大家耳熟能详的芯片由Intel公司推出这种芯片的伟大之处就在于它实破了万个晶体管的界限集成了万个晶体管。的时钟频率从MHz逐步提高到了MHz、MHz。是将和数学协处理器以及一个KB的高速缓存集成在一个芯片内并且在X系列中首次采用了RISC(精简指令集)技术可以在一个时钟周期内执行一条指令。它还采用了突发总线方式大大提高了与内存的数据交换速度。  由于这些改进的性能比带有数学协处理器的DX提高了倍。和一样也陆续出现了几种类型。上面介绍的最初类型是DX。  年Intel公司推出了SX它是类型中的一种低价格机型其与DX的区别在于它没有数学协处理器。DX由于用了时钟倍频技术也就是说芯片内部的运行速度是外部总线运行速度的两倍即芯片内部以倍于系统时钟的速度运行但仍以原有时钟速度与外界通讯。DX的内部时钟频率主要有MHz、MHz、MHz等。DX也是采用了时钟倍频技术的芯片它允许其内部单元以倍或倍于外部总线的速度运行。为了支持这种提高了的内部工作频率它的片内高速缓存扩大到KB。DX的时钟频率为MHz其运行速度比MHz的DX快。也有SL增强类型其具有系统管理方式用于便携机或节能型台式机。  CPU的标准化和小型化都使得这一类数字设备(香港译为“电子零件”)在现代生活中  HYPERLINK"http:baikebaiducomimagecdbbcfbadb"t"blank"中央处理器的出现频率远远超过有限应用专用的计算机。现代微处理器出现在包括从汽车到手机到儿童玩具在内的各种物品中。  奔腾时代  Pentium(奔腾)微处理器于年三月推出它集成了万个晶体管。它使用多项技术来提高cpu性能主要包括采用超标量结构内置应用超级流水线技术的浮点运算器增大片上的cache容量采用内部奇偶效验一边检验内部处理错误等。编辑本段性能指标主频  主频也叫时钟频率单位是兆赫(MHz)或千兆赫(GHz)用来表示CPU的运算、处理数据的速度。  CPU的主频=外频×倍频系数。很多人认为主频就决定着CPU的运行速度这不仅是片面的而且对于服务器来讲这个认识也出现了偏差。至今没有一条确定的公式能够实现主频和实际的运算速度两者之间的数值关系即使是两大处理器厂家Intel(英特尔)和AMD在这点上也存在着很大的争议从Intel的产品的发展趋势可以看出Intel很注重加强自身主频的发展。像其他的处理器厂家有人曾经拿过一块GHz的全美达处理器来做比较它的运行效率相当于GHz的Intel处理器。  HYPERLINK"http:baikebaiducomimagebbdadcaac"t"blank"中央处理器主频和实际的运算速度存在一定的关系但并不是一个简单的线性关系 所以CPU的主频与CPU实际的运算能力是没有直接关系的主频表示在CPU内数字脉冲信号震荡的速度。在Intel的处理器产品中也可以看到这样的例子:GHzItanium芯片能够表现得差不多跟GHz至强(Xeon)Opteron一样快或是GHzItanium大约跟GHzXeonOpteron一样快。CPU的运算速度还要看CPU的流水线、总线等等各方面的性能指标。  主频和实际的运算速度是有关的只能说主频仅仅是CPU性能表现的一个方面而不代表CPU的整体性能。外频  外频是CPU的基准频率单位是MHz。CPU的外频决定着整块主板的运行速度。通俗地说在台式机中所说的超频都是超CPU的外频(当然一般情况下CPU的倍频都是被锁住的)相信这点是很好理解的。但对于服务器CPU来讲超频是绝对不允许的。前面说到CPU决定着主板的运行速度两者是同步运行的如果把服务器CPU超频了改变了外频会产生异步运行(台式机很多主板都支持异步运行)这样会造成整个服务器系统的不稳定。  目前的绝大部分电脑系统中外频与主板前端总线不是同步速度的而外频与前端总线(FSB)频率又很容易被混为一谈下面的前端总线介绍谈谈两者的区别。前端总线(FSB)频率  前端总线(FSB)频率(即总线频率)是直接影响CPU与内存直接数据交换速度。有一条公式可以计算即数据带宽=(总线频率×数据位宽)数据传输最大带宽取决于所有同时传输的数据的宽度和传输频率。比方现在的支持位的至强Nocona前端总线是MHz按照公式它的数据传输最大带宽是GB秒。    HYPERLINK"http:baikebaiducomimageaffbbb"t"blank"中央处理器外频与前端总线(FSB)频率的区别:前端总线的速度指的是数据传输的速度外频是CPU与主板之间同步运行的速度。也就是说MHz外频特指数字脉冲信号在每秒钟震荡一亿次而MHz前端总线指的是每秒钟CPU可接受的数据传输量是MHz×bit÷bitByte=MBs。  其实现在“HyperTransport”构架的出现让这种实际意义上的前端总线(FSB)频率发生了变化。IA架构必须有三大重要的构件:内存控制器Hub(MCH),IO控制器Hub和PCIHub像Intel很典型的芯片组Intel、Intel芯片组为双至强处理器量身定做的它们所包含的MCH为CPU提供了频率为MHz的前端总线配合DDR内存前端总线带宽可达到GB秒。但随着处理器性能不断提高同时给系统架构带来了很多问题。而“HyperTransport”构架不但解决了问题而且更有效地提高了总线带宽比方AMDOpteron处理器灵活的HyperTransportIO总线体系结构让它整合了内存控制器使处理器不通过系统总线传给芯片组而直接和内存交换数据。这样的话前端总线(FSB)频率在AMDOpteron处理器就不知道从何谈起了。CPU的位和字长    HYPERLINK"http:baikebaiducomimagebdefeafdbdbb"t"blank"中央处理器位:在数字电路和电脑技术中采用二进制代码只有“”和“”其中无论是“”或是“”在CPU中都是一“位”。  字长:电脑技术中对CPU在单位时间内(同一时间)能一次处理的二进制数的位数叫字长。所以能处理字长为位数据的CPU通常就叫位的CPU。同理位的CPU就能在单位时间内处理字长为位的二进制数据。字节和字长的区别:由于常用的英文字符用位二进制就可以表示所以通常就将位称为一个字节。字长的长度是不固定的对于不同的CPU、字长的长度也不一样。位的CPU一次只能处理一个字节而位的CPU一次就能处理个字节同理字长为位的CPU一次可以处理个字节。倍频系数  倍频系数是指CPU主频与外频之间的相对比例关系。在相同的外频下倍频越高CPU的频率也越高。但实际上在相同外频的前提下高倍频的CPU本身意义并不大。这是因为CPU与系统之间数据传输速度是有限的一味追求高主频而得到高倍频的CPU就会出现明显的“瓶颈”效应-CPU从系统中得到数据的极限速度不能够满足CPU运算的速度。一般除了工程样版的Intel的CPU都是锁了倍频的少量的如Inter酷睿核心的奔腾双核EK和一些至尊版的CPU不锁倍频而AMD之前都没有锁现在AMD推出了黑盒版CPU(即不锁倍频版本用户可以自由调节倍频调节倍频的超频方式比调节外频稳定得多)。缓存  缓存大小也是CPU的重要指标之一而且缓存的结构和大小对CPU速度的影响非常大CPU内缓存的运行频率极高一般是和处理器同频运作工作效率远远大于系统内存和硬盘。实际工作时CPU往往需要重复读取同样的数据块而缓存容量的增大可以大幅度提升CPU内部读取数据的命中率而不用再到内存或者硬盘上寻找以此提高系统性能。但是由于CPU芯片面积和成本的因素来考虑缓存都很小。  L Cache(一级缓存)是CPU第一层高速缓存分为数据缓存和指令缓存。内置的L高速缓存的容量和结构对CPU的性能影响较大不过高速缓冲存储器均由静态RAM组成结构较复杂在CPU管芯面积不能太大的情况下L级高速缓存的容量不可能做得太大。一般服务器CPU的L缓存的容量通常在-KB。  L Cache(二级缓存)是CPU的第二层高速缓存分内部和外部两种芯片。内部的芯片二级缓存运行速度与主频相同而外部的二级缓存则只有主频的一半。L高速缓存容量也会影响CPU的性能原则是越大越好以前家庭用CPU容量最大的是KB现在笔记本电脑中也可以达到M而服务器和工作站上用CPU的L高速缓存更高可以达到M以上。  L Cache(三级缓存)分为两种早期的是外置现在的都是内置的。而它的实际作用即是L缓存的应用可以进一步降低内存延迟同时提升大数据量计算时处理器的性能。降低内存延迟和提升大数据量计算能力对游戏都很有帮助。而在服务器领域增加L缓存在性能方面仍然有显著的提升。比方具有较大L缓存的配置利用物理内存会更有效故它比较慢的磁盘IO子系统可以处理更多的数据请求。具有较大L缓存的处理器提供更有效的文件系统缓存行为及较短消息和处理器队列长度。  其实最早的L缓存被应用在AMD发布的KIII处理器上当时的L缓存受限于制造工艺并没有被集成进芯片内部而是集成在主板上。在只能够和系统总线频率同步的L缓存同主内存其实差不了多少。后来使用L缓存的是英特尔为服务器市场所推出的Itanium处理器。接着就是PEE和至强MP。Intel还打算推出一款MBL缓存的Itanium处理器和以后MBL缓存的双核心Itanium处理器。  但基本上L缓存对处理器的性能提高显得不是很重要比方配备MBL缓存的XeonMP处理器却仍然不是Opteron的对手由此可见前端总线的增加要比缓存增加带来更有效的性能提升。CPU扩展指令集  CPU依靠指令来自计算和控制系统每款CPU在设计时就规定了一系列与其硬件电路相配合的指令系统。指令的强弱也是CPU的重要指标指令集是提高微处理器效率的最有效工具之一。从现阶段的主流体系结构讲指令集可分为复杂指令集和精简指令集两部分(指令集共有四个种类)而从具体运用看如Intel的MMX(MultiMediaExtended此为AMD猜测的全称Intel并没有说明词源)、SSE、SSE(StreamingSingleinstructionmultipledataExtensions)、SSE、SSE系列和AMD的DNow!等都是CPU的扩展指令集分别增强了CPU的多媒体、图形图象和Internet等的处理能力。通常会把CPU的扩展指令集称为”CPU的指令集”。SSE指令集也是目前规模最小的指令集此前MMX包含有条命令SSE包含有条命令SSE包含有条命令SSE包含有条命令。目前SSE也是最先进的指令集英特尔酷睿系列处理器已经支持SSE指令集AMD会在未来双核心处理器当中加入对SSE指令集的支持全美达的处理器也将支持这一指令集。CPU内核和IO工作电压  从CPU开始CPU的工作电压分为内核电压和IO电压两种通常CPU的核心电压小于等于IO电压。其中内核电压的大小是根据CPU的生产工艺而定一般制作工艺越小内核工作电压越低IO电压一般都在~V。低电压能解决耗电过大和发热过高的问题。制造工艺  制造工艺的微米是指IC内电路与电路之间的距离。制造工艺的趋势是向密集度愈高的方向发展。密度愈高的IC电路设计意味着在同样大小面积的IC中可以拥有密度更高、功能更复杂的电路设计。现在主要的nm、nm、nm、nm、纳米。最近inter已经有纳米的制造工艺的酷睿ii系列了。  而AMD则表示、自己的产品将会直接跳过nm工艺(年第三季度生产少许nm产品、如Orochi、Llano)于年中期初发布nm的产品(名称未定)指令集  ()CISC指令集  CISC指令集也称为复杂指令集英文名是CISC(ComplexInstructionSetComputer的缩写)。在CISC微处理器中程序的各条指令是按顺序串行执行的每条指令中的各个操作也是按顺序串行执行的。顺序执行的优点是控制简单但计算机各部分的利用率不高执行速度慢。其实它是英特尔生产的x系列(也就是IA架构)CPU及其兼容CPU如AMD、VIA的。即使是现在新起的X(也被成AMD)都是属于CISC的范畴。  要知道什么是指令集还要从当今的X架构的CPU说起。X指令集是Intel为其第一块位CPU(i)专门开发的IBM年推出的世界第一台PC机中的CPU-i(i简化版)使用的也是X指令同时电脑中为提高浮点数据处理能力而增加了X芯片以后就将X指令集和X指令集统称为X指令集。  虽然随着CPU技术的不断发展Intel陆续研制出更新型的i、i直到过去的PII至强、PIII至强、PentiumPentium系列最后到今天的酷睿系列、至强(不包括至强Nocona)但为了保证电脑能继续运行以往开发的各类应用程序以保护和继承丰富的软件资源所以Intel公司所生产的所有CPU仍然继续使用X指令集所以它的CPU仍属于X系列。由于IntelX系列及其兼容CPU(如AMDAthlonMP、)都使用X指令集所以就形成了今天庞大的X系列及兼容CPU阵容。xCPU目前主要有intel的服务器CPU和AMD的服务器CPU两类。  ()RISC指令集  RISC是英文“ReducedInstructionSetComputing”的缩写中文意思是“精简指令集”。它是在CISC指令系统基础上发展起来的有人对CISC机进行测试表明各种指令的使用频度相当悬殊最常使用的是一些比较简单的指令它们仅占指令总数的%但在程序中出现的频度却占%。复杂的指令系统必然增加微处理器的复杂性使处理器的研制时间长成本高。并且复杂指令需要复杂的操作必然会降低计算机的速度。基于上述原因世纪年代RISC型CPU诞生了相对于CISC型CPU,RISC型CPU不仅精简了指令系统还采用了一种叫做“超标量和超流水线结构”大大增加了并行处理能力。RISC指令集是高性能CPU的发展方向。它与传统的CISC(复杂指令集)相对。相比而言RISC的指令格式统一种类比较少寻址方式也比复杂指令集少。当然处理速度就提高很多了。目前在中高档服务器中普遍采用这一指令系统的CPU特别是高档服务器全都采用RISC指令系统的CPU。RISC指令系统更加适合高档服务器的操作系统UNIX现在Linux也属于类似UNIX的操作系统。RISC型CPU与Intel和AMD的CPU在软件和硬件上都不兼容。  目前在中高档服务器中采用RISC指令的CPU主要有以下几类:PowerPC处理器、SPARC处理器、PARISC处理器、MIPS处理器、Alpha处理器。  ()IA  EPIC(ExplicitlyParallelInstructionComputers精确并行指令计算机)是否是RISC和CISC体系的继承者的争论已经有很多单以EPIC体系来说它更像Intel的处理器迈向RISC体系的重要步骤。从理论上说EPIC体系设计的CPU在相同的主机配置下处理Windows的应用软件比基于Unix下的应用软件要好得多。  Intel采用EPIC技术的服务器CPU是安腾Itanium(开发代号即Merced)。它是位处理器也是IA-系列中的第一款。微软也已开发了代号为Win的操作系统在软件上加以支持。在Intel采用了X指令集之后它又转而寻求更先进的bit微处理器Intel这样做的原因是它们想摆脱容量巨大的x架构,从而引入精力充沛而又功能强大的指令集于是采用EPIC指令集的IA架构便诞生了。IA在很多方面来说都比x有了长足的进步。突破了传统IA架构的许多限制在数据的处理能力系统的稳定性、安全性、可用性、可观理性等方面获得了突破性的提高。  IA微处理器最大的缺陷是它们缺乏与x的兼容而Intel为了IA处理器能够更好地运行两个朝代的软件它在IA处理器上(Itanium、Itanium……)引入了xtoIA的解码器这样就能够把x指令翻译为IA指令。这个解码器并不是最有效率的解码器也不是运行x代码的最好途径(最好的途径是直接在x处理器上运行x代码)因此Itanium和Itanium在运行x应用程序时候的性能非常糟糕。这也成为X产生的根本原因。  ()X(AMDEMT)  AMD公司设计可以在同一时间内处理位的整数运算并兼容于X架构。其中支持位逻辑定址同时提供转换为位定址选项但数据操作指令默认为位和位提供转换成位和位的选项支持常规用途寄存器如果是位运算操作就要将结果扩展成完整的位。这样指令中有“直接执行”和“转换执行”的区别其指令字段是位或位可以避免字段过长。  x(也叫AMD)的产生也并非空穴来风x处理器的bit寻址空间限制在GB内存而IA的处理器又不能兼容x。AMD充分考虑顾客的需求加强x指令集的功能使这套指令集可同时支持位的运算模式因此AMD把它们的结构称之为x。在技术上AMD在x架构中为了进行位运算AMD为其引入了新增了RR通用寄存器作为原有X处理器寄存器的扩充但在而在位环境下并不完全使用到这些寄存器。原来的寄存器诸如EAX、EBX也由位扩张至位。在SSE单元中新加入了个新寄存器以提供对SSE的支持。寄存器数量的增加将带来性能的提升。与此同时为了同时支持和位代码及寄存器x架构允许处理器工作在以下两种模式:LongMode(长模式)和LegacyMode(遗传模式)Long模式又分为两种子模式(bit模式和Compatibilitymode兼容模式)。该标准已经被引进在AMD服务器处理器中的Opteron处理器  而今年也推出了支持位的EMT技术再还没被正式命为EMT之前是IAE这是英特尔位扩展技术的名字,用来区别X指令集。Intel的EMT支持位submode和AMD的X技术类似采用位的线性平面寻址加入个新的通用寄存器(GPRs)还增加个寄存器支持SSE指令。与AMD相类似Intel的位技术将兼容IA和IAE只有在运行位操作系统下的时候才将会采用IAE。IAE将由个submode组成:位submode和位submode同AMD一样是向下兼容的。Intel的EMT将完全兼容AMD的X技术。现在Nocona处理器已经加入了一些位技术Intel的PentiumE处理器也支持位技术。  应该说这两者都是兼容x指令集的位微处理器架构但EMT与AMD还是有一些不一样的地方AMD处理器中的NX位在Intel的处理器中将没有提供。超流水线与超标量  在解释超流水线与超标量前先了解流水线(Pipeline)。流水线是Intel首次在芯片中开始使用的。流水线的工作方式就象工业生产上的装配流水线。在CPU中由-个不同功能的电路单元组成一条指令处理流水线然后将一条X指令分成-步后再由这些电路单元分别执行这样就能实现在一个CPU时钟周期完成一条指令因此提高CPU的运算速度。经典奔腾每条整数流水线都分为四级流水即指令预取、译码、执行、写回结果浮点流水又分为八级流水。  超标量是通过内置多条流水线来同时执行多个处理器其实质是以空间换取时间。而超流水线是通过细化流水、提高主频使得在一个机器周期内完成一个甚至多个操作其实质是以时间换取空间。例如Pentium的流水线就长达级。将流水线设计的步(级)越长其完成一条指令的速度越快因此才能适应工作主频更高的CPU。但是流水线过长也带来了一定副作用很可能会出现主频较高的CPU实际运算速度较低的现象Intel的奔腾就出现了这种情况虽然它的主频可以高达G以上但其运算性能却远远比不上AMDG的速龙甚至奔腾III。封装形式  CPU封装是采用特定的材料将CPU芯片或CPU模块固化在其中以防损坏的保护措施一般必须在封装后CPU才能交付用户使用。CPU的封装方式取决于CPU安装形式和器件集成设计从大的分类来看通常采用Socket插座进行安装的CPU使用PGA(栅格阵列)方式封装而采用Slotx槽安装的CPU则全部采用SEC(单边接插盒)的形式封装。现在还有PLGA(PlasticLandGridArray)、OLGA(OrganicLandGridArray)等封装技术。由于市场竞争日益激烈目前CPU封装技术的发展方向以节约成本为主。多线程  同时多线程SimultaneousMultithreading简称SMT。SMT可通过复制处理器上的结构状态让同一个处理器上的多个线程同步执行并共享处理器的执行资源可最大限度地实现宽发射、乱序的超标量处理提高处理器运算部件的利用率缓和由于数据相关或Cache未命中带来的访问内存延时。当没有多个线程可用时SMT处理器几乎和传统的宽发射超标量处理器一样。SMT最具吸引力的是只需小规模改变处理器核心的设计几乎不用增加额外的成本就可以显著地提升效能。多线程技术则可以为高速的运算核心准备更多的待处理数据减少运算核心的闲置时间。这对于桌面低端系统来说无疑十分具有吸引力。Intel从GHzPentium开始所有处理器都将支持SMT技术。多核心  多核心也指单芯片多处理器(ChipMultiprocessors简称CMP)。CMP是由美国斯坦福大学提出的其思想是将大规模并行处理器中的SMP(对称多处理器)集成到同一芯片内各个处理器并行执行不同的进程。与CMP比较SMT处理器结构的灵活性比较突出。但是当半导体工艺进入微米以后线延时已经超过了门延迟要求微处理器的设计通过划分许多规模更小、局部性更好的基本单元结构来进行。相比之下由于CMP结构已经被划分成多个处理器核来设计每个核都比较简单有利于优化设计因此更有发展前途。目前IBM的Power芯片和Sun的MAJC芯片都采用了CMP结构。多核处理器可以在处理器内部共享缓存提高缓存利用率同时简化多处理器系统设计的复杂度。  年下半年Intel和AMD的新型处理器也将融入CMP结构。新安腾处理器开发代码为Montecito采用双核心设计拥有最少MB片内缓存采取nm工艺制造它的设计绝对称得上是对当今芯片业的挑战。它的每个单独的核心都拥有独立的LL和Lcache包含大约亿支晶体管。SMP  SMP(SymmetricMultiProcessing)对称多处理结构的简称是指在一个计算机上汇集了一组处理器(多CPU),各CPU之间共享内存子系统以及总线结构。在这种技术的支持下一个服务器系统可以同时运行多个处理器并共享内存和其他的主机资源。像双至强也就是所说的二路这是在对称处理器系统中最常见的一种(至强MP可以支持到四路AMDOpteron可以支持路)。也有少数是路的。但是一般来讲SMP结构的机器可扩展性较差很难做到个以上多处理器常规的一般是个到个不过这对于多数的用户来说已经够用了。在高性能服务器和工作站级主板架构中最为常见像UNIX服务器可支持最多个CPU的系统。  构建一套SMP系统的必要条件是:支持SMP的硬件包括主板和CPU支持SMP的系统平台再就是支持SMP的应用软件。为了能够使得SMP系统发挥高效的性能操作系统必须支持SMP系统如WINNT、LINUX、以及UNIX等等位操作系统。即能够进行多任务和多线程处理。多任务是指操作系统能够在同一时间让不同的CPU完成不同的任务多线程是指操作系统能够使得不同的CPU并行的完成同一个任务。  要组建SMP系统对所选的CPU有很高的要求首先、CPU内部必须内置APIC(AdvancedProgrammableInterruptControllers)单元。Intel多处理规范的核心就是高级可编程中断控制器(AdvancedProgrammableInterruptControllers–APICs)的使用再次相同的产品型号同样类型的CPU核心完全相同的运行频率最后尽可能保持相同的产品序列编号因为两个生产批次的CPU作为双处理器运行的时候有可能会发生一颗CPU负担过高而另一颗负担很少的情况无法发挥最大性能更糟糕的是可能导致死机。NUMA技术  NUMA即非一致访问分布共享存储技术它是由若干通过高速专用网络连接起来的独立节点构成的系统各个节点可以是单个的CPU或是SMP系统。在NUMA中Cache的一致性有多种解决方案需要操作系统和特殊软件的支持。图中是Sequent公司NUMA系统的例子。这里有个SMP模块用高速专用网络联起来组成一个节点每个节点可以有个CPU。像Sequent的系统最多可以达到个CPU甚至个CPU。显然这是在SMP的基础上再用NUMA的技术加以扩展是这两种技术的结合。乱序执行技术  乱序执行(outoforderexecution)是指CPU允许将多条指令不按程序规定的顺序分开发送给各相应电路单元处理的技术。这样将根据个电路单元的状态和各指令能否提前执行的具体情况分析后将能提前执行的指令立即发送给相应电路单元执行在这期间不按规定顺序执行指令然后由重新排列单元将各执行单元结果按指令顺序重新排列。采用乱序执行技术的目的是为了使CPU内部电路满负荷运转并相应提高了CPU的运行程序的速度。分枝技术:(branch)指令进行运算时需要等待结果一般无条件分枝只需要按指令顺序执行而条件分枝必须根据处理后的结果再决定是否按原先顺序进行。CPU内部的内存控制器  许多应用程序拥有更为复杂的读取模式(几乎是随机地特别是当cachehit不可预测的时候)并且没有有效地利用带宽。典型的这类应用程序就是业务处理软件即使拥有如乱序执行(outoforderexecution)这样的CPU特性也会受内存延迟的限制。这样CPU必须得等到运算所需数据被除数装载完成才能执行指令(无论这些数据来自CPUcache还是主内存系统)。当前低段系统的内存延迟大约是-ns而CPU速度则达到了GHz以上一次单独的内存请求可能会浪费-次CPU循环。即使在缓存命中率(cachehitrate)达到%的情况下CPU也可能会花%的时间来等待内存请求的结束-比如因为内存延迟的缘故。  你可以看到Opteron整合的内存控制器它的延迟与芯片组支持双通道DDR内存控制器的延迟相比来说是要低很多的。英特尔也按照计划的那样在处理器内部整合内存控制器这样导致北桥芯片将变得不那么重要。但改变了处理器访问主存的方式有助于提高带宽、降低内存延时和提升处理器性  制造工艺:现在CPU的制造工艺是纳米今年月号上市最新的II可以达到纳米在将来的CPU制造工艺可以达到纳米。编辑本段CPU的厂商Intel公司  Intel是生产CPU的老大哥个人电脑市场它占有多的市场份额Intel生    HYPERLINK"http:baikebaiducomimageddafed"t"blank"intel标志产的CPU就成了事实上的xCPU技术规范和标准。个人电脑平台最新的酷睿2成为CPU的首选下一代酷睿i、酷睿i、酷睿i抢占先机在性能上大幅领先其他厂商的产品。AMD公司  目前使用的CPU有好几家公司的产品除了Intel公司外最    HYPERLINK"http:baikebaiducomimagebdccaeafafca"t"blank"AMD标志有力的挑战的就是AMD公司最新的AMD速龙IIX和羿龙II具有很好性价比尤其采用了DNOW技术并支持SSE指令集使其在D上有很好的表现。IBM和Cyrix  IBM之强在于高端的实验室工作室的非民用CPU  美国国家半导体公司NS和Cyrix公司合并后使其终于拥有了自己的芯片生产线其成品将会日益完善和完备。现在的MII性能也不错尤其是它的价格很低。  PowerPC  由AIM联盟开发,  PowerPC是一种精简指令集(RISC)架构的中央处理器(CPU)其基本的设计源自IBM(国际商用机器公司)的POWER(PerformanceOptimizedWithEnhancedRISC《IBMConnect电子报》年月号译为“增强RISC性能优化”)架构。POWER是年Apple(苹果电脑)、IBM、Motorola(摩托罗拉)组成的AIM联盟所发展出的微处

用户评价(0)

关闭

新课改视野下建构高中语文教学实验成果报告(32KB)

抱歉,积分不足下载失败,请稍后再试!

提示

试读已结束,如需要继续阅读或者下载,敬请购买!

文档小程序码

使用微信“扫一扫”扫码寻找文档

1

打开微信

2

扫描小程序码

3

发布寻找信息

4

等待寻找结果

我知道了
评分:

/23

CPU

VIP

在线
客服

免费
邮箱

爱问共享资料服务号

扫描关注领取更多福利