首页 硬件重点工程师培训教程七

硬件重点工程师培训教程七

举报
开通vip

硬件重点工程师培训教程七硬件工程师培训教程(七)第六节 新款CPU 简介   一、I ntel 公司新款C P U  1 .P Ⅲ C o p p e r m i n e(铜矿)解决器   年最惹人注目莫过于Intel 公司采用0.18 微米工艺生产P Ⅲ Coppermine 解决器了。尽 管Intel 公司早在1 9 99 年10 月25 日便发布了这款代号为Coppermine Pentium Ⅲ解决器,但其真 正普及是在2 0 00 年。  虽然取名为“铜矿”,C o p p e r m i ne 解决器并没有采用新铜芯片技术制造...

硬件重点工程师培训教程七
硬件工程师培训教程(七)第六节 新款CPU 简介   一、I ntel 公司新款C P U  1 .P Ⅲ C o p p e r m i n e(铜矿)解决器   年最惹人注目莫过于Intel 公司采用0.18 微米工艺生产P Ⅲ Coppermine 解决器了。尽 管Intel 公司早在1 9 99 年10 月25 日便发布了这款代号为Coppermine Pentium Ⅲ解决器,但其真 正普及是在2 0 00 年。  虽然取名为“铜矿”,C o p p e r m i ne 解决器并没有采用新铜芯片技术制造。从外形上 分析 定性数据统计分析pdf销售业绩分析模板建筑结构震害分析销售进度分析表京东商城竞争战略分析 , 采用0.18 μm 工艺制造Coppermine 芯片内核尺寸进一步缩小,虽然内部集成了256KB 全速On- D i e L 2 C a c he,内建2 8 10 万个晶体管,但其尺寸却只有1 0 6 mm 2 。从类型上分析,新一代 C o p p e r m i ne 解决器可以分为E 和EB 两个系列。E 系列C o p p e r m i ne 解决器采用了0 .18 μm 工艺制 造,同步应用了I n t el 公司新一代O n -D ie 全速2 5 6 K B L 2 C a c h e;而EB 系列C o p p e r m i ne 不但集合 了0.18 μm 制造工艺、O n -D ie 全速2 5 6 K B L 2 C a c he,同步还具备1 3 3 M Hz 外频速率。  从技术角度分析,新一代C o p p e r m i ne 解决器具备两大特点:一是封装形式变化。除了某些产品采用S E C C2 封装之外,I n t el 也推出了F C -P GA 封装及笔记本使用MicroPGA 和B GA 封装;二 是制造工艺变化。C o p p e r m i ne 解决器所有采用了0.18 μm 制造工艺,其核心工作电压降到了1. 6 5 V (S E C C 2)和1 .6 V (F C -P G A),与老式P Ⅲ相比大大减少了电能消耗和发热量。P Ⅲ C o p p e r m i ne 整体性能与老式P Ⅲ相比有了较大幅度提高。作为新一代解决器, Coppermine 强劲高速On-Die L2 Cache 值得称道,并且P Ⅲ Coppermine 可超频性也是非常出众 。  2 .P Ⅲ C o p p e r m i n e -T 和T u a l a t in   年末,P Ⅲ Coppermine 会进一步改进制造工艺采用0.13 微 米制造,新版本T u a l a t in 也即将问世。其核心技术大体如下:最 初时钟频率应当是1 .1 3 /1 .2 6 G Hz;内核集成512KB 二级缓存;采用 新总线构造;封装构造上采用F C P G A2 替代F C P GA 。     咱们注意到Tualatin 在电压和总线规格上和过去P Ⅲ解决器有 了不同,因而将来似乎应当有全新平台来支持P Ⅲ解决器 。当前 只有一款芯片组宣布支持Tualatin,它就是A l m a d or 或者被称之为 i 8 30 。  而P Ⅲ Coppermine-T 内核则也许是过渡产品,它既能运营于当前 i815 、694X 等产品,相信也能在A l m a d or 平台上使用。从时间表上看这两款解决器都在2 0 01 年三季度发布。但由于Intel Pentium 4 战略延展,也许它们会悄无 声息地来临,甚至缩减至一款。  3 .C e l e r o n Ⅱ解决器  为了进一步扩大在低端市场占领份额,2 0 00 年3 月 Intel 终于发布了其代号为“C o p p e r m i n e 1 28 ”新一代 Celeron 解决器——Celeron Ⅱ(Intel 仍称其为Celeron,但 为了和前面C e l e r on 区别,咱们暂且这样称呼)。C e l e r on Ⅱ与老Celeron 最明显区别在于采用了与P Ⅲ Coppermine 相似核心及同样FC-PGA 封装方式,同步支持S SE 多媒体 扩展指令集。     从技术角度分析,C e l e r o n Ⅱ与P Ⅲ C o p p e r m i ne 有着 诸多明显区别:一是Celeron ⅡL2 Cache 容量只是P ⅢC o p p e r m i ne 解决器一半,并且缩减P Ⅲ C o p p e r m i ne 8 路缓存通道为4 路,延迟时间也由P Ⅲ Coppermine 0 变成了2 。由此不难看出,相似主频Celeron Ⅱ在性能方面比P Ⅲ Coppermine 要 差诸多;二是功耗方面。C e l e r o n Ⅱ核心电压只有1 .5 V(最新款有1 .7 V),而P Ⅲ C o p p e r m i ne  核心电压为1.65V,功耗相对较低;三是外频方面。Celeron Ⅱ出人意料地沿用了古老66MHz 外频,面对低端市场早已使用100MHz 外频AMD K6-2,Intel 此举除了商业行为理由外恐怕无法解释。而66MHz 外 频Celeron Ⅱ与100MHz 外频P Ⅲ Coppermine 相比, 也就注定了其要在性能方面牺牲更多。C e l e r on 系列向 来有着如奔腾系列同样先进浮点运算性能,C e l e r on Ⅱ集成全速缓存使得其整数性能也得以大幅度提高。 但是,糟糕66MHz 外频也许会是Celeron Ⅱ最后不敌 A MD 同型产品致命之处,但是如果将其与老C e l e r on 放在一起,其实还是咱们规定太高了。与C o p p e r m i ne 同样FC-PGA 封装方式必然会使Celeron Ⅱ兼容性有 所提高。正是由于高性能二级缓存和低功耗, C e l e r o n Ⅱ同样也具备良好超频性能。     4 .P e n t i u m 4 解决器  美国东部时间2 0 00 年6 月28 日,I n t el 公司正式宣布将该公司开发下一代微解决器命名为Pentium4 。新一代P e n t i u m 4 解决器即原先研发代号为W i l l a m e t te W i l ly 芯片,是I n t el 公 司继C o p p e r m i ne 解决器之后推出面向普通顾客主流产品。  2 0 00 年11 月20 日,I n t el 公司正式发布P e n t i u m 4 解决器。该解决器采用了不同于P6 总线 全新N e t B u r st 架构,其管线长度是P6 架构两倍,达到了20 级。这将使P e n t i u m 4 达到更高时钟 频率。当前P e n t i u m Ⅲ解决器由于管线长度限制,最高时钟频率在1.2GHz 左右,P e n t i u m Ⅲ1 .1 3 G Hz 解决器浮现问 快递公司问题件快递公司问题件货款处理关于圆的周长面积重点题型关于解方程组的题及答案关于南海问题 就是最佳证明。但是,管 线长度加长,也意味着entium 4 每一种时钟周期执 行指令要比P e n t i u m Ⅲ少,这就是为什么在相似 速度下,P e n t i u m Ⅲ或Athlon 解决器性能看起来要 比P e n t i u m 4 解决器更强某些因素。但是,随着 P e n t i u m 4 速度提高,这一现象会逐渐消失。      Pentium 4 解决器采用新系统总线代替了原有 GTL+总线,总线速度达到400MHz 。最初版本核心频 率为1 .4 G Hz 和1.5GHz,内部集成了8 KB 一级数据缓存 和2 5 6 KB 同速二级缓存(I n t el 称之为L2 超级传播缓 存),带宽不不大于44.8GB/s,大大超过Pentium Ⅲ 1GHz 解决器1 6 G B /s 。初期P e n t i u m 4 采用0 .18 μm 工艺制造,包括4 2 00 万个晶体管,芯片面积为2 1 7 mm 2 ,核心电压为1 .7V,当前采用S o c k e t 4 23 接 口,此外I n t el 还推出了一款S o c k e t 4 78 接口P e n t i u m 4,这才是最后版本。P e n t i u m 4 算术 逻辑单元(A L U)以核心频率两倍运营。此外,P e n t i u m 4 还包括1 44 条重新 设计 领导形象设计圆作业设计ao工艺污水处理厂设计附属工程施工组织设计清扫机器人结构设计 过S S E2 指令。 Intel 预测P e n t i u m 4 将于 年下半年占其C PU总产量一半,并采用0.13 μm 铜工艺制造。 Pentium 4 架构被I n t el 称之为N e t B u r st 。其中最容易被关注到变化就是它新系统总线。   虽然真实时钟频率只有100MHz,位宽还是64 位,但由于运用了与APG 4x 相似工作原理,它速 度实际相称于4 0 0 M Hz 是老式P6 总线四倍,可传播高达3.2GB/s 。明显超过AMD Thunderbird 解决器266MHz(133MHz ×2)2.1GB/s 数据传播率。  Pentium 4 二级缓存与Pentium Ⅲ二级缓存大小相似,都是256KB 并皆为8 路联合方式运作。 但Pentium 4 二级缓存每线为128 字节,并提成2 个等量64 字节。当它从系统(无论是内存、AGP 显卡或是P CI 等)取出数据时,都是以64 字节为单位,这样一来保证批量传播最大性能。  一级缓存方面,P e n t i u m 4 仅有8 KB 一级数据缓存,没有指令缓存 ,这样便于减少一级延迟,采用4 路联合方式,并使用64 字节缓存管道。双端口构造使得能在一种时钟内,一种读取 而另一种写回方式来同步运作。过去在P e n t i u m Ⅲ或A t h l on 解决器中,均有一级指令缓存。代 码会先被放入此块缓存中,直到要真正被解决单元执行时才会取出。糟糕是某些x 86 指令非常复 杂,因而解码过程也许会阻塞整个执行管道,同步这些指令中某些重复频率很高,经常刚解码一 次后又需要再次解码。基本上讲,P e n t i u m 4 执行追踪缓存就是在解码器底下一级指令缓存, 如果缓存里存储有已经解码过复杂指令,下一次它进入流水线时就不需要再解码,而只直接提取 微指令即可。  此外Pentium 4 新加有硬件预取机制。这块新解决单元可辨认Pentium 4 核心执行软件数 据存取样本,并依此猜测下次会被解决数据,然后将这些数据预先载入缓存中。在应用大量有 规则数据状况下例如矩阵,P e n t i u m 4 硬件预取功能将大幅加速执行效能。  尚有Pentium 4 最有名特性之一就是该解决器具备非常长流水线工位。Pentium Ⅲ流水线 工位有10 个,A t h l on 为11 个,而P e n t i u m 4 不少于20 个。如此多工位数量保证了每个工位执行任务足够简朴,很显然Pentuim4 已经做好了足够准备向更高GHz 频率进军,这显然是Pentium Ⅲ和Athlon 所不具备,也是她们注定无法在更高频率上和P e n t i u m 4 抗衡致命伤。  Pentium 4 流水线能保存多达126 个将要被执行指令,其中最多可包括48 个载入及24 个存储运 算。而追踪缓存分支预测单元,就是用来保证清空整个管道内容状况不会经常发生。I n t el 声称 用了这个单元后,可减少P e n t i u m Ⅲ 3 3%预测失败。但一旦发生预测失败,所带来损失也相 当惊人。  别的新特性涉及两组双速ALU 及AGU 。由于她 们可以每半时钟内解决一种微指令,因而四个中 每一种时钟皆为解决器时钟两倍。迅速执行引擎 无法解决指令,将被送到唯一S l o w A LU 处处 理。但是好在程序指令绝大某些都是某些简朴指 令。加入流式单指令多数据扩展技术第二版棗 SSE2 。这一次新开发SIMD 指令了涉及浮点S I MD 指令、整形S I MD 指令、S I MD 浮点和整形数据之间 转换以及数据在XMM 寄存器和MMX 寄存器中转换等几 大某些。其中重要改进涉及引入新数据格式, 例如128 位SIMD 整数运算和64 位双精度浮点运算等 等。为了更好运用C a c he,P4 还此外增长了几条 操作缓存指令,容许程序员控制已经缓存过数 据。由于SSE2 更多是在架构内部加强和优化,其 最大好处是并不需要因而而开发全新操作系统, 只要稍微打个补丁之类,就能享有到SSE2 带来好 处。     Intel 公司于 年8 月底发布1.9 和2.0GHz Pentium 4 依然采用0.18 微米Willamette 内 核。咱们曾经很但愿看到本次刊登S o c k e t 4 78 接口P e n t i u m 4 采用代号为N o r t h w o od 新核心。   但是,I n t el 也许在0 .13 微米制程上遇到了某些麻烦。  5 .I t a n i um 解决器  大多数熟悉计算机兴趣者一定都听过M e r c ed 这个名字,当前I n t el 已经正式把它命名为Itanium 。这将是Intel 第一款执行IA-64 指令微解决器。它采用了EPIC(Explicitly Parallel In-s t r u c t i o n C o de,显性并行指令计算)技术,可实现每时钟周期高达20 次运算。I t a n i um 有128 个 整数和多媒体寄存器,1 28 个82 位浮点寄存器,64 个论断寄存器,8 个分支寄存器。这样多寄存器容许Intel 整合动态寄存器堆栈引擎,这将大大提高解决能力。第一代IA-64 解决器通过它们浮点单元可每秒执行60 亿次浮点操作。  (1)Itanium 重要物理参数  · 该解决器具备3 级高速缓存,涉及2 MB 或4 MB 三级高速缓存、9 6 KB 二级高速缓存和3 2 KB 一级高速缓存,缩短了内存等待时间。  · 首批产品采用733MHz 和800MHz 主频。  · 2 2 6 6 M Hz 数据总线,以2 .1 G B /s 带宽支持迅速系统总线解决。  · “机器检查体系构造”(M C A)、完善错误记录、高速缓存和系统总线纠错码(E C C)设计提供了先进错误检测、纠正和解决能力。  · 64 位数据总线(以及8 位E C C)。  · 3 英寸×5 英寸插盒,涉及安腾解决器和高达4 MB 盒上3 级高速缓存。  · 专用边沿电源接头为解决器和高速缓存设备提供单独电压,从而提高信号完整性。  · 硬件内建I A -32 指令二进制兼容性。  · C C PU 中晶体管数量为2 5 00 万个,高速缓存中有3 亿个。  (2)Itanium 重要性能指标  · 一体化2 MB 或4 MB 盒上三级高速缓存。以解决器主频全速运营,采用4 路成组相联设计和 64 字节高速缓存线。采用全面流水线和优化设计,使用1 28 位宽高速缓存总线以12.8GB/s 带宽实 现迅速数据访问。  · 一体化9 6 KB 二级高速缓存,6 路成组相联构造,采用全面流水线设计和64 位高速缓存 线。  · 一级高速缓存为3 2 KB,数据高速缓存与指令高速缓存分开(1 6 KB 数据/1 6 KB 指令)。4 路成组相联构造,采用全面流水线设计和32 字节高速缓存线。  · 高度并行流水线硬件,10 级流水线。  · 两个整数单元和两个内存单元,每时钟周期可以执行4 条A LU 指令。  · 浮点(FP)计算单元包括两个以82 位运算数运营FMAC(浮点相乘累积)单元。每个FMAC 单元每 时钟周期可以执行两次浮点运算,支持单精度、双精度和扩展双精度。  · 两个额外FP 多媒体单元,每个单元可以执行两条单精度FP 运算。与常规F M AC 相结合, 每时钟周期可以执行8 次单精度FP 运算,最高成果可达6 .4 G F L O PS 。  · 44 位物理内存寻址能力。  · 集成系统管理特性,提供温度监测和插盒辨认信息。  · 先进载入地址表(A L A T),涉及32 个条目,采用2 路成组相联高速缓存设计,支持推测执行,最小内存等待时间和更高性能。  · 两层数据转换后备缓冲器(D T L B)——在D T L B 1(所有有关联)中有32 个条目;在DTLB2 中有96个条目。此外,系统软件(O S)可以单独使用48 个转换寄存器(T R),存储核心虚拟到物理地址转换。  · 指令转换后备缓冲器(I T L B)包括64 个条目,并且互相之间完全有关。  · “显性并行指令集计算”(E P I C)技术,通过最大限度地发挥硬件和软件协同作用,提高了 指令级并行运算能力。Itanium 体系构造为编译器提供了各种机制,用于与解决器交流编译器时间信 息,如分支和高速缓存提示。此外,这种体系构造使编译代码可以通过创新指令格式来更有效地 管理解决器硬件。这些交流机制可以最大限度地减少分支损耗,减少高速缓存未命中次数,同步 实现更强并行运算能力,而这一点要比代码中固有并行运算能力明显得多。  · 推测:使编译器在进行分支和存储之前提前安排载入指令,以缩短内存等待时间,进而实现 更高性能。  · 预测:通过消除分支和分支预测错误导致有关损耗来提高性能。  · 并行运算:使编译器可觉得解决器提供更多信息,保证解决器可以持续并行执行多项运算,进 而提供更高性能和可扩展性。  · 寄存器堆栈:运用由寄存器堆栈引擎(RSE)管理灵活整数 寄存器模型来减少呼喊/返回程序开销。  · 寄存器循环:在硬件中自动为寄存器重命名,以提高软件循环性能 ,不需要满足老式方式中额外规定。  · 分支/存储提示:提高分支预测率并缩短内存等待时间。  · SIMD 指令集:通过使每条指令在各种整数运算数或浮点运算 数上执行而明显地提高了多媒体应用性能。  · 海量寄存器资源:1 28 个整数寄存器,1 28 个浮点寄存器,8个分支寄存器和64 个分支预测寄存器。  · 增强延迟事务解决能力,提高总线效率。    · 增强版低电压AGTL+(AdvancedGunningTransceiverLogic)信 号技术。     固然 ,这款全新CPU 也有缺陷,由于它对I A -64 关注,使得它在当前I A -32 架构上体现 欠佳。咱们不懂得市场对这种抛弃过去来换取性能做法究竟能承受到什么限度?但一开始,支持 它软件一定很少,并且售价昂贵,主流市场不也许有它容身之处,只有高品位工作站和服务器市 场才是它适合待地方。
本文档为【硬件重点工程师培训教程七】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: 免费 已有0 人下载
最新资料
资料动态
专题动态
is_072127
暂无简介~
格式:doc
大小:26KB
软件:Word
页数:0
分类:建筑/施工
上传时间:2018-09-18
浏览量:1