首页 1-3 计算机系统的软硬取舍、性能评测及定量设计原理

1-3 计算机系统的软硬取舍、性能评测及定量设计原理

举报
开通vip

1-3 计算机系统的软硬取舍、性能评测及定量设计原理1-3计算机系统的软硬取舍、性能评测及定量设计原理基本内容:软、硬取舍的基本原则计算机系统的性能评测计算机系统的定量设计原理计算机系统设计者的主要任务计算机系统的设计思路计算机系统的设计步骤计算机系统的软、硬件功能分配发展不可编程目前计算机最少硬件软件硬件软硬件比例控制流程的三种实现方法全硬件、软硬件结合、全软件逻辑上等价硬件实现:速度快、成本高;灵活性差、占用内存少软件实现:速度慢、复制费用低;灵活性好、占用内存多、易设计、可改性强、适应性强、设计周期短;发展趋势硬件实现的比例越来越高硬件所占的成本越来越低软硬件...

1-3 计算机系统的软硬取舍、性能评测及定量设计原理
1-3计算机系统的软硬取舍、性能评测及定量设计原理基本内容:软、硬取舍的基本原则计算机系统的性能评测计算机系统的定量设计原理计算机系统设计者的主要任务计算机系统的设计思路计算机系统的设计步骤计算机系统的软、硬件功能分配发展不可编程目前计算机最少硬件软件硬件软硬件比例控制流程的三种实现方法全硬件、软硬件结合、全软件逻辑上等价硬件实现:速度快、成本高;灵活性差、占用内存少软件实现:速度慢、复制费用低;灵活性好、占用内存多、易设计、可改性强、适应性强、设计周期短;发展趋势硬件实现的比例越来越高硬件所占的成本越来越低软硬件实现的优缺点高低成本弱强系统灵活性、适应性快慢速度硬件软件项目计算机系统的软、硬件成本变化七十年代硬件软件成本年代软硬取舍的基本原则很高的性能价格比设:D为研制设计费用,M为重复生产费用h为硬件,s为软件。则:设C为该功能在软件实现时需重新设计的次数;R:存储介质上出现的次数;V:生产的台数;则硬件的费用:软件的费用:软硬取舍的基本原则(续)则只有:用硬件实现才是适宜的。将上述带入:可见:只有在C和R的值较大时,才成立。由于:则:因为:C<100所以V值越大,上式成立。即产量大。软硬取舍的基本原则(续)考虑到准备采用和可能采用的组成技术,使它尽可能不要过多或不合理地限制各种组成、实现技术的采用;不能仅从“硬”的角度去考虑如何便于应用组成技术的成果和发挥器件技术的进展,还应从“软”的角度把为编译和操作系统的实现,以至高级语言程序的设计提供更多更好的硬件支持放在首位;软硬取舍的基本原则(续)考虑用户的应用领域:专用—硬件设计周期长的硬件不宜采用常用的功能尽量采用硬件实现实现功能的价格性能比要低尽量采用新技术实现超前设计举例1-3-1:某一计算机用于商业外贸的事务处理,有大量的字符串操作。由于这种事务处理很普遍,有较大的市场,故而设计人员决定在下一代此类计算机的CPU中加入字符串操作的功能。经测试应用软件调查发现,字符串操作的使用占整个程序运行时间的50%,而增加此功能如用软件(如微程序)实现,则快5倍,增加CPU成本1/5倍;如果用硬件实现,则快100倍,CPU成本增加到5倍。问设计人员提出增加此功能是否恰当?是否用软件还是硬件?设CPU成本占整机成本的1/3。硬件实现软件实现举例1-3-2:如果上例中,字符串操作功能的使用时间占整个程序运行时间的90%,则情况如何?硬件实现软件实现计算机系统的评测性能指标体现在时间和空间峰值性能:在理想情况下计算机系统可获得的最高理论性能值,它不能反映出系统的实际性能实际性能(持续性能):只是峰值性能的5%-30%持续性能的表示算术性能平均值:调和性能平均值:几何性能平均值:加权算术平均值:加权调和平均值:加权几何平均值:CPU性能 公式 小学单位换算公式大全免费下载公式下载行测公式大全下载excel公式下载逻辑回归公式下载 CPU的性能取决于三个要素:①时钟频率fc(或时钟周期t);②每条指令所花的时钟周期数CPI;③指令条数IC一个程序所花的CPU时间(T)可以用两种方式来表示:CPU时间(T)=CPU时钟周期数(CPI×IC)*时钟周期长(t)每条指令的平均时钟周期数:计算CPU的程序时间:IC(InstructionCounter):程序执行的总指令条数CPI(CyclesPerInstruction):平均每条指令的时钟周期fc:主时钟频率假设系统共有n种指令,第i种指令在程序中出现的次数为Ii,这样:MIPS(MillionInstructionPerSecond)MFLOPS(MillionFloatingPointPerSecond)评测方法采用实际的应用程序测试如:C语言的编译程序,CAD应用:Spice采用核心程序测试从实际程序中抽出关键部分组合而成合成测试程序人为写的核心程序,规模小,结果预知综合基准测试程序人为平衡编制基准测试程序,与实际应用差别较大,所测得的性能往往不真实计算机系统的定量设计原理哈夫曼压缩原理Amdahl定律程序访问的局部性规律哈夫曼压缩原理尽可能加速高概率事件远比加速处理概率很低的事件对性能提高要显著。Amdahl定律Makethecommoncasefast例如:CPU中的加法,溢出情况。这是计算机设计中最重要也最广泛采用的设计准则。使经常性事件的处理速度加快能明显提高整个系统的性能。Amdahl定律(续)系统对某一部件采用某种更快执行方式所能获得的系统性能改进,取决于这种执行方式被使用的频率,或所占总执行时间的比例。Amdahl定律(续)定义了加速比的大小Amdahl加速比(续)例1-3-3假设将某系统的某一部件的处理速度加快到10倍,但该部件的原处理时间仅为整个运行时间的40%,则采用加快措施后能使整个系统的性能提高多少?解:由题意可知:fe=0.4,re=10,根据Amdahl定律例1-3-4采用哪种实现技术来求浮点数平方根FPSQR的操作对系统的性能影响较大。假设FPSQR操作占整个测试程序执行时间的20%。一种实现方法是采用FPSQR硬件,使FPSQR操作的速度加快到10倍。另一种实现方法是使所有浮点数据指令的速度加快,使FP指令的速度加快到2倍,还假设FP指令占整个执行时间的50%。请比较这两种设计 方案 气瓶 现场处置方案 .pdf气瓶 现场处置方案 .doc见习基地管理方案.doc关于群访事件的化解方案建筑工地扬尘治理专项方案下载 。解:分别计算出这两种设计方案所能得到的加速比:性能递减规则如果仅仅对计算机中的一部分做性能改进,则改进越多,系统获得的效果越小。推论:如果只针对整个任务的一部分进行优化,那么所获得的加速比不大于1/(1-fe)。一个“好”的计算机系统:具有高性价比的计算机系统是一个带宽平衡的系统,而不是看它的某些部件的性能。Amdahl定律(续)CPU性能公式CPU的性能取决于三个要素:①时钟频率f(或时钟周期t);②每条指令所花的时钟周期数CPI;③指令条数IC一个程序所花的CPU时间(T)可以用两种方式来表示:CPU时间(T)=CPU时钟周期数(CPI×IC)*时钟周期长(t)每条指令的平均时钟周期数:例1-3-5如果FP操作的比例为25%,FP操作的平均CPI=4.0,其它指令的平均CPI为1.33,FPSQR操作的比例为2%,FPSQR的CPI为20。假设有两种设计方案,分别把FPSQR操作的CPI和所有FP操作的CPI减为2。试利用CPU性能公式比较这两种设计方案哪一个更好(只改变CPI而时钟频率和指令条数保持不变)。解:原系统的CPI=25%×4+75%×1.33=2方案1(使FPSQR操作的CPI为2)系统CPI=CPI原-2%×(20-2)=2-2%×18=1.64方案2(提高所有FP指令的处理速度)系统CPI=CPI原-25%×(4-2)=2-25%×2=1.5我们也可以根据以下公式计算出方案2系统的CPICPI=75%×1.33+25%×2=1.5显然,提高所有FP指令处理速度的方案要比提高FPSQR处理速度的方案要好。方案2的加速比=2/1.5=1.33假设我们考虑条件分支指令的两种不同设计方法如下:(1)CPU1:通过比较指令设置条件码,然后测试条件码进行分支。(2)CPU2:在分支指令中包括比较过程在两种CPU中,条件分支指令都占用2个时钟周期而所有其它指令占用1个时钟周期,对于CPU1,执行的指令中分支指令占20%;由于每个分支指令之前都需要有比较指令,因此比较指令也占20%。例1-3-6由于CPU1在分支时不需要比较,因此假设它的时钟周期时间比CPU2快1.25倍。哪一个CPU更快?如果CPU1的时钟周期时间仅仅比CPU2快1.1倍,哪一个CPU更快呢?解:我们不考虑所有系统问题,所以可用CPU性能公式。占用2个时钟周期的分支指令占总指令的20%,剩下的指令占用1个时钟周期。所以CPI1=0.22+0.801=1.2则CPU性能为:总CPU时间1=IC1.2时钟周期1根据假设,有:时钟周期2=1.25时钟周期1在CPU2中没有独立的比较指令,所以CPU2的程序量为CPU1的80%,分支指令的比例为:20%/80%=25%这些分支指令占用2个时钟周期,而剩下的75%的指令占用1个时钟周期,因此:CPI2=0.252+0.751=1.25因为CPU2不执行比较,故:IC2=0.8IC1因此CPU2性能为:总CPU时间2=IC2CPI2时钟周期2=0.8IC11.25(1.25时钟周期1)=1.25IC1时钟周期1在这些假设之下,尽管CPU2执行指令条数较少,CPU1因为有着更短的时钟周期,所以比CPU2快。如果CPU1的时钟周期时间仅仅比CPU2快1.1倍,则时钟周期2=1.10时钟周期1CPU2的性能为:总CPU时间2=IC2CPI2时钟周期2=0.8IC11.25(1.10时钟周期1)=1.10IC1时钟周期1因此CPU2由于执行更少指令条数,比CPU1运行更快。程序访问的局部性规律局部性分时间上的局部性和空间上的局部性时间局部性:程序中近期被访问的信息项很可能马上将被再次访问。空间局部性:指那些在访问地址上相邻近的信息项很可能会被一起访问。存储器体系的构成就是以访问的局部性原理为基础的。计算机系统设计者的主要任务满足用户对功能上的要求以及相应的价格性能要求满足功能要求的基础上,进行优化设计设计应能适应日后的发展趋势硬件与软件的发展硬件:晶体管数:增加25%/年,三年一倍DRAM的密度:增加60%/年,二年三倍访存周期:减少33%/十年硬盘密度:增加25%/年访问时间:减少33%/十年软件:程序空间:增加1.5~2位/年地址:增加0.5~1位/年计算机系统设计思路由上往下(Top-down)由下往上(Bottom-up)由中间开始(Middle-out)由上往下(Top-down)设计过程:由上向下面向应用的数学模型面向应用的高级语言面向这种应用的操作系统面向操作系统和高级语言的机器语言面向机器语言的微指令系统和硬件实现应用场合:专用计算机的设计(早期计算机的设计)特点:对于所面向的应用领域,性能和性能价格比很高,应用对象变了,难以适应。随着通用计算机价格降低,目前已经很少采用第一步:确定这一级的基本特性第二步:设计或选择面向这种应用的高级语言第三步:设计适于所用高级语言编译的中间语言第四步:设计面向这种应用的操作系统第五步:设计面向所用编译程序和操作系统的机器语言第六步:设计面向机器语言的伪指令机器硬件实现微程序机器级传统机器级操作系统虚拟机器级汇编(中间)语言虚拟机器级面向应用的高级语言虚拟机器级应用虚拟机器级由上往下设计由下往上(Bottom-up)设计过程:根据当时的器件水平,设计微程序机器级和传统机器级。根据不同的应用领域设计多种操作系统、汇编语言、高级语言编译器等。最后设计面向应用的虚拟机器级。应用场合:在计算机早期设计中(60~70年代)广为采用特点:容易使软件和硬件脱节软件被动,某些性能指标不确切整个计算机系统的效率降低。微程序机器级传统机器级操作系统虚拟机器级汇编(中间)语言虚拟机器级面向应用的高级语言虚拟机器级应用虚拟机器级由下往上设计由中间开始(Middle-out)设计过程:首先定义软硬件的分界面,包括:指令系统、存储系统、输入输出系统、中断系统、硬件对操作系统和编译系统的支持等然后各个层次分别进行设计:软件设计人员设计操作系统、高级语言、汇编语言、应用出现等;硬件设计人员设计传统机器、微程序、硬联逻辑等应用场合:用于系列机的设计特点:软硬件的分界面在上升;硬件价格下降,软件价格上升;软硬件人员结合共同设计,有利于缩短周期随着硬软件技术的发展,设计的中间点有上升的趋势。计算机系统的设计步骤设计任务:分配软、硬件的功能,确定机器级的界面,并对该界面进行具体确切的定义。设计步骤:需求 分析 定性数据统计分析pdf销售业绩分析模板建筑结构震害分析销售进度分析表京东商城竞争战略分析 主要在应用环境、所用语言的种类及特性、对OS的特殊要求所用外设特性、技术经济指标、市场分析等方面。需求说明主要包括设计准则、功能说明、器件性能说明等。概念性设计进行软、硬件功能分析,确定机器级界面具体设计机器级界面各方面的确切定义,可考虑几种方案反复进行优化设计及评价
本文档为【1-3 计算机系统的软硬取舍、性能评测及定量设计原理】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: 免费 已有0 人下载
最新资料
资料动态
专题动态
个人认证用户
中小学教育资料大全
暂无简介~
格式:ppt
大小:485KB
软件:PowerPoint
页数:51
分类:互联网
上传时间:2023-02-27
浏览量:0