首页 利用MIPS多线程处理器优化SoC设计

利用MIPS多线程处理器优化SoC设计

举报
开通vip

利用MIPS多线程处理器优化SoC设计 更多资料请访问与非网 MIPSMIPSMIPSMIPS技术社区 利用MIPSMIPSMIPSMIPS多线程处理器优化 SoCSoCSoCSoC设计 多线程是一种基于硬件或软件的处理技术,它的首要目标是计算型工作中利用并发来提 高性能。多线程也可以用于区别各种任务,以便可以将优先权分配给更多时间敏感的流量, 如语音、视频或关键数据。而公认的基于软件的多线程技术,如任务切换和基于软件的线程 调度已经存在了相当一段时间,很少有人知道基于硬件的多线程的历史。基于硬件的多线程 技术其实已经存在了相当长一段时间,...

利用MIPS多线程处理器优化SoC设计
更多资料请访问与非网 MIPSMIPSMIPSMIPS技术社区 利用MIPSMIPSMIPSMIPS多线程处理器优化 SoCSoCSoCSoC 设计 领导形象设计圆作业设计ao工艺污水处理厂设计附属工程施工组织设计清扫机器人结构设计 多线程是一种基于硬件或软件的处理技术,它的首要目标是计算型工作中利用并发来提 高性能。多线程也可以用于区别各种任务,以便可以将优先权分配给更多时间敏感的流量, 如语音、视频或关键数据。而公认的基于软件的多线程技术,如任务切换和基于软件的线程 调度已经存在了相当一段时间,很少有人知道基于硬件的多线程的历史。基于硬件的多线程 技术其实已经存在了相当长一段时间,其实现可以追溯到 20世纪 60年代的 CDC6600。在 CDC6600电脑中,10个硬件线程被用来保证从 I/O处理器到约 16个外围设备的响应时间。 这个例子的处理器运行速度远远超过了许多 I/O设备,是一个充分利用多线程优势的典型应 用,因为空闲处理时间可以被从线程到线程切换的有益工作所取代。在 70年代,Denelcor HEP机是在 CPU内,而不是在 I/O实际执行线程切换。类似上例,最终结果是每个周期的 指令(IPC)有了显著改善。之后 10年推出的其他几个系统和学术研究进一步展示了硬件多线 程的好处。 今天的市场上有许多多线程处理器。英特尔公司已经利用其超线程技术将该技术引入高端计 算应用领域。此外,其他许多 SoC制造商,如 Broadcom、Lantiq、Mobileye、NetLogic Microsystems、PMC-Sierra、Ralink Technology和 Sigma Designs也交付了上百万个采用多 线程处理器的产品。许多这样的SoC都采用了基于业界标准MIPS架构的多线程MIPS32 34K 系列内核或多线程、多处理 MIPS32 1004K一致处理系统(CPS)。目前硬件多线程已经成为 主流应用,并越来越被视为 SoC设计中实现最佳性能的有效方法。 用多线程提高流水线利用率 如前所述,增加一个给定单线程处理器的 IPC数量是一个主要目标。通常情况下,即使是非 常高性能的处理器也有大量时间闲置,目的是等待数据到达。常见的情况是,带有共享存储 系统先进处理器需花 50%的时间等待数据在缓存未中(cache miss)后返回。此数据检索的等 待时间可能会持续几十个周期,在极端情况下甚至是数百个周期。无论数量多少,处理器在 此期间做的都是无效工作。多线程处理器可以在多个线程之间切换以利用这些闲置的周期。 这些周期现在可以用来自其他线程的有用指令填满,从而避免未使用的周期白白浪费。这最 终将获得更好的流水线利用率并提升系统的吞吐量。 确保线程切换效率的一个关键环节是怎样进行线程相关信息或语境的管理。当映射到一个线 程时,每个任务都有相关的上下文信息,如程序计数器和寄存器信息子集,这些信息是以硬 件加载和更新的。在单线程处理器中,由于处理器在线程之间切换,这些上下文必须导入 (swapped in)或导出。当在线程之间变换时,需要有与保存和恢复操作有关的额外处理。这 种负担可能会变得非常繁重,尤其是采用高语境(high context)切换。多线程处理器支持由 每个硬件支持的线程的完整上下文存储,无需保存和恢复操作。这种机制支持切换线程或上 下文的零周期开销。 更多资料请访问与非网 MIPSMIPSMIPSMIPS技术社区 图 1显示了多线程是如何提高流水线利用率的基本机制。在这种情况下,在不同的时间点有 三个线程出现了缓存未中。在这些线程暂停(stall)期间,其他线程在同一条流水线上做着有 用的工作,从而增加了 IPC。 MIPS多线程技术 MIPS科技的多线程技术基于两个层次框架,涉及虚拟处理单元(VPE)和线程上下文(TC),支 持每个周期的线程切换。每个多线程内核多达可支持两个 VPE,它们共享其他硬件资源中的 一条流水线。不过,由于每个 VPE可以有自己针对高速缓存的转换后备缓冲器(Translation Look-aside Buffer,TLB),因此它们都可作为针对一个 SMP Linux操作系统的两个独立处理 器出现。对于更细粒度的线程处理应用,每个 VPE可以支持多个 TC。这些 TC共享一个执 行单元,但各有各的程序计数器和内核寄存器文件,以便每个 TC都可以处理来自软件的线 程。34K内核多达可以支持分配在两个 VPE上的九个 TC,在运行时进行优化和分区。利用 最小的芯片面积可执行 MIPS多线程功能。 34K内核也允许为线程分配处理器周期,并利用一个可选的服务质量(QoS)管理块设置相对 线程优先权。这有助于实现两个优先机制,确定总线上的信息流量。第一个机制允许用户让 某一个线程优先于另一个。第二个机制用来根据时间的变化为特定线程分配一个指定的周期 更多资料请访问与非网 MIPSMIPSMIPSMIPS技术社区 率。这两个机制的结合使用可以有效地给线程组分配带宽,更好地控制延迟。在实时系统中, 系统级的决定是非常关键的,而 QoS块有利于改善系统的可预测性。图 2a显示了 34K内 核中 VPE、TC和 QoS块的关系。 1004K CPS是 MIPS科技的最新一代多线程处理器。该系统支持多达四个多线程内核,每个 内核都可以配置为像 34K内核那样支持 2个 VPE。在 1004K CPS中的多个内核通过一个一 致管理单元连接在一起,以保持每个 CPU的 L1高速缓存之间的一致性。一致多内核架构的 每个内核的多线程集成允许 1004K CPS超过同类单线程多核处理器的总性能。该系统还包 括一个可选模块,为来自 I/O外围设备的数据传输提供一致性,从而通过卸载作为操作系统 一部分、通常运行于软件的 I/O一致性 方案 气瓶 现场处置方案 .pdf气瓶 现场处置方案 .doc见习基地管理方案.doc关于群访事件的化解方案建筑工地扬尘治理专项方案下载 获得额外的性能。一致处理系统还包括一个全局 中断控制器,可以接收多达 256个中断并把它们分配到内核,或每个内核内的硬件线程。 整个系统采用 MIPS L2高速缓存控制器,通过一个扩展的 256位宽接口连接到一致管理单 元,以优化一致系统和 L2高速缓存之间的吞吐量。EJTAG、“一致管控”程序和数据跟踪块 完善了系统,通过开发工具为系统中的每个 CPU内核和一致单元提供了同步的能见度。 SMP Linux被用来考察 VPE接口的效应,从而保持高级 API不变。这使得对现有传统内 核的利用在新内核出现后也不会改变。此外,一些诸如 ThreadX的 RTOS的 SMP版本包括 对细粒度、基于 TC的多线程的支持。应该指出的是,1004K的多线程和多核硬件功能利用 了一个通用的软件编程模型。也就是说,例如,有人用 SMP Linux开发的线程应用可以有效 地运行在 34K或 1004K上,而无需修改,而 SMP内核可以实现任务的亲和性以及跨线程和 内核的工作量负载均衡决策。 更多资料请访问与非网 MIPSMIPSMIPSMIPS技术社区 图 2a:34K顶层架构。 图 2b:1004K顶层架构。 多线程应用实例 当决定多线程系统是否适用于一个特定应用时,设计人员必须考虑几个因素。首先,设计人 员必须考虑软件和所需的功能集,包括不同的任务、可能分割这些任务的方式、每个任务的 性能需求、不同任务的总线互动、多媒体等任务的特殊需求,以及其他考虑因素。其他主要 考虑因素包括任务、安全性,当然还有功耗和成本的协调程度。 的确,分析起来往往不太简单,因此很好地理解重点至关重要。例如,如果目标是以最低的 成本实现最高的 IPC,设计人员就可以创建多线程系统来利用单个内核中不同的线程,并运 行在最高频率下。在另一个设计中,功率可能是一个关键问题,所以设计人员可以选择将任 务分布于多个内核的多个线程,并降低频率以减少功耗。MIPS-Based多线程系统的关键是 可扩展性,在需要时帮助设计人员达到尽可能高的性能,而当性能并不是最优先考虑时,则 更多资料请访问与非网 MIPSMIPSMIPSMIPS技术社区 可以缩减可扩展性。另一个例子是,一个系统可能需要运行 2个操作系统,同时要满足非常 严格的 QoS和成本限制。设计人员可以利用两个 VPE运行软件,其中一个运行 RTOS,另 一个运行 bare iron,同时完全隔离语音或视频等 QoS敏感的应用。这些都可以在不运行第 二个内核的情况下实现。以下例子的使用模型已经部署在用于汽车和网络的 MIPS-Based多 线程 SoC中,证明了广泛的应用都可以受益于多线程。 1.汽车驾驶辅助系统 多线程系统设计实际部署的第一个例子来自一家基于视觉的驾驶辅助系统(DAS)的SoC领先 供应商。图像和视频分析在性能和成本方面的进步使这些技术开始进入消费市场。但是,对 这类技术的不断改进是一个非常艰巨的任务。例如,该 SoC供应商使用了 34K处理器的多 线程功能,大幅提高了其视觉系统(原本基于单线程内核)的性能和效率,系统接收来自摄像 头的数据,查找图像中的元素,生成车道偏离、前向碰撞、视觉/雷达融合及行人侦测等警 告。 该 SoC系统采用一系列图像处理引擎作为外围设备到主 CPU总线的连接,以提供和接收实 时数据。在这个系统中,大量的数据和指令从 CPU传输到图像处理引擎。伴随着典型的指 令缓存未中,这导致了单线程 CPU无法解决的极具挑战性的瓶颈。事实上,供应商的原始 系统具有一个仅为 0.3的 IPC。新系统采用一个单线程架构,由于其性能要求很高,这意味 着要么放慢整个系统,要么跳过数据处理,因而有可能导致错误。增加 CPU时钟速度更加 剧了这一问题,因为这只是增加了处理器暂停的频率。此外,增加的额外内核增加了总线竞 争数量,从而影响了实时带宽。 通过仿真,设计人员的结论是,一个多线程系统将通过管理整个系统包括 8个图像处理引擎 的多个操作来性能提升。他们采用了一个 4线程 34Kf内核与 8的图像处理引擎互动。一个 QoS管理器起到了调整和优化关键线程的重要作用。实际上,这种架构有助于将 IPC从 0.3 提高到 0.9。使用 QoS管理器对 IPC从 0.6到 0.9非常关键。此外,有了如此高的 IPC,增 加的 CPU时钟实现了显著的改善。事实上,由于利用了其多线程和其他架构的改进,供应 商只需将频率从 110MHz适度地增加至 166MHz,同时维持 3W的功耗(这是前一代产品的 功耗),就能够实现其性能目标。此外,第二个 34Kf内核的实例可以支持一个用户的专有算 法。在这两个处理器线程之间的通信是通过对一个线程间通信块的修改来实现的,这实际上 有助于提高系统一致性。对于未来的系统,将要求更高的性能和更低的成本。该 SoC供应 商将会采用一个 4内核 1004Kf CPS,以确保设计能够满足这些目标。 2.宽带 CPE/住宅网关 住宅网关是另一个面临日益集成的系统。宽带客户端设备已经发展到不仅是提供 DSL、有线 或 PON等宽带服务等基本接入的调制解调器设备。它们已成为集成式住宅网关或集成式接 入设备,其中包括路由/交换、双绞线/同轴/电源线/WiFi网络功能、安全、USB和 VoIP支 更多资料请访问与非网 MIPSMIPSMIPSMIPS技术社区 持等,以及基本的调制解调器功能。某些架构还集成了存储功能,其中的网关可作为媒体服 务器使用。这种集成使网关系统的设计极具挑战性,而多线程可以提高性能和 /或改进这些 设备的整体架构。 无线家庭网络和宽带接入半导体市场的全球技术领导厂商 Ralink Technology已在网关中成 功部署了多线程 MIPS-Based SoC。ADSL IAD是 Ralink的首个基于 34K内核的芯片,目前 已批量生产,并已成功部署在欧洲电信运营商的网络中。多线程已被证明非常适合这个三网 融合系统,因为它有助于更有效地运行多个应用。此外,通过使用 VPE对时间敏感流量进 行隔离是保证确定性响应的关键。该 SoC采用一个 34K内核和在两个 VPE上的四个线程。 第一个 VPE即 VPE0执行三个线程,支持WLAN、以太网和 USB处理,而第二个 VPE即 VPE1 执行一个线程,支持 ATM和 VoIP。凭借这个架构,Ralink能够以单个器件有效地提供确定 性 VoIP响应,支持多个应用。 本文小结 硬件多线程是一种已经成为主流的技术,今天有许多芯片供应商在为各种应用提供 MIPS-Based多线程 SoC。本文讨论了网络和汽车应用,而多线程可以用于任何具有很多并 发任务,或者是 QoS非常重要的系统。其他厂商已经实现了用于机顶盒、高端存储和网络 基础设施设备的 MIPS多线程 SoC。而一些评估已开始用于移动应用中使用的多线程,如智 能手机和平板电脑。作为集成的通信、生产力和多媒体娱乐设备,这些设备的复杂性还在不 断增长。多线程将是有效处理多个移动应用(其中一些是延迟敏感的应用)的理想解决方案。 当然,可以采用使用多个内核同时处理线程的强制方法,但是采用多线程是迄今为止实现 IPC和/或 QoS性能要求的一个更完美和成本更低的方法。通过提供支持硬件多线程的单内 核和多内核产品,MIPS科技具备独特的优势,可帮助设计人员以非常具有成本效益的方式 开发高性能和低功耗的 SoC。
本文档为【利用MIPS多线程处理器优化SoC设计】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: 免费 已有0 人下载
最新资料
资料动态
专题动态
is_552792
暂无简介~
格式:pdf
大小:325KB
软件:PDF阅读器
页数:0
分类:互联网
上传时间:2012-06-21
浏览量:16