关闭

关闭

关闭

封号提示

内容

首页 一种基于平台的SoPC软硬件协同设计与实现

一种基于平台的SoPC软硬件协同设计与实现.pdf

一种基于平台的SoPC软硬件协同设计与实现

xl46512 2012-05-08 评分 0 浏览量 0 0 0 0 暂无简介 简介 举报

简介:本文档为《一种基于平台的SoPC软硬件协同设计与实现pdf》,可适用于IT/计算机领域,主题内容包含中国科学院计算技术研究所博士学位论文一种基于平台的SoPC软硬件协同设计与实现姓名:简方军申请学位级别:博士专业:计算机系统结构指导教师:韩承德中文符等。

中国科学院计算技术研究所博士学位论文一种基于平台的SoPC软硬件协同设计与实现姓名:简方军申请学位级别:博士专业:计算机系统结构指导教师:韩承德中文摘要摘要合成孔径雷达(SyntheticApertureRadarSAR)实时成像是距离向与方位向二维匹配滤波过程可实现全天时、全天候、大面积对地观察和高分辨率成像在军事、经济和环境等领域有重要应用价值。SAR实时成像数据规模大、计算复杂、处理精度要求高片上可编程系统(SystemonaProgrammableChipSoPC)是基于可编程逻辑器件(ProgrammablelogicDevicePLD)的SoC是SAR实时成像系统研究的重要方向。平台是一个软硬件集成的结构基于平台的设计(Platform.BasedDesignPBD)是SoPC的重要设计方法软硬件协同设计(Hardware.SoftwareCo.design)为其核心技术之一。本文围绕基于C=hirpScaling算法的SAP,实时成像的具体应用系统地研究了基于平台的SAR实时成像SoPC的软硬件协同设计与实现对系统模型、平台设计、算法模拟与原型仿真、系统实现、性能优化以及系统评测等相关内容进行了深入的研究结合基于平台的SoPC系统的特点提出了一种多约束处理流图模型(Multi.ConstrainProcessGraphModelMCPGM)。增加了虚拟处理节点用于描述实际应用中软件和硬件实现之间切换所需的通信开销增加设计余量约束提供了面向平台应用的设计余量分析研究了MCPGM的软硬件划分问题。MCPGM具有较强的平台描述能力适合基于平台的SoPC系统建模。设计并实现了一种高性能的片内多总线结构的SoPC(MultiBusSoPCMBSoPC)应用MBSoPC实现了SAR实时成像。设计实现了高效的异步总线桥该桥采用高速异步FIFO实现了数据快速突发传输。研究了可验证设计(DFV)方法包括DFV状态机、对关联状态机之间设置状态同步点、设计影子寄存器实现不同存储空间的数据映射。DFV设计有效地验证了基于平台的系统设计显著降低了验证复杂度提高了验证效率。MBSoPC支持输入和输出并行实现了高性能的数字信号处理具有良好的扩展性。实际测试数据表明片内三PLB总线结构SoPC在相同的时钟频率条件下处理性能是单PLB总线结构SoPC的两倍。基于片内三PLB总线结构的SoPC实现了SAR实时成像Ch卸Scaling系统采用流水线和并行计算技术提高了成像性能。SAR实时成像SoPC系统采用了软硬件协同实现其中固件实现系统的控制功能软件完成因子预处理计算硬件完成实时处理。研究了基于MPI的机群并行算法和性能优化为SAR实时成像SoPC系统建立了算法设计、系统仿真和成像质量评测体系.详细讨论了SAR实时成像SoPC系统的主要功能单元设计、控$JJN试子系统以及片上计算流程等.中国科学院博七学位论文一种摹于平台的SoPC软硬件协同设计与实现因子计算子系统是SAR实时成像SoPC系统的主要运算单元之一在因子数值分析基础上提出了一种适合采用软硬件协同实现的因子改进算法降低了因子计算的复杂度设计并实现了高性能的实时计算因子单元。实际运行结果表明本文所提出的因子计算方法在计算精度保持不变的前提下统一了三个不同因子计算流程显著提高了因子的计算效率。最后对基于平台的SAP,实时成像SoPC系统进行了成像质量和成像速度的系统评测。测试结果表明。SoPC系统成像质量满足应用需求工作在MHz时能在秒内同时完成两帧X短整型定点复数数据的SAR成像计算。关键词:片上可编程系统多约束处理流图模型片内多总线结构SoPC合成孔径雷达C址pScaling因子英文摘要DesignandImplementationofHardwareSoftwareCodesignofJianFangjun(ComputerArchitecture)DirectedbyHanChengdeAbstractSAP,,SyntheticApertureRadar,realtimeimagingisamatchingfilteringprocessofbothrangeandazimuthdirections.ItisallimportanttoolforthecoUcctionofhighresolution,allweather,alltime.hugeareaimagedata.Itiswidelyusedinthe丘eldsofmilitary,economyandenvkonmenLRealtimeSARimagingistypicallyverycomplexwhichrequireshighcapacitydatastorageandprocessingability.SoPC,SystemOilaProgrammableChipisakindofSoCOilthebasisofPLDProgrammableLogicDevice。SoPCisafeasibleplatformforrealtimeSARimaging.Platformisallintegratedsoftwarehardwarestructure.PBDPlatformBasedDesign,becomesalluprisingimportantmethodofSoPCdesign.HardwaresoftwarecodesignisakeytechnologyofPBDSoPC.CombiningtheappficafionofRealtimeSARimagingChirpScalingsystemhardwaresoftwarecodesignisresearcheddeeplyonthebasisofPBDSoPCoincludingsystemdesignmodel,platformdevelopalgorithmdesign,prototypesimulation,systemimplementation,performanceoptimizationandsystemevaluationetc.Theresearchcontentsofthisdissertationareasfollowing:MCPGMMultiConstrainProcessGraphModel,isproposedasasystemdesignmodelcombininghardwaresoftwarecodesignOilPBDSoPC.ComparedwithPGM.M凹GMaddsvirtualprocessandsurplusconstrains.TheformerisusedtdescribecommunicationbetweenhardwareandsoftwareandthelaterisdesignedfbrSoPCrealizationandexpandablity.MoreoversoftwarehardwarepartitioningofMCPGMisdiscussed.MCPGMhasfavorableplatformdescriptioncapabilitiesandissuittodescribeapplicationrequirementofhighperformanceSoPCsystem.MBSoPC,MultibusSystemonaProgrammableChipisdesignedandimplemented.Itimprovesvalidbandwidthofbothinputandoutput.Itissuitforhighperformancedi#tMsignalprocessing.SomekeytechnologiesofMBSoPCaredeeplyresearched,includinghighperformanceasynchronousbusbusbridge,designforverificationFSM.anddynamicbalance.III.中国科学院博七学位论文一种革于平弁的SoPC软硬件协同设计与实现ofbusesloadamongmultiplebuses.ExperimentalresultsshowprocessingperformaeeofPLBMBSoPCisdoubleaSofsinglePLBSoPCatthesamefrequency.MBSoPCisappliedtorealizerealtimeSARimagingQ【irpScalingalgorithm,withhardwaresoftwarecodesign.ControllerisimplementedbyFirmwarecomplementfactorprecomputingisprocessedbysoftwareandrealtimeprocessisexecutedbyhardware.MPIparaUdalogrithmofSARimaginganditsperformanceoptimizationisrearchcdonSUMAandSUMA.ItiscreatedaStheprototypesimulation,andtestbenchofSARSoPCsystem.DesignandimplementmentofSoPCforrealtimeSARimagingisdiscussedindetailsuchasmainfunctionmodualsverificationtestsubsystemanddataflowonSoPC.ComplememFactorscomputingisoneofthekeyprocessesofrealtimeSAP,imagingchirpscalingalgorithm.Throughnumericalcomputingandprecisionanalysis,allimprovedalgorithmadoptedashardware.soflwareCOdesignisporward.Experimentalresultsshowthatitredusfactorcomputingcomplexanduniformsthreefactorsprocesswhileitkeepsthesameprecisionastheidealsm百cprecisionfloatchirpscalingalgorithm.Finally,theSoPCforrealtimeSARimagingisevaluatedbytwokindsofevaluatingways.Oneisima西ngqualityandtheotherisprocessingspeed.Experimentalresultsshowitsimagingqualitysatisfiestheapplicationrequirement.SystemCallsimultaneouslyfinishwholeprocessingoftwoframesofxSAP.awdatainsecondsatthespeedofM.Keywords:SystemO/aPmgammableChipMCPGM,MBSoPC,SAP,,ChirpScalingFactor.Ⅳ.中国科学院博士学位论文一种幕于平台的Sol'C软硬件协同设计与实现图论文组织结构图目录图RangeDoppler算法流程.图ChirpScaling算法流程..图集成电路芯片分类。图.Xilinx集成PowerPC结构图AlteraStratixll的ALM结构和配置性.图CoreConnect总线的体系结构图AMBA总线的体系结构图传统的SoC设计流程图基于平台的SoPC设计流程图基于SoPC的处理流图。。。。。。图MCPGM中处理流扩展和聚集.图基于DCPCM的MCI'GM图基于MCPGM系统级设计图基蝶形运算单元结构图图SAR.SoPC实时成像系统流水设计。图.SoPC处理板功能单元示意图图异步握手NRZliz方式图异步PP总线桥设计框图。图异步PP总线桥的验证平台图DFV状态机图PLB总线负载动态迁移.图海量数据实时压缩MBSoPC设计.图.曙光刀片服务器并行环境图Cache工作原理图二路组相联Cache组织方式.弱药勰乱筋惦舶诣镐舛巧钙目录图大矩阵转置在二路组相联Cache中的颠簸图增加冗余避免大矩阵转置运算Cache颠簸图.矩阵x转置时间随分块变化图矩阵x按x分块转置时间随冗余变化。图SAR成像西iIpScaling并行算法设计图四进程并行角度转置流程.图.计算密集型应用并行效率.图数据角度转置并行效率..........图.进程问数据交互占角度转置百分比.图ChirpScal/ng并行算法分步处理效率图ChirpScaling并行算法处理时间和加速比图Envisat三峡地区并行ChirpScaling成像。图采用双FPGA的SoPC平台设计框图图采用三FPGA的SoPC平台设计框图图SAR成像ChiIpScaling算法MBSoPC设计图SARSoPC时钟设计图地址重映射支持行列存储模式.图FFr阵yr作方式图.输入接口数据分发通道时序图数据分发通道命令字格式图关键寄存器DCR总线存取架构。图.MBSoPC系统CS算法实现流程图x图像在SAR.soPC存储器中放置图SAR成像SOPC处理板。图曙光上不同进程并行因子计算时问图.CSAR多项式逼近岱曲线图GSAR多项式逼近Q误差分布图LSAR多项式逼近.)Ⅱ加以佗乃"祁%侣缸卯粥虬中国科学院博士学位论文一种纂于平台的SoPc软硬件协同设计与实现图bSAR多项式逼近Cs误差分布图ChirpScafing算法因子单元计算模型图odrpScaliIIg算法因子单元软硬件协同计算流程.。图五alirpscaling算法因子单元软硬件协同实现。图浮点累加器计算模块设计图RadarSAT理想点目标回波仿真数据实部图ChirpScaling算法C模拟流程图Chirpscalmg算法质量评价C模拟流程图qRadarSAT点目标双精度理想成像方位向和距离向幅度变化....图RadarSAT点目标Faoor成像方位向和距离向幅度变化...图RadarSAT点目标.Factor成像方位向和距离向幅度变化图.RadarSAT北京地区SARSoPC成像图RadarSAT故宫.北海SARSoPC成像图RadatSAT颐和园.昆明湖SAR.SoPC成像...图RadarSAT点目标SAR.SoPC成像和理想成像图.soPC验证和测试系统框架图.XⅡ..目录表XilinxCLB组成表目录表不同的验证层次和解决方案..表定点位复数FFT程序软件大小表基于V'mex平台的FFT硬件实现资源消耗。表基于VirtexPro平台的nT硬件实现资源消耗。加表.不同图像大小SAR成像进程并行处理时间表输入寄存器各位的含义表DCR总线信号定义表PCI接口信号列表表不同项次多项式CSAR中C扭。数值逼近误差表不同项次多项式LSAR中C,/B。数值逼近误差表RadarSAT北京地区数据v和f数值范围表基于改进算法点目标成像质量评估表ChirpScaling算法点目标SoPC成像与PC模拟成像质量对比表.RADARSAT北京地区图像参数表.SAR实时成像SoPC系统性能评测刀为鼹粥粥吣mB.....ll声明我声明本论文是我本人在导师指导下进行的研究工作及取得的研究成果。尽我所知除了文中特别加以标注和致谢的地方外本论文中不包含其他人已经发表或撰写过的研究成果。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。懒钰偏冀隰脚论文版权使用授权书务’本人授权中国科学院计算技术研究所可以保留并向国家有关部门或机构送交本论文的复印件和电子文档允许本论文被查阅和借阅可以将本论文的全部或部分内容编入有关数据库进行检索可以采用影印、缩印或扫描等复制手段保存、汇编本论文。(保密论文在解密后适用本授权书。)名:锄P蜘一乡夕第一章引占第一章引言合成孔径雷达(SyntheticApertureRadarSAg)是一个距离与方位二维祸合的雷达系统可实现全天时、全天候、大面积对地观察和高分辨率成像在军事、经济和环境等领域有重要应用价值。SAg成像处理是距离与方位二维匹配滤波压缩过程其实时成像技术的研究受到了世界各国高度重视【徐】【韩】【姚。SAg实时成像过程需要处理的数据规模庞大、计算十分复杂、成像精度需求很高对系统的运算性能、存储速度和容量、数据传输性能等有较高的要求特定的应用环境还对系统重量、体积、功耗、稳定性和可靠性等有着严格的要求基于通用计算机的成像系统很难满足其实时性和特定应用环境的需求研究SAg实时成像专用系统是目前国内外SAg实时成像研究的热点其中基于片上可编程系统(SystemonaProgrammableChipSoPC)的解决方案兼有片上系统(systemonaChips和可编程逻辑器件(ProgrammablelogicDevicePLD)的长处Xilhlt既具有SoC的高集成度和高性能又具有PLD的低成本和灵活性成为SAg实时成像系统研究的重要方向。.研究意义本文系统地研究了基于平台的SAR实时成像SoPC系统的软硬件协同设计与实现具有以下几方面的研究意义:..合成孔径雷达实时成像系统需求迫切SAg是一种高性能的雷达成像系统它是一种有源主动式微波成像系统能够获得大面积的高分辨率遥感图像【张】【徐mN。SAg以脉冲重复频率(PulseRepetitionFrequencyPRF)对地面目标发射线性调频信号(LinearFrequencyModulatedLFM)对接收到的回波信号在距离向上采用脉冲压缩技术对回波LFM信号用匹配滤波器实现距离压缩在方位向上利用合成孔径原理对回波中的多普勒信息进行压缩。同光学雷达相比成像不受雨雾、光照等干扰具有可实现全天时、全天候对地观察能力同时SAg具有优越的二维高分辨率成像能力通过干涉成像还可以获取地面目标的三维立体信息此外某些波段的SAg具有一定的穿透能力可实现对地下目标的观测等。因此SAR在军事侦查、地形测绘、资源考察、自然灾害预测和分析等领域有重要应用价值。SAg实时成像处理可以获得比原始雷达数据具有更大的数据相关性的图像信息降低了系统对数据存储容量和传输带宽的需求经过实时成像后能够对图像进行实时中国科学院博士学位论文一种摹于平台的S甙软硬件协同设计与实现的高阶处理如模式识别等可以实现实时的军事预警、自然灾害预测和分析等终端用户无需进行复杂的成像处理直接获取图像数据。SAR实时成像处理是对雷达的海量回波数据进行高速处理的过程以脉冲采样频率、方位样本点数、距离样本点数的SAR为例每帧图像样本点M个如每样本点采用位单精度浮点复数仅仅存储一帧图像数据就需要GB空间算法中需要进行大量的浮点运算包括快速傅立叶变换(FastFourierTransformFFr)、乘除法、乘方开方、三角函数等复杂的运算每个样本点大约需要进行次浮点运算【徐】实时成像要求在.秒内完成一帧数掘的成像处理。这对处理系统的计算、网络通信及存储性能要求均非常高特定的应用环境还对系统重量、体积、功耗、稳定性和可靠性等有着严格的要求基于通用计算机的成像系统很难满足其实时性和特定应用环境的需求。采用基于SoPC的SAR实时成像专用系统利用SoPC的高集成度和高性能特点通过硬件流水线技术和多个计算单元并行设计技术构建高性能的数字信号处理系统同时能够满足特定应用环境对成像系统重量、体积、功耗、可靠性等特殊要求成为SAP,实时成像系统研究的重要趋势。同时这些研究工作对其它高性能的图像处理应用也具备一定的参考价值。..SoPC与PBD方兴未艾随着微电子技术的发展尤其是超大规模集成电路(VeryLargeScaleIntegrationCircuitVISI)的迅速发展芯片内部晶体管的规模快速增长片内集成越来越多的功能单元单芯片能完成全系统任务系统级芯片SoC就应运而生了障】【陈】。SoPC是基于可编程逻辑器件的SoC设计方案是soC和PLD技术结合的产物最早由可编程逻辑器件供应商Altera公司提出AltXill。SoPC作为一种特殊的嵌入式系统兼有SoC系统和PLD器件的特点一方面作为SoC在单个芯片上实现一个完整的系统完成包括信号采集、转换、存储、处理和输入输出等功能把过去需要系统设计解决的问题包括可靠性、低功耗等集中在IC设计中解决具有速度快、集成度高、功耗低等优点另一方面作为可编程系统没有ASIC(专用集成电路)设计中昂贵的非经常性工程费用(NonRecurringEngineeringNRE)具有灵活的设计方式容易裁减、扩充、升级具备一定的系统可编程功能。SoPC将微处理器、DSP、可编程逻辑等组合形成为平台系统从而消除设计中的差异硬件可编程性好容易升级和扩展受到越来越多的关注。虚拟套接接口联盟rtsualSocketInterfaceAllianceVSIA)将平台定义如下:平台是关于虚拟组件与体系结构的集合在平台中包含一些可集成的并且预先验证的软件口与硬件P、设计模型、电子设计自动化工具(ElectronicDesignAutomation。EDA)与软件工具、设计库以及通过体系结构探索、集成、验证来支持快速产品开发的方法学VsiHLKNCH..第一章弓l占【US。简单的说平台是软、硬口模块及片上通信结构的结合体一般还包括嵌入式CPU、实时操作系统(RealTuneOperatingSystemRTOS)、外围接口模块、中间件等。平台建立在集成和口的基础上通常是针对某一特定应用领域而设计的一个结构良好的SoPC平台系统可以有效实现P复用。缩短SoC开发周期同时降低研发风险。基于平台的设计(Platform.BasedDesignPBD)方法是近几年提出的SoC软硬件协同设计新方法是基于块的设计(BlockBasedDesignBBD)方法的延伸它扩展了设计重用的理念强调系统级复用包含了时序驱动的设计(Time.drivendesignTDD)和BBD的各种技术支持软硬件协同设计提供系统级的算法和结构分析。PBD方法是一种面对集成、强调系统级重用的设计方法此方法在平台的基础上开发复杂的产品目标是降低开发风险和代价缩短产品上市时间。PBD方法具有开发周期短重用效率高以及设计质量好等优点不仅能实现最大化的设计复用而且为软硬件协同设计提供了极大的便利。基于平台的SoPC设计方法扩展了芯核设计方法简化了SoC设计过程无需实现新的芯片即可快速获得片上系统。基于平台的SoPC设计本质上是在受限约束条件下的设计空间探索的过程典型约束条件包括面积、功耗、延迟等。目前在新增加的设计方案中选择基于PLD的解决方案已经超过了ASIC。市场调研机构GartnerDataquest公布的分析报告显示:年ASIC和FPGA/PLD的增长率分别为.%和.%:预计年两者的增长率将分别达到.%和.%FPGA的发展速度明显高于ASICtGAR。随着芯片密度及效率的不断提升以及市场对于设计灵活性和降低成本的迫切需求基于平台的SoPC将得到更多的青睐。..软硬件协同设计技术亟待发展目前芯片集成度日益提高设计复杂度越来越大设计和验证技术的发展明显落后于集成电路制造技术已经成为SoC设计面临的一个重大问题。传统的SoC设计方法采用软硬件分立设计方法首先构造硬件子系统部分然后在已有硬件上进行软件的设计和调试开发。在深亚微米设计中硬件开发费用急速增加而当硬件设计完成后再进行软件调试时如果发现了硬件系统设计的错误纠正错误则要付出人力、物力、财力等方面高昂的代价系统研发周期变长成本增加市场风险增大。软硬件协同设计成为解决这一问题的关键技术之一。SoPC设计建立在平台设计的基础之上充分利用已有的P进行设计重用软硬件协同设计技术通过在系统级上比较不同实现结构的选择对产品性能的影响从而进行设计的权衡使得在物理实现之前就可以进行有效的分析和结构的优化大大提高系统的可预测性加速系统的研发速度提高系统的设计效率减少设计迭代的次数降低设计风险增强系统的竞争力。SoPC软硬件协同技术包括基于平台的SoPC的系统建模、软件与硬件的划分、由建模系统到软硬件的映射即软硬件协同综合技术(Cosynthesis)、软硬件协同调度.中国科学院博}学位论文一种基于甲台的SoPc软硬件协同设计与实现(Coschedule)、可验证设计(DesignforVerification。DFV)、并行计算技术以及协同仿真(Co.simulation)和集成tcgmtion)这些技术不仅推进了SoPC的应用而且促进了SoPC平台的发展AltrlxoSalrIRosb。.本文的主要研究内容本文结合了合成孔径雷达alirpScaling算法实时成像系统的具体应用系统地研究了基于平台的SAR实时成像SoPC系统的软硬件协同设计与实现包括算法设计、平台设计、原型仿真、系统实现、性能优化以及成像质量评测等相关内容...SoPC的软硬件协同设计技术SoPC作为一种特殊的SoC采用层次化设计方法需要从系统出发进行统一的系统功能定义与描述采用系统级软硬件协同设计方法在系统级上进行设计空间探索分析不同的设计实现方案如软硬件划分、总线和处理器负载平衡、可编程资源分配等提高了系统设计效率。本文从SAR实时成像SoPC系统的应用需求出发研究了SoPC中的软硬件协同设计主要包括适合基于平台的SoPC系统建模方法围绕系统模型研究了软硬件划分和协同调度问题。此外还研究了软硬件协同仿真和验证、可验证设计技术以及并行计算技术。在系统建模方面目前尽管电子产品设计领域内已经出现了多种系统模型如离散事件模型有限状态机模型控制数据流图模型等这些模型是建立在SoC系统或分离的CPUFPGA芯片松散耦合模型的基础kNB对SoPC系统的特点尤其是动态可配置性(RunTrineDynamicRe,configuration)没有充分考虑本文根据SoPC的特点结合软硬件划分和调度研究了适合SoPC的系统建模方法。新的系统模型具有多约束目标SoPC设计既要满足来自应用需求方面的约束又要满足来自目标平台的约束这些约束包括设计目标的收敛性(Convergence)、验证设计的覆盖率(Coverage)以及设计冗余(Redundancy)。在软硬件划分算法方面目前研究得比较多的是软硬件双路划分算法NBSMDJ而由于现在很多SoPC系统中集成了多个嵌入式处理器甚至还包括多个异构处理器系统软硬件划分算法由双路划分成为多路划分。根据ITRS的报告显示目前Verification和测试的开销已经超过了设计本身成为系统开发的瓶颈验证技术正面临着严峻挑战TRa】【rnb。可验证设计DFV技术通过在设计中增加易于验证的接口和逻辑使得设计内部状态更容易被控制或观察从而有效的降低验证复杂度提高验证的效率.并行计算是未来计算发展的重要方向主流的FPGA供应商已经在片上集成了多个微处理器如Xilinx已经推出的Vtrtex.ⅡPro系列器件中XCVP集成多达个JL第一章引占PowcrPC硬核而最新的Ⅵn懿Fx系列器件中集成了两个PowerPC硬核以及协处理控制器(AuxiliaryProcessorUnitAPtO此外片上可以实现多个微处理器的软核如Xilinx公司提供的Microblaze软核以及一些专用的处理单元如主要实现乘法和累加器运算通路的XtremeDSP等.SoPC能够灵活地实现多个功能单元的硬件并行因而流水线设计、多个功能单元并行以及并行控制等技术的研究对SoPC性能优化至关重要...高性能soPC处理平台中科院计算所已经实现了基于Xilinx公司提供的FPGA芯片的SAR成像C髓rpScaling算法的一些SoPC解决方案包括SAR.SoPC和SARSoPC其中版本采用了多个小容量的FPGA实现将成像计算中的FFI"和因子计算、以及因子补偿运算三部分分别采用不同的硬件实现利用FPGA芯片并行计算实现数据流水处理版本则采用了两片大容量的Vmexpro器件其中一片用作主处理芯片另一片用来加速SAR成像计算中关键计算单元即FFr运算单元。两个方案都实现了高性能的矩阵数据二维存取方案系统中无需Q血pScaling算法中的角度转置运算获得了较高的处理性能其中SARSoPC主处理器采用PLB单总线结构单板工作在MHz时能够在秒内完成一帧x的图像处理【中。在已有的SoPC系统基础上研究了片内多总线结构的SoPC系统通过引入片内多总线结构将片内的处理单元并行展开。由于采用了支持地址流水和同时读写的高性能的“位PLB总线每条总线都可以保持高速的数据流水因而获得了比单总线结构的更高的处理性能.采用三总线结构的SoPC系统比采用单总线结构的soPD系统在相同的系统时钟频率下性能提升了一倍多单板工作在MHz时能够在秒内同时完成两帧x的图像处理。多PLB总线的SoPC设计是一个复杂的系统设计围绕片内多总线结构的SoPC系统研究了其中若干关键技术包括高性能的异步总线桥设计技术、可验证设计DFV、总线负载均衡等。此外还研究了基于片内多总线结构的SoPC系统的扩展应用其实现了海量图像数据实时压缩。..SAIl实时成像SoPC系统设计与优化本文从合成孔径雷达的ChirpScaling算法实时成像系统的具体应用出发通过在高性能机群系统中应用标准消息传递界面(MessagePassingInterfaceMPI)进行了SAR实时成像算法的并行设计和性能优化建立了SAR实时成像SoPC系统的算法级设计、仿真系统、以及成像质量评测体系并应用其指导了SAR实时成像SoPC的软硬件设计和性能优化。.中国科学院博士学位论文一种幕于平赍的SoPC软硬件协同设计与实现基于曙光、曙光超级计算机。对SAR成像机群并行算法的运行效率进行了详细的分析研究了并行算法仿真运行效率的角度转置运算的效率将矩阵转置并行运算分解为本地矩阵转置、进程间数据交互以及本地数据重排三个操作。并对这三个操作的并行效率进行了详细的分析和优化。由于SAR处理算法补偿因子的计算精度要求高采用定点功能单元无法满足成像精度要求。目前基于FPGA的SoPC上可复用的浮点功能单元口比较少需要研究针对FPGA平台的高性能的浮点功能单元口。对于任意一个二进制数N可用N=SxP表示其中S为尾数P为阶码P、S都用二进制数表示S表示N的全部有效数字P指明小数点的位置当阶码为固定值时数的这种表示法称为定点表示这样的数称为定点数当阶码为可变时数的这种表示法称为浮点表示这样的数称为浮点数。定点表示时小数点在数中的位置是固定不变的其绝对误差在表数范围内是一致的定点数是对于其表数范围的均匀量化浮点数表示时小数点在数中的位置是浮动变化的其相对误差在表数精度范围内是一致的浮点数是对其表数范围的对数均匀量化。由于浮点数采用了对数均匀量化因而其表数范围比较大相对误差在表数范围内一致性这些都是定点数无法比拟的很多实际应用都要求采用浮点计算来提高处理数据的范围和精度。由于现有的SoPC上提供了针对平台进行优化的定点运算口如定点加法器和定点乘法器等设计高性能的浮点功能单元可以复用已有的定点运算单元来实现。研究了SAR成像alirpScaling算法中因子计算子系统的设计通过对因子计算算法的数值分析提出了软硬件协同实现的因子改进算法设计了采用改进算法的因子计算子系统。对系统集成和调试技术进行了深入的研究设计了全功能的PCI单元支持所有的PCI主设备和从设备的全部操作设置了影子寄存器和存储映射机制将PLB空间的关键寄存器和内存空间映射到PCI空间上通过调试主机可以方便的监控和调试SAR实时成像SoPC系统。研究面向特定应用的优化策略并将优化算法应用到SAR实时成像的soPC系统优化提高SAR实时成像SoPC系统的性能。优化策略主要研究了部分计算策略、数值逼近计算、流水线计算等.从算法级上基于计算精度和质量评价的基础上采用数值计算的方法代替原有复杂的计算将原来的多机并行的优化策略移植成为片上多处理器优化算法将软件设计中基于上下文优化的部分计算策略移植到硬件设计中针对应用计算范围优化硬件设计选取合适的数据宽度采用基于加法和移位器的CORDIC算法计算复数乘法和三角函数等。.论文的主要贡献本文围绕基于aIiIpScaling算法的SAR实时成像系统的具体应用系统地研究了基于平台的SAR实时成像SoPC系统的软硬件协同设计与实现包括系统模型、平台设计、岳第一章引言算法设计与原型仿真、系统实现、性能优化以及系统评测等相关内容。本论文的主要贡献是:.提出了一种适合SoPC建模的多约束处理流图模型(MultiConstrainProcessGraphModelMCPGM)。MCPGM以处理流图模型为基础适合基于平台的SoPC系统软硬件协同设计特点具有较强的平台描述能力。()通过增加虚拟处理节点能够方便的描述实际应用中软件和硬件之间切换时所需的开销()通过附加余量约束能够提供面向平台应用的设计余量分析()通过该模型将软硬件划分问题转化为满足硬约束条件的软约束最优或可行解。.设计并实现了一种基于SoPC平台技术的高性能片内多总线结构的SoPC(Multi.BusSoPCMBSoPC)。实际测试数据表明本文提出的三总线PLB总线结构能够同时支持输入和输出并行工作在相同的时钟频率条件下处理性能是单总线结构SoPC的两倍.()设计实现了高性能的异步总线桥。该桥适应多总线结构soPC的应用需求通过异步握手机制可以工作在两条完全异步的总线上利用高速异步FIFO提供数据Burst快速传输能力。()设计实现了可验证设计DFV方法包括DFV状态机、对有关联的多个状态机或控制逻辑设置状态同步点以及利用影子寄存器实现不同存储空间的数据映射三种方法。通过DFV设计有效地验证了平台设计显著降低了验证复杂度提高了验证效率。()动态总线负载平衡被应用到总线设备的设计中在设备的总线接入接口一侧封装了总线选择器MUX该总线选择器可以在多条总线之间进行切换从而改变总线设备的连接位置对不同的PLB总线上的负载实现了平衡。实际运行表明该总线选择器在增加一定的控制和数据信号线的代价上能够有效的平衡总线上的读写负载同时显著降低总线桥的工作开销结合时钟门控策略能够在功能设备闲置时将其时钟关闭。有效降低了总线设备的功耗开销。MBSoPC提高了数据输入和输出的有效带宽能够完成高性能的数字信号处理应用该平台实现了SAR实时成像和海量图像数据的实时压缩具有良好的平台扩展性。.实现了ClarpScaling算法的SAR实时成像多总线SoPC系统。合成孔径雷达成像的c抽pScaling算法适合较大的距离迁移情况处理比较精确基于片内三PLB总线结构的SoPC实现了实时成像SAR系统采用流水线和并行计算技术提高了成像效率。()SAR实时成像SoPC系统采用了软硬件协同实现其中固件实现系统的控制功能软件完成因子预处理硬件完成实时处理。系统工作在MHz时能在S内同时完成两帧X短整型定点复数数据的SAR成像计算.()设计了控制.调试子系统有效地支持了系统调试工作。设..中国科学院博士学位论文一种摹于甲台的SoPC软硬件协同设计与实现计了全功能的PCI单元支持所有的PCI主设备和从设备的全部操作通过影子寄存器和存储映射机制将PLB空间的关键寄存器和内存空间映射到PCI空间上调试主机可以方便的监控和调试SAP,实时成像SoPC系统。()实现了基于点目标成像的图像质量评价并应用该质量评价体系指导SAP,.实时成像SoPC系统的设计和优化。.设计并实现了实时计算的SAP,成像因子单元。因子计算是基于alirpScaling算法的SAR实时成像SoPC系统的主要运算部件之一通过对因子计算算法的数值分析在保持相当的计算精度的条件下提出了一种适合采用软硬件协同实现的因子改进算法降低了因子计算的复杂度设计了采用改进算法的因子计算子系统并分析了该因子计算子系统的效率和成像质量。()实际运行结果表明本文所提出的因子计算方法在计算精度保持不变的前途下显著提高了因子的计算效率。()通过整合三个因子计算将三个因子统一为相同的计算流程设计并实现了高性能的实时计算因子单元。()采用软硬件协同实现了因子计算单元对计算复杂但计算量较小的参数通过软件预计算获得作为参数传递给因子的硬件计算单元硬件单元采用全流水展开的并行方式每个时钟周期能同时计算四个点的因子单元适应了SAR.SoPC实时成像的流水要求。此外研究了采用基于MPI的大规模机群系统中SAR成像并行算法和性能优化为SAP,实时成像SoPC系统建立了算法设计、系统仿真和成像质量评测体系..论文的组织本文一共分为九章组织结构如图所示。具体内容如下:第一牵引言.弓I亩d.概述d!一.MCPOM系统建模d!一.MBSoPC平台设计一!一AR实m’PC景‰。研R了算法设荔耄嚣坯计与原越仿真景统实现系统评测等.系统设计.算靶苦gjg窖现.成像设计和质量和原型仿性能评真.因子子系统澳d设计与实现d!一.总结圈ll论文组织结构第一章为引言首先介绍了基于平台的SoPC的软硬件协同设计以及基于SoPC的SAR实时成像系统的研究意义并简述了本文的主要研究内容和主要贡献。第二章为概述分析和介绍了本论文的研究背景和国内外研究现状首先介绍了合成孔径雷达的成像原理、主要成像算法以及目前国内外对实时成像系统的研究现状等。接着讨论了基于平台的SoPC软硬件协同设计的概念和相关内容、国内外相关研究的进展.第三章针对基于平台的SoPC设计特点提出了一种多约束任务流图模型MCPGM对其进行了形式化描述并在此基础上讨论了基于MCt'GM的软硬件划分算法。分析了SAR实时成像ChirpScaling算法中的三种计算即FFT、因子计算、因子补偿的软硬件实现的效率和资源需求确定了基于平台的SoPC实时成像系统的软硬件协同实现方案。第四章提出了一种片内多总线结构的SoPC结构MBSoPC设计研究了MBSoPC设计中异步总线桥的设计与验证、可验证设计DFV以及总线负载均衡设计等若干关键问题.应用该MBSoPC系统模型实现了海量图像数据的实时压缩。从第五章开始到第八章研究了基于MBSoPC的SAR实时成像系统包括算法设计与原型系统仿真、系统主要功能单元设计与系统实现、系统集成和评测等相关内容。.中国科学l亮博十学位论文一种苹于平竹的SoeC软硬件协同设计与实现第五章。基于高性能计算机群系统应用消息传递界面的并行编程模式研究了SAR实时成像SoPC系统的算法设计、系统原型仿真和理论成像质量预测等.讨论了并行算法性能优化包括计算密集型应用和网络密集型应用的并行优化重点研究了并行算法的效率瓶颈即矩阵角度并行转最运算的效率提出了结合最优分块策略和冗余存储相结合的方法有效的提高了角度转置的运行效率加速了并行算法。通过基于高性能计算机的并行成像算法的研究分析了SAR实时成像SoPC系统的理论成像质量和系统精度应用并行成像算法指导了SAR实时成像SoPC系统的软硬件设计和优化工作。第六章应用MCt'GM模型和MBSoPC设计实现了合成孔径雷达QI打pScaling实时成像SoPC系统讨论了SAR实时成像SoPC系统中主要功能单元的设计分析了SAR实时成像SoPC系统中的成像处理流程设计实现了基于DCR总线和影子寄存器的控制.调试子系统。第七章针对合成孔径雷达实时成像的应用需求采用软硬件协同设计方法提出了一种SAR成像Cllirpscaling算法的因子计算的改进方法统一了ChirpScaling算法中三个因子的计算流程设计并实现了因子计算单元。第八章对基于片内多总线结构的SoPC的SAR实时成像系统的实际效果进行评测包括成像质量的主客观评价以及系统运行性能测试。第九章是总结阐述了本文的主要研究工作和结论并对进一步的研究工作加以展望。..第二章概述第二章概述本章结合SAR实时成像SoPC系统的具体应用介绍了合成孔径雷达的成像原理、两种常用成像算法、以及目前国内外SAR实时成像系统的研究讨论了基于SoPC的SAR实时成像系统的研究现状。随着集成电路制造和设计技术的快速发展SoPC已经成为目前SoC系统发展的重要趋势围绕基于平台的SoPC设计技术研究了目前SoPC平台技术的国内外现状和发展趋势分析了软硬件协同设计技术的研究进展。.合成孔径雷达成像原理SAR可实现全天时、全天候、大面积对地观察和高分辨率成像在军事、经济和环境等领域有重要应用价值【张】【韩棚】【王】。合成孔径雷达本质上是一个距离、方位二维祸合的系统因此成像处理实质上是一个距离、方位二维匹配滤波压缩过程【张】【徐】【韩】【姚。SAP,成像过程可归结为式(.)的二维卷积过程【zs】:Gr)口r)o^)口Gr)o^b)也b)(.)式中啊帅%呐一岘咙卜刎(.:)Il:一bk咻p【扣眈)J(.)其中O)是SAP,的回波信号口Or)是目标散射系数。h(x)是点目标的响应hl(xr)是距离向响应.Il:O)是方位向响应。.SAR成像算法合成孔径雷达的回波信号借助匹配滤波处理以获取最大的信号噪声比通过实现距离向的脉冲压缩来获取对回波时问上的高分辨率即距离方向一测距的分辨率或称作图像距离向分辨率。而方位向则通过多普勒锐化(合成孔径)来获取方位方向也就是角度方向的分辨率。显然合成孔径雷达的回波信号经过处理可产生一个二维的高分辨率

用户评论(0)

0/200

精彩专题

上传我的资料

每篇奖励 +1积分

资料评分:

/27
仅支持在线阅读

意见
反馈

立即扫码关注

爱问共享资料微信公众号

返回
顶部

举报
资料