首页 PMF翻译

PMF翻译

举报
开通vip

PMF翻译PMF翻译 PMF是一个多变量因素分析工具,它把采样数据矩阵分解成两个矩阵:系数的贡献(G)和因字数(F),这些因子情况需要用户利用测得的源配置文件信息,以及排放或排放清单进行解释,以识别对样品有贡献的的源类型 。该方法在这里简要回顾,在其他地方更详细地描述。 结果使用约束:没有样品可以有显著负贡献。PMF的使用样品的浓度和用户提供的不确定度进行各个点加权。 此功能允许分析人员占信心在测量。例如,检测限下面的数据可以被保留用于该模型中,与相关联的调整的不确定度,以便这些数据点比测量高于检测限的数据点,对解决方...

PMF翻译
PMF翻译 PMF是一个多变量因素 分析 定性数据统计分析pdf销售业绩分析模板建筑结构震害分析销售进度分析表京东商城竞争战略分析 工具,它把采样数据矩阵分解成两个矩阵:系数的贡献(G)和因字数(F),这些因子情况需要用户利用测得的源配置文件信息,以及排放或排放清单进行解释,以识别对样品有贡献的的源类型 。该方法在这里简要回顾,在其他地方更详细地描述。 结果使用约束:没有样品可以有显著负贡献。PMF的使用样品的浓度和用户提供的不确定度进行各个点加权。 此功能允许分析人员占信心在测量。例如,检测限下面的数据可以被保留用于该模型中,与相关联的调整的不确定度,以便这些数据点比测量高于检测限的数据点,对解决 方案 气瓶 现场处置方案 .pdf气瓶 现场处置方案 .doc见习基地管理方案.doc关于群访事件的化解方案建筑工地扬尘治理专项方案下载 有较小的影响。 因子贡献和因字数使PMF模型目标函数Q最小化。 Q是PMF的一个关键参数,两个版本的Q显示在模型运行。Q(真)计算是包括所有点的拟合优度参数。Q(鲁棒)是计算排除不符合模型的点(定义为样品的量的不确定度残差大于4)的拟合优度参数。 Q(真)和Q(鲁棒)的区别在于测试残差高的数据的影响。这些数据点可能与来自源的峰值影响相关联 EPA PMF需要底层多线性多次迭代(ME),以帮助识别最优化的因子贡献和因字数。这是由于在ME算法的性质 ,用随机生成的因子数开始搜索因子配置文件。这一因素配置文件使用梯度的方法来绘制的到最佳的解决方案的最优路径。在空间方面,该模型利用观察构建多维空间,然后使用梯度的方法来遍历空间 沿着这条道路找到最佳解决方案。最佳的解决方案通常是由沿着路径的最低Q(稳健)值(即最小Q)所识别,可以被想象成一个槽的底部在一个多维的空间中。由于起点的随机性(由种子值和它表示的路径来确定),不能保证该梯度方法总能找到多维空间(全球最低)的最深点; 它可能找到一个局部的最低水平。为了最大限度地达到全局最小,该模型应为一个开发的解决方案运行20次和100次对一个最终的解决方案,每次以不同的起点。 因为Q(鲁棒)不被那些没有被PMF拟合的点影响,它被用作一个关键参 数从多个运行选择最佳的运行。此外,可变性 Q(稳健)提供了一个指示(初始运行结果是否有显著变化),因为用来启动梯度算法的随机种子在不同的位置。如果数据提供稳定的路径到最小,则间Q(可靠)的值在不同运行之间将会变化很小(判据)。在其他情况下,该起始点和由数据定义的空间的组合会影响到最小值的路径,导致Q(鲁棒)的值变化;最低Q(健壮) 值默认使用,因为它代表了最优化的解决方案。应当注意的是 Q值的微小的变化并不一定表示该不同的运行具有的小的差异在源成分之间。 由于化学成分变化或过程变化引起的变异可能会造成因子配置的显著差异在PMF运行中。提供两个诊断去评估不同运行间的差异:内部运行残差分析和物种分布的因素总结相比那些最低的Q(稳健)运行。用户必须评估PMF中的所有的错误估计去理解模型结果的稳定性;算法和ME输出 在Paatero等人进行了描述。 (2014年)。PMF的解决方案的差异可以使用三种方法估计: 1、 自举(BS)分析用于确定是否有一个小的观察组可以不 成比例地影响解决方案 。BS误差区间包括随机误差 和部分包括旋转歧义的影响。旋转歧义是由PMF产生 的在许多方面相似的无限的解决方案引起。也就是说, 对于任意一对矩阵,可以通过简单的旋转一对矩阵可 产生无限变化。只有一个源的贡献非负的约束,不可 能限制这个空间旋转。BS错误估计通常是坚固的和不 被用户指定的样品的不确定度影响。 2、 替换(DISP)是一种分析方法,它可以帮助用户 了解解决方案的更详细的细节,包括其对微小变化的 敏感性。DISP误差区间包括旋转歧义的影响,但不包 括数据中的随机误差的影响。数据的不确定度将直接 影响DISP误差估计。因此,向下加权的物种的误差区 间很可能大 3、 BS-DISP(混合方式)的误差区间包括随机误差和 旋转歧义的影响。 BS-DISP结果比DISP结果更加可 靠,因为BS-DISP的DISP相不像DISP本身那样强烈 的置换。 这些方法在三个空气污染数据集中被应用在Brown等人。 (2014年)。本文提供了基于环保局误差估计应用的解释。Paatero等人(2014)和布朗等人(2014年)文献是美国环保署的PMF的重要参考,两者都提供了错误估计的详细信息和他们的解释,这只简要介绍在本指南中。 1.2多线性发动机 如上所述,两种常见的方案解决了PMF的问 快递公司问题件快递公司问题件货款处理关于圆的周长面积重点题型关于解方程组的题及答案关于南海问题 ,最初, PMF2解决方案(Paatero,1997)被使用。在PMF2,非负约束可能被加在因子元素和最小二乘拟合时,测量将会被单独进行基于不确定度。有了这些功能,PMF2是环境数据的受体模型的显著改进对以前的主成分分析(PCA)技术。然而,PMF2是有局限的,因为它被设计来解决一个非常具体的PMF问题。在20世纪90年代后期,ME,一个更灵活的方案,开发出来(Paatero,1999)。这个方案,目前在它的第二个版本,并称为ME-2中,包括与PMF2许多相同的特征(例如,用户能够进行单独的加权测量,并提供非负约束条件);然而,不像PMF2,ME-2的结构使得它可以用来解决各种多线性问题,包括双线性,三线性和混合模型 ME-2是通过将两个单独的步骤结合来解决PMF问题。首先,用户定义感兴趣的PMF模型的表。然后,一个自动化的二次程序读取表格模型参数,并计算该解决方案。当采用EPA PMF解决 PMF问题,第一步是通过由所述EPA PMF的用户界面产生的输入文件取得。一旦指定了模型,数据和用户规格由EPA PMF送入二次ME-2程序。 ME-2解决了PMF的迭代公式, 最小化求和-平方对象函数,Q,通过一系列的步骤,如图1。 一个稳定的解决方案已经达到,当额外的迭代用来降低提供的Q值递减。通过以上三个层次的迭代,寻求解决方案从粗到细规模。迭代的第一级识别空间解决方案的整体区域。 在这个水平 上,Q的变化(DQ)需要小于0.1超过20个连续的步骤且不到800步。第二个水平识别的最终解决方案的附近。这里, dQ的要求小于0.005超过50个连续的步骤且不到2000的步骤。第三级收敛到最佳的Q值(Paatero,2000),其中dQ的应该小于0.0003超过100个连续的步骤且小于5000的步骤。 ME-2通常需要小数据集(小于300的观察)的几百次迭代和高达2000对于大型数据集(Paatero,2000)。如果没有找到一个解决方案,满足三个层次任何一个的要求,那么解决方案是不收敛的(Paatero,2000年)。从ME-2的输出由EPA PMF读取,然后格式化由用户解释。此外, EPA PMF具有通过ME-2和EPA PMF实现的三个错误估计方法。 ME-2和PMF2模型的结果之间的差异已通过相同的数据集各模型的,其结果的比较应用研究在几个研究中。总的来说,这些研究显示了主要成分的相似的结果,但在PMF2溶液中的更大的不确定度(斋戒等人,2003),并使用ME-2更好。盲源分离(Kim等人,2007)。在最近的两个出版物,要素配置文件限制由ME-2的应用导致了发现的来源数量较多(阿马托等人,2009;阿马托和Hopke,2012)。EPA PMF5版本采用了最新版本的ME-2和PMF的脚本文件,该文件 通过Pentti Paatero在赫尔辛基和雪莱埃伯利大学几何被开发 工具(2014年3月3 日;me2gfP4_1345c4.exePMF_bs_6f8xx_sealed_GUI.ini) 2 PMF的使用 PMF已应用于多种范围的数据,包括24小时分辨率的PM 2.5数据,气溶胶粒度分辨,沉降物,有毒气体,高时间分辨率的测量,从气溶胶谱仪(AMS)得到的和挥发性有机化合物(VOC)的数据。参考部分(第9部分)提供了PMF引用的众多参考。关于PMF应用的更多讨论可在多元受体建模工作簿中见到(Brown等,2007)。我们鼓励用户阅读与他们的数据有关的论文以及源解析论文。用于PMF分析的方法已经改变了,例如限制已提供。重要引用总结于表1中。 PMF需要一个数据集通过多个样品检测得到的一组参数。例如,PMF常用于100个样品以上包含10?20个物种的PM2.5数据集。不确定度数 不确定度计算使用以往的不确定据集,分配了每个种类和样品的不确定度值。 度或其他可用信息例如采样精度。 3、 PMF5.0安装 4、特点 通过PMF5.0可获得以下特征 1整理数据 列在表中可以通过左键点击列标题进行排序。点击一次会以递增顺序对项目进行排序,点击两次将降序排序。如果列已排序,箭头会出现在标题显示在它的排序方向 2保存图像 所有图形输出可以通过右键单击图像以各种格式保存。可用的格式是.GIF及.BMP,.png和.TIFF。在同一个菜单中,用户可以选择复印或打印图形。一种堆叠图形选项也可以把因子或者时间序列结合在一个页面。当“复制”时,图形将被复制到剪贴板。在“打印”时,图形将自动发送到本地机器上的默认打印机。当保存一个图形,会出现一个对话框,以便用户可以改变文件的路径和文件的输出文件的名称 3出图 任何图形可以在新窗口中打开通过右键单击图,并选择浮动窗口。根据需要,用户可以打开多个窗口。但是,当模型参数和输出改变时,浮动窗口的图形不更新。 4调整表内部分 许多标签都用灰线分隔成多个部分(图2,红色箭头指向的灰色条使用户可以调整高度和宽度)。这些部分可以通过点击灰色的线并将其拖动到所需的位置调整大小。 5显示选定的数据点 当用户移动光标到一个散点图或时间序列图的一个点,点用虚线正方形括住,指示状态栏上的信息是指该点 6在列表和表中使用箭头键 选择(点击或Tab键)一个菜单或表,键盘上的箭头键可用于改变所选择的行。 7访问帮助文件。 大多数屏幕的左下角有一个“帮助”快捷方式 提供用户访问的帮助文件与当前屏幕有关的主要功能 8使用状态栏 大多数屏幕都在窗口底部的状态栏提供了额外的信息给用户。根据所选择的选项卡,这些信息在变动。各个选项卡的详细信息将在本指南后面的章节中讨论。浓度屏幕上散点图的状态栏的例子显示在图2的底部。 5开始启动 每次PMF5.0程序启动时,有关该软件的各种版权的发展信息的闪屏将显示。用户必须单击OK按钮或按空格键或回车键继续。 EPA PMF的第一窗口是数据模型选项卡下的数据文件,如图3,在该屏幕上,用户可以提供文件的位置信息,并进行所需的选择。这个屏幕具有三个部分:输入文件(图3,1),输出文件(图3,2),和配置文件(图3,3),每一个在下面有详细描述。 EPA PMF5.0可以读取多个站点的数据; 物种浓度的时间序列图或源的贡献在将显示以相同的顺序像用户提供数据那样,PMF显示垂直线区别不同的站点。 在数据文件屏幕底部的状态栏显示该项目的哪部分已经完成。 在数据文件屏幕底部的状态栏显示该项目的部分已经完成。在任何用户输入数据文件之前,屏幕上状态栏红色显示“NO浓度数据,没有不确定度的数据,没有基础的结果,无自举结果,无BSDISP结果,和NO DISP结果”。当任务完成后,“否”替换为“有”,颜色变为绿色。在图3的例子中,浓度和不确定度的文件已经提供给程序,所以前两个项目上的状态栏是绿色的。基本运行,BS运行, BS-DISP运行, DISP运行尚未完成,因此最后的四个项目是红色的。巴尔的摩pm文件(数据集巴尔的摩背景和数据set_Baltimore_unc.txt)是安装包的一部分,可以在被发现在“C:\文件\ EPA PMF\ Data”文件夹,如果用户使用的是默认安装模式 安装设置。 5.1输入文件 PMF所需的两个输入文件:(1)样品的物种的浓度值和(2)样品的物种的不确定度,或用于计算不确定度的参数。 EPA PMF接受制表符分隔(.txt),逗号分隔值(CSV),和Excel工作簿(.xls或.XLSX)文件。每个文件可以被加载通过输入路径进入“数据文件”框中输入或浏览到相应的文件。如果文件包含多个工作表或命名区域,用户将被要求选择他们想要使用的一个。浓度的文件具有物种如行所示和日期,样品编号如列所示,都有一个标题(图4)。 所有 标准 excel标准偏差excel标准偏差函数exl标准差函数国标检验抽样标准表免费下载红头文件格式标准下载 的日期和时间被接受,他们被列在日期格式下拉列表中。四个可能的输入选项被接受:(1)只用样本ID,(2)只有日期/时间,(3)样品ID和日期/时间,(4)不带ID或日期/时间。单位可被包括作为浓度文件中的第二标题行,但不做要求,单位不包括在不确定度文件。如果单位是由用户提供的,它们仅被用于图形用户界面(GUI)的轴标签,不会被所用的模型使用。空白单元不被接受;用户将被提示检查数据,然后再试一次;品种名称不能包含逗号。如果小于-999的值被发现在数据集,程序会给出一个警告信息,但将继续进行。如 果这些值并不是真值或指示是缺失值,用户应该修改程序之外的数据 文件,并重新加载数据集。此外,每个品种的名称必须是唯一的。用 户必须指定日期/时间和ID/站点列假如它们包含在输入数据里。基本 PMF功能展示了使用单一站点的数据和多站点的数据的例子示于第 8.1节。多个站点的数据应当把站点和日期/时间加载到PMF之前进 行排序。线划定样品ID将不会被显示出来如果缺失值是出现在样品 ID之间的过渡和 “排除缺失样本”选项将会被选择;缺失过渡的样本 应该被移除或“用样品中位数代替缺失的样本”的将会入选。 图中输入文件画面 的例3。 样品种类的不确定度应该包括错误,如取样和分析误差。对于某些数据集,分析实验室或报告机构提供了每个值的一个不确定度估计。然而,不确定度并不总是报告,当它们不可用时,误差必须由用户进行估计。不确定度的的计算讨论在文献等人提供的。 (2007年)。 EPA PMF5.0接受两种形式的不确定度的文件:基于观察和基于方程。观察为基础的不确定度文件提供每个样品中的物种的不确定度的估算。它应该与浓度文件具有相同的尺寸和第一列仍然是日期,日期时间或样本号;然而,不确定度 文件中不包括单位。如果浓度文件中有包含单位的行,该不确定度的文件将比浓 度文件少一行。如果浓度和不确定度的列和行标题不相符,用户将得到通知,但该程序将继续进行。此外,该程序将检查以查看在浓度和不确定度的文件中的日期或样本数是否一致。如果有一个不匹配的数据,程序将不会允许进行评估。如果表头是不同的,由于命名,但实际上具有相同的顺序,用户可以继续进行下一个步骤。如果不是,用户应纠正GUI以外的问题,并重新加载这些文件。负值和零不能作为不确定度值; EPA PMF将提供一个错误信息,并且用户必须从EPA PMF中删除这些值,并重新加载该不确定度文件。 以方程为基础计算不确定度提供EPA PMF5.0用于计算每个样品不确定度的特异性参数。这个文件应该具有的物种分隔的行,与物种的名称(图5)。 下一行应该是物种特异性的方法检出限(MDL(方法检出限)),随后是不确定度的行(物种特异性)。任一检测限或不确定度百分数都不允许零和负值。如果浓度小于或等于所提供的MDL(方法检出限),不确定度(UNC)的计算使用MDL(方法检出限)的固定部分(公式5-1; Polissar等,1998)。 Unc =5/6.MDL(方法检出限) 如果浓度大于提供的MDL(方法检出限),该计算是基于用户提供的浓度分数和MDL(方法检出限)(方程5-2) 基于方程的样本不确定度文件(数据集巴尔的摩等式)已在C:\文档\ EPA PMF\ Data文件夹中提供了。该方程为基础的不确定度是有用的,如果仅MDL(方法检出限)和误差百分比可用;然而,这种方法不会捕获与特定样品相关联的错误。由方程为基础的方法计算出的不确定度,由于简化,不与巴尔的摩unc.txt匹配。 用户可以在屏幕上的输入文件中指定一个缺失值指标(可以是任何数值)的数据文件。用户不应该选择一个数字指标那可能是一个真正的浓度。例如,如果用户指定的“-999”作为缺失值指示符,以及选择要替换该物种用中位数,程序将找到的数据文件中的“-999”的所有实例,并将它们用物种特异性中位数替代。该程序将取代所有相关的不确定度值,用一个比物种特异性中位数4倍高的不确定度。如果所有样本的一个物种的丢失,该物种被自动归类为“坏”,并排除进一步分析。缺少的值指示符被用在输出的文件。 如果显示一条消息,浓度和不确定度的文件中的日期/时间不相匹配,用户需要检查文件的日期/时间,并能够在评估PMF中的数据之前,重新加载数据。如果日期/时间在这两个文件是相同的,尝试以不同格式保存的浓度和数据文件,如.csv或.txt。 5.2输出文件 用户可以指定输出目录(“输出文件夹”),选择环保局PMF输出文件类型(“输出文件类型”单选按钮),并定义一个输出文件的前缀(“输出文件前缀”),前缀将被添加到每个文件的开头;例如在图3的例子中,文件将被保存为Balt_profile.xls。对于在用户指南中的示例中,前缀用星号(*)。“输出文件类型”包括制表符分隔的文本(。txt),逗号分隔值(。CSV)或Excel工作簿(的.xls)。 “输出文件前缀”是将被作为任何输出文件的第一部分;该前缀可以包含任何字母和/或数字(例如其它字符 “ - ”和“_”是不允许的)。如果在启动一个新的运行前不改变这个前缀,警告将被显示。如果输出为Excel工作簿被选择,两个输出文件将自动被创建由EPA PMF在基础运行期间,并保存在由用户选择的我的文档\ EPA PMF\输出文件夹:*_base.xls和* diagnostics.xls.每一个文件有标签和PMF 结果。 ,*_base.xls – 轮廓,贡献值,残差,运行比较 ,*- diagnostics.xls – 总结,输入,基本运行 如果选择分隔的输出,在基本运行选项卡上的相应的信息将作为单独的文件提供并且诊断选项卡上的信息将合并到一个文件中。以下列表提供关于被保存在Excel中输出文件中的数据的细节。 进行引导后,附加文件被创建和保存:(*_profile_boot),DISP (*_DISPres1,*_DISPres2,*_DISPres3,*_DISPres4),BS-DISP(*_BSDISP1,*_BSDISP2,*_BSDISP3,*_BSDISP4),FPEAK(*_fpeak),和/或约束的模型运行(*_Constrained)。DISP和BS-DISP的这四个文件输出为是为每个dQmax;使用了最低dQmax的运行在图形和输出文件总结中使用了。文件 *_ErrorEstimationSummary提供了使用BS,DISP,和BS-DISP错误估计已经完成的基本运行和错误总结。文件*_profile_boot包含了BS映射到每个基础运行的次数,每一个被映射到基础轮廓的BS轮廓,和由GUI生成的所有的引导统计。该文件*_fpeak包含轮廓和每次FPEAK运行的贡献。当多个基础模型运行完成后,默认情况下,只有以最低Q(robust) 值运行的运行保存到输出端,但用户可以选择在输出中包含的所有运行通过取消选择“只有选定的运行输出。 5.3配置文件 EPA PMF提供了在一个配置文件中保存优先运行和输入参数的选择。用户必须对屏幕输入文件上的配置文件提供一个名称来创建一个配置文件。保存在配置文件中的信息包括数据文件屏幕的一些信息 (如,输入文件,输出文件的位置和输出文件类型),浓度/不确定度屏幕上的物种分类,基础模型屏幕上的所有运行规范,FPEAK旋转屏幕,约束模型运行画面。模型输出不保存为配置文件的一部分;然而,如果随机开始按钮被选中,模型随机起点或种子数目将被保存。为了选择一个配置文件,用户可以点击“浏览”,浏览到正确的路径或键入一个路径和名称。用户也可以按“加载上次”按钮或直接按键盘上的“Enter”键加载最近使用的配置文件。 “保存”和“另存为”按钮可用于将当前设置保存到现有的或新的配置文件。 配置文件可以被用在多台计算机或与合作者共享,从而避免喜好一长串复制 结果。使用“浏览”按钮找到并加载配置文件。浓度和不确定度的文件的位置必须在下一步确定。 PMF不存储过去的运行数据;然而,相同结果可以很容易地通过PMF计算只要使用相同的因子数,运行,以及固定的种子(随机开始没有被选中)。 5.4建议的操作顺序 图形用户界面被设计当运行PMF模型时给用户尽可能多的灵活性。但是,某些步骤必须完成以利用所提供的工具的潜能。操作的顺序主要基于标签和功能在程序中怎样安排(从左至右)(图6,图7,图8);本用户指南中的部分也按照这个顺序。 开始使用该程序时,在其他操作可用之前,用户必须提供输入文件通过数据文件屏幕。在第一次,PMF对数据集执行时,用户应通过浓缩/不确定度,浓度散点图,浓度时间序列和数据异常画面分析输入数据。这一步通常后跟基本模型选项卡下的基本模型运行和基本模型结果;根据需要,这些步骤应重复,直到用户达到一个合理的解决方案。该解决方案使用误差估计进行评估,以DISP开始,和进展到BS与BS-DISP;来自误差估计方法(DISP,BS和BS-DISP)的输出提供了关于该方案的稳定性的关键信息。所有这三种错误估计方法都需要了解与解决方案相关的不确定度。 高级用户可能希望启动以一个选定的基础运行为基础的FPEAK运行或限制的模型; 在旋转工具选项卡下,这两个选项都可用。 5.5分析输入数据 运行模型前有几个工具可以帮助用户分析浓度和不确定度的数据。这些工具可帮助用户决定某些物种是否应被排除或向下加权(例,由于增加了不确定度或低信号噪声比),或者某些样本是否应排除在外(例如由于一个异常事件)。所有更改和删除应报告的在最终解决方案。四个屏幕用于分析输入数据如下所述。 5.5.1浓度/不确定度 输入数据的统计和浓度/不确定散点图呈现在浓度/不确定度画面,如图9所 示。以下统计计算每个物种和显示在屏幕左边的表中(图9中,1): 其中,n表示所选择的变量的非缺失值的数目; p是感兴趣的百分位; I是L(N,P)的整数部分; F表示L(N,P)的小数部分; W1, W2和W3是权重; P是在p 个百分点;和X1,X2... XN表示感兴趣的变量的有序值。 EPA PMF的S / N的计算在新的版本已经进行了修订。先前,在给定物种的S / N基本上是由不确定度值的总和除以该浓度值的总和。而事实上,这可能导致在某些特定情况下不同的问题。虚高的S / N值将从物种屈指可数的高浓度事件获得,导致一个S / N实际上可能比另一个更稳定的信号的物种的S / N更高。更为严重的是,人为的低S / N值可能出现在有几个遗漏值的物种上。缺失值通常由非常大的不确定度值降低权重,通常(远)高于物种中的最大浓度值。 如果先于摄取到EPA PMF之前对数据做这一步,这种膨胀的不确定度值就会在S / N的计算中膨胀N,从而导致S / N足够小,以使一个分类完美的“强”变为“弱”。后一个问题已多次在实际工作中观察到。此外,小的负浓度值的存在, 在环境数据中并不罕见,可以人为地降低S以致一个物种的S / N。 在修改后的计算中,仅超过了不确定度的浓度值对S / N计算的信号部分有作用,因为浓度值基本上等于信号和噪声的总和,因此,信号是浓度和不确定度之间的区别。 两个计算执行来确定S / N,其中,低于不确定度的浓度值被确定为没有信号,并且高于不确定度的浓度:浓度(?)和不确定度(SI)之间的差值被用作信号(公式5-3): 这个新的S / N的计算结果是浓度总是低于其不确定度的物种S / N为0.与浓度是不确定度值两倍的, S / N为1,S/ N大于1的通常表示一个物种“好”的信号,虽然这取决于不确定度如何进行测定。负浓度值对S / N无贡献,和有屈指可数的高浓度的事件的物种将不会有虚高的S / N。虽然有许多方法来确定S / N,在EPA PMF新版本所选择的一个可能会环境数据分析中更有益,与之前的版本相比,但需要提醒的是S / N只是许多筛选数据的分析之一。 基于这些统计和分析和取样问题的认识,用户可以把一个物种分类为“强”,“弱”或“坏”,通过选择该品种在输入统计数据表中(图9,1),并按桌面下相应的按钮(图9,2)。此外,ALT + W,Alt + B键和Alt+ G可以用来改变一个物种类别,弱,差, 或不错。所有物种的默认值是“强”。 分类为“弱”的物种三倍其所提供的不确定度,分类为“坏”的,在余下的分析中全部排除。如果一个物种被标记为“弱”,该行显示为橙色;如果一个物种被标记为“坏”的,行高亮显示为粉色。当为每个物种选择种类,用户应该考虑的是,源的存在可能对物种有贡献根据测得的文件,点源的示踪元素可能有罕见的影响,缺失或低于检测限的样品的数目,关于物种的收集或分析的众所周知的问题,以及物种的反应。 关于这些考虑的讨论在R等的文献中提供。来源,取样和不确定度分析的 详细知识是决定物种类别的最佳方式。如果对数据集的详细信息不可用,S/ N比可以被用于一种或多种物质的分类。保守地使用S/ N比来进行分类,如果S / N比小于0.5,该品种分类为“差”,如果S / N比大于0.5,但小于1,为“弱”。对于样本提供的安装包(数据集,Baltimore_con.txt和数据集中,Baltimore_unc.txt)的巴尔的摩的数据集,这些准则将铝,砷,钡,氯,铬,锰和硒分类为“坏”和铅,镍,钛和钒为“弱”。 通过改变物种类别为“弱”或通过添加额外的模型不确定度引起用户提供的不确定的任何改变应该由用户记录并报告最终的解决方案。 对于熟悉EPA PMF的用户,表2显示了巴尔的摩输入信息的总结,它应用在第5及6部分演示PMF。本总结信息将呈递给当学习美国环保署的PMF5.0的新功能和结构时愿意来运行软件的用户。 浓度/不确定度散点图被显示在屏幕的右侧(图9,3),图中显示的浓度和用户提供或PMF计算的不确定度之间的关系。输入数据统计表格中的被绘制的因素被选择,通过点击物种行或向上和向下滚动,一次只能显示一个物种。每个种类的统计示于表:S/ N;最小值(MIN),第25,第50,和第75 百分位;最大值(Max),,模型样品(由与所选物种匹配的非缺失的样本的数目除以输入样本 的总数),和,原始试样(由非缺失的输入样本数目除以输入样本的总数量)。例如,如果四个位点有相等的数据点数目和没有缺失数据被摄入,且只有四个位点中的一个位点被列入建模,“,模型样本”=25,,而“,原始样本”为100,,因为有当摄取时没有数据直接减少。如果在摄入数据中有丢失的数据,而对缺失数据进行“排除整个样本”选择,包括模拟,和,原料将会降低。最后两个值是重要的,因为PMF要求所有的好或弱类物种对被包括在PMF运行中的样品是不可缺少的。在,模型样品和,原样品可用于鉴定物种,该物种可用于限制在一个运行中使用的样本的总数 X轴是浓度,Y轴是不确定度,并且该图表标题是物种绘制名。如果用户改变一个物种分类为“弱,该物种”浓度/不确定散点图将被更新以三倍原来的不确定度,数据点会变为橙色正方形。如果用户改变一个物种分类为“坏”,该物种图将不会显示。典型的浓度和不确定度的关系是曲棍球棒的形状当在低浓度下MDL(方法检出限)占主导地位的不确定度,成为线性当浓度的百分比占主导地位的不确定度。不按数据的总趋势的不确定度的点,应该通过读取可用的采样和分析报告进行进一步评估。 用户还可以增加“额外模型不确定度(0-100,)”施加到所有物种,通过在 屏幕的右下角的框中输入一个值(图9,4)。此值包括各种误差,不考虑测量或分析误差和这两个误差被包括在用户提供的不确定度文件中。可能导致模型误差的事件包括的源配置文件变化和大气中的化学变化。该模型使用“额外模型不确定度”变量来计算“sigma西格玛”,这相当于总的不确定度(模型的不确定度加上物种/特定样品的不确定度)。如果用户指定额外的模型不确定度,所有的浓度/不确定度的图将被更新以反映增加的不确定度。如公式1-2所示,不确定度值是PMF模型的重要输入。 在该屏幕上,用户还可以指定“总变量”(图9,2), 后期,程序将用它处理结果。例如,如果所使用的数据是PM2.5组分的,总的变量将是PM2.5质量。用户通过指定种类选择总变量和按输入数据统计表格下方的“总变量”按钮。由于一个总变量对解决方案应该不会有一个大的影响,因此它应该给予高的不确定度。因此,当一个物种被选为总变量,它的分类是自动设定为“弱”,如果用户已经在PMF之外调整了总变量的不确定度,并希望把它归 类为“强”, 默认特性可被覆盖通过选择“强”为变量在选择“总变量”后。指定的“坏”一个物种不能选择作为一个整体变量,总变量也不能指定为“坏”。 在浓度/不确定度屏幕的状态栏显示每一类物种的数量以及用户排除样本的百分数。热键可以用来指定“强”(ALT-S),“弱”(ALT-W),“坏”(ALT-B)和“总变”(ALT-T)。用户同时可以通过单击列标题对输入的数据进行排序。点击“物种”和“种类”列对输入的数据将按照字母进行排序或反向字母顺序排列。点击其余各列按升序或降序对数据进行排序。返回到原来的种排列顺序(其对应于数据文件屏所输入的浓度数据文件中列出的顺序),用户可以选择“不排序”(图9,2),或者使用热键(ALT-U)。 5.5.2浓度散点图 物种之间的散点图是一个有用的PMF预分析工具;物种之间的相关关系表示了类似的源类型或源位置。用户应检查散点图寻找预期的关系,以及寻找其他关系,可能表示源或源类别。 此浓度散点图屏幕显示两个用户指定的物种(图10)之间的散点图。 用户在相应的“Y轴”或“X轴”列表为每个轴选择物种。每个轴只能选择一个物种。一个一对一的线(蓝色)和线性回归线(虚线红色)显示在图上。轴标签 的标题是“Y轴物种/ X轴的物种。” 物种之是物种名称和单位(如有提供)及图 间线性关系的一些例子指明源的影响:铁和锌的来源钢铁生产和硫酸铵的硫酸根和铵离子来自燃煤电厂。 当用户将鼠标放在该点,在窗口底部的状态栏中显示日期,y值,x值,以及回归方程。 5.5.3浓度时间序列 物种的浓度的时间序列图(图11)是有用的,以确定预期的时间模式是否存在于该数据中,以及是否有任何不寻常的事件。通过叠加多个品种,用户可以查看是否有任何不寻常的事件是通过一组物种可能表明一个共同源存在。用户也应当检查应被排除模型的时间序列极端事件(例如,升高的钾浓度在七月四日来自烟花。烟花影响可能在七月四日之前和之后以及除夕(浓度升高对1月1日采样)。 用户可以选择多达10种物种名称在浓度时间序列表中通过选中每一个物种名称的旁的复选框(图11中的1)。所选的物种将被以不同颜色显示。要从图中清除所有物种,用户应选择列表下面的“清除选择”。垂直橙色线表示每年的1月1日(如适用)作为参考。. 带有物种名称和单位的(如果有的话)的一个说明在图顶部提供。该说明对每一个选择自动更新。状态栏显示选择的样品的日期和时间,如果提供了样品的ID,样品的数目包括了总样排除的数目,以及用户排除的样品的百分数。图下面的箭头按钮,或键盘上的左,右键,箭头键,可用于滚动样品。如果一组样品被选择,箭头将指向第一个选择的样品,前进/后退一个样。样品可以从分析中移除通过选择单个数据点用鼠标单击或拖动鼠标移到某 个日期范围中。按图下面的“排除样品”按钮将删除样本以及从所有物种中移除(图11中的2)。排除样品可以再次包括进来,通过选择数据点/范围上任何物种的时间序列图和按“还原样品”按钮。”如果一个样品从分析中移除,也不会被包含在由EPA PMF生成的统计信息或图中或者任何模型的输出中,但它不会从原始的用户输入文件中删除。热键可以用来排除(ALT-E)或恢复(ALT-R)选择的样品。一些受烟花爆竹影响的样品被排除在外:02年7月4日,02年7月7日,02年7月8日,02年12月31日,03年7月5日,01/01/05,07/ 03 / 05,07/01/06,而06年7月4日。影响如烟花的影响,对PMF和多变量模型是一个挑战,因为他们是罕见持续时间短的高浓度事件。 5.5.4数据异常 由GUI引起的输入数据的变化在数据异常画面有详细描述。这些变化包括指定一个物种“弱”或“坏”, 排除一个样本通过浓度时间序列图,或者排除一个样本使用“缺失值指标”在数据文件屏幕的“输入文件”对话框。点击鼠标右键,保存数据异常信息。 5.6基本模型运行 基本模型运行产生主要的PMF因子和贡献输出。基本模型运行采用一个新的随机种子或出发点用于迭代如果选择了“随机启动”选项。用户可以测试该解决方案是否是局部或全局最小通过使用许多随机种子并检查Q(稳健)值是否稳定。恒定的种子可以通过取消选择“随机启动”对话框进行设置。因子数相同,运行相同的恒定的种子将产生同样的PMF结果,种子也被保存在配置文件中。该配置文件可以被重新加载为PMF解决方案额外的评价,也可以发送给合作者进行PMF解决方案的评价。 5.6.1启动基本运行 基本模型运行在基本模型标签下的基本模型屏幕启动。下面的参数需要指定: “运行次数”-要执行的模型的运行次数,;这个数字必须是介于1和999之间的整数。运行的推荐数量是20,这将允许评估Q的变化。 “因子数”-模型应该选择的适合的因子数目;这个数目必须介于1和999之间的整数。因子数的选择将取决于用户对影响样品的源因素,样品的数目,采样时间分辨率,物种特性的理解。 “种子”- ME-2每次迭代的起点,默认是随机启动,这告诉GUI每次运行随机选择一个起点。随机种子数会显示在“种子数”对话框(图12,1)。为了再现结果,取消选择“随机开始”选项,以使所用的种子数目将被保存为.cfg文件的一部分,并因此相同的解决方案创建利用相同的.cfg文件(图12,2)。 指定上述参数后,用户应该按基本模型上的“运行”按钮启动基本运行。一旦运行被启动,在屏幕的右下角的“运行进度”框激活。基本模型运行可以随时终止通过按下“运行进度”对话框下的“停止”按钮。在这个对话框中的进度条充满当该运行完成。当运行停止,有关运行的信息将不会被保存或者显示。 在基本模型运行屏幕的状态栏与数据文件屏幕一样显示相同的信息。 5.6.2基本模型运行总结 当基本运行完成后,每次运行的总结出现在基本模型运行画面中的右侧部分在基本模型运行总结表中(图13中的红色框)。 Q值是用公式1-2计算的拟合优度参数,是对模型拟合输入数据进行的很好评估。用最低的Q(鲁棒)的运行被高亮显示,并且只有融合解决方案应进行审查。不收敛表明该模型没有找到任何极小。有几种情况可能导致不收敛,包括不确定度过低或指定不正确或不恰当的输入参数。 Q(稳健)和Q(真)值提供了运行的拟合的比较,通过比较残差提供更详细的比较。内运行残差计算与基本模型间的残差相比通过增加每一对基本运行缩 放残差的不确定度之间的平方(公式5-5): 其中,r是经缩放的残差,i为样品,j是变量,而k和l是两个不同的运行。这些结果显示在一个矩阵中,并且可以用于识别具有显著不同拟合度的运行。此外,对于每个运行一对物种值可以通过增加d值(公式5-6)进行比较。 D值在一个基础运行对矩阵里被报告。用户应该检查这个矩阵大的变化,这表明两个运行分导致真正的不同的解决方案,而不仅仅是彼此旋转。如果不同的解决方案被看到,用户应检查d值,这将表明,个别物种在整个运行中具有不同的拟合度。 这些因子中的每个因子的物质的浓度分布和种类总和百分比结果也被评估:最低的Q值,最小值(MIN),第25百分位,第50百分位数,第75百分位数,最大值(MAX),平均值,标准差(SD),相对标准偏差(SD* 100 /平均值),和RSD,最低Q。物种分布的大的变化可表示因子信息正在改变,由于处理变化,反应性,或测量的问题。 这些内部运行变化的结果都记录在*诊断文件,并可以查看通过GUI通过选择诊断选项卡并滚动查看“规模化残差分析。”此外,该相对于最低Q(强大的)运行的物种分布的因子的总结记录在*_run比较文件,并可以通过GUI选择诊断选项卡和窗口下的“运行比较统计查看。 5.6.3基本模型结果 基本模型运行结果的详细信息在基本模型结果选项卡下的屏幕中提供。以最低Q(稳健)值运行的结果会自动显示。用户可以改变运行次数,通过高亮显示在基础模型运行屏幕的基础模型运行总结表,或在基本模型结果屏幕底部选择运行数目。 残差分析 残差分析画面(图14)对于选定的运行以多种格式显示缩放残差的不确定度。在屏幕的左侧(图14中的1),用户可以选择一个物种,这将被显示在屏幕中央 )。直方图显示了在一个给定的箱图中所有缩放的残差的直方图中(图14中的2 (每个箱等于0.5)的百分数。这些图是有用的,对确定模型是否很好的拟合每个物种。如果一个物种有许多规模较大的残差或显示不正常的曲线,它可能是一个很差的不合适的指示。 在图14中的物种(硫酸盐)是模拟较好;所有的残差在3和-3之间,且他们是正态分布的。在3和-3之间提供灰线供参考。选择“自动调整直方图”对话框设置y轴最大范围为每个物种最大箱图值的+10,。如果选中该复选框,y轴最大值固定为100,。残差超过+3和-3的物种需要在OBS/预测散点图和时间序列的屏幕中进行评估。大的正缩放残差可能表明PMF未嵌合该物种或物种的存在于一个罕见源。 该屏幕还显示缩放残差大于用户指定值的样品(图14中的3)。默认值是3.0。残差可通过选择上表中相应的选项显示为“日期物种”或“物种日期”。当在左边的列表中选择了一个物种(图14,1),右边的表(图14,3)自动滚动到该物种。 观察/预测散点图 观察(输入数据)值和预测(模拟)值之间的比较是非常有用的,以确定该模型能很好地适合每个品种。观察值和预测值之间没有强相关性的物种应该由用户进行评估,以确定它们是否应当向下降低权重或排除出模型 在观测/预测松散点图屏幕的表显示每个物种相应的基础运行统计(图15,1)。 模型适合度。统计数这些数字是用观察和预测的浓度进行计算来表示每个物种与 2据显示相关系数(R),截距,截距SE(标准误差),斜率,斜率SE,SE和普通残差(正常残差)的系数。该表还显示残差是否是正态分布的,如通过柯尔莫哥洛夫 - 斯米尔诺夫检验。如果测试结果表明残差不是正态分布的,用户应目视检查直方图外围残差。如果不是所有的统计数据都是可见的,用户可以在表的底部和侧面使用滚动条以显示更多的数据。这些统计数据中还提供在*诊断输出文件。观测/预测散点图(图15中2)示出了对于选定的物种的观察到的(x轴)和预测的(y轴)的浓度。提供一个蓝色的一对一的线以供参考(一个完美的结合会完全一致的在这条线上),和回归线显示为红色虚线。该屏幕(图15)状态栏上显示日期,x值,y值和预测和观察数据之间的回归方程,当滑动鼠标在数据点(图15,3)。 观察/预测时间序列 该观测/预测散点图屏幕上显示的数据与OB/预测时间序列界面(图16)的数据是相同的。当一个物种由用户选择,种类所观察到的(用户输入)的数据显示为蓝色和预测的(模型)的数据被显示为红色。用户可以查看此屏幕来确定何时模型很好拟合观测数据。如果一个物种的峰值不是由模型产生的,他可能建议排除该物种或改变物种类别至薄弱。该屏幕上状态栏显示时间,样品观察和预测的 浓度最接近的黑色垂直点的参考线。 配置文件/贡献 通过PMF解决的因子都显示在配置文件/贡献屏幕。每个因子显示两个图,一个显示因子文件和另一个显示每个因子对每个样本的贡献(图17)。 该因子图,在上面显示出来(图17,1),显示分配到因子的各物质的浓度,为淡蓝色的条纹和红色框中的分摊到每个因子的每个物种的百分比。浓度栏对应左边的y轴,这是一个对数标度。物种的百分比对应于右边的y轴。底部图显示了各因素对总质量的贡献(图17中的2)。此图是正态化的,使得所有贡献对每 。在此屏幕上的状态栏(图17中的红色框)显示数据个因子的贡献平均值为1 点的日期和贡献,当滑动鼠标在因子贡献图上 配置文件/贡献屏幕的底部的下拉菜单使用户可以轻松地比较运行和因子。在左下角开始,每次运行时可通过切换并点击相应的运行数量来选择。用户可以快速比较运行以评估该解决方案的稳定性或确定什么,如果有的话,单个物种或因子在不同的运行之间是变化的。用户可以在PMF产生的因子中间切换,通过使用从左侧的下拉菜单中的左数第二个。因子1是当前选定的。用户可以创建一个因子或时间序列的叠放图通过首先选择因子分布图或因子浓度图解,右键单击查看菜单,选择“叠放图。“ 如果一个总变量被选择,用户可以选择配置文件/贡献屏幕左下角的“浓度单位”, 以同一个单位显示浓度对总质量的贡献(图18)。如果此选项选择,GUI乘以在那个因子中的总变量质量的贡献。状态栏显示日期,因子贡献,入选总变量,该物种的因子,当滑动鼠标在要素贡献图上(图18中的红色框)。如果没有总变质量被分摊到该因子中,图形不显示,GUI显示“总变量质量为0对此运行/因子。” 用户可以在配置文件贡献/屏幕上给一个因子命名,右键点击鼠标查看菜单,选择“因子的名称”键入一个唯一的名称,然后按“Apply(应用)因子名称。”新的因子名称将出现在指纹因子,G-空间叠加,要素贡献,诊断画面。因子1具有高浓度的硫酸盐和铵离子,它代表煤电厂的燃烧二次硫酸盐的形成。从PMF因素识别,需要检讨衡量物种的关系。一些源也很容易识别;工业源,例如,可以通过在锌浓度的峰占主导地位。其它来源可能更加难以识别。 该物种Q /预期(Q / Qexp)可以通过配置文件/贡献选项卡(图19)上选择“Q / Qexp”切换显示。Q预期等于(X中非弱数据值的数目) - (数字中,G和F的元素数目加在一起)。例如,五个因子,642的样品,和19个强的物种,这等于(642* 19) - ((5 *642)+(5 *19)),或8893。.对于每个物种,一个物种的Q/ Qexp是物种经缩放的残差的平方和除以所有Qexp除以强物种数。对于每个样品,Q / Qexp是所有物种经缩放的残差的平方和,除以物种的数量。检查Q / Qexp图是了解PMF解决方案的残差的有效途径,特别是,什么样本和/或物种并没有得到很好建模(即,具有大于2的值)。种类的结果的比较表明,EC和OC具有高的Q / Qexp值,这可能表示机动车贡献可以通过加入其它来源得到更好的解释(图19中的1)。此外, Q/ Qexp值的时间序列示出了两天的物种的浓度与其他天相比适合的不怎么好,(图19,2)。这几天可能有特别的来源影响, 应进一步调查。 因子指纹 每一个物种对每个因子的贡献(百分比)在因子指纹屏幕显示为堆积条形图(图20)。此图可用于确认因子名称和确定个体物种的因素分布。该图仅显示当前选定的运行。要改变运行时,用户可以选择不同的运行次数在残差分析,观测/预测散点图,观测/预测时间序列,或配置文件/屏幕底部左侧角落。 G - 空间图 G-空间图画面(图21)显示一个因子与另一个因子的散点图,它可以用来评估旋转歧义以及源的贡献之间的关系。一个更稳定的解决方案,将有许多样品在两个轴上的贡献为零,它提供了以更少的旋转歧义更大的稳定性的PMF的解决方案。一个解决方案或源组合也可能没有点在轴上或附近,这导致较大的旋转歧义。用户在屏幕的左边菜单里选择一个因素为y轴一个因素为x轴。这些因子的散点图将在右边屏幕显示。图21中的图是一个因子非最优旋转的一个例子,它具有一个上部边缘,不与G-空间图中的轴对齐(加入红色线供参考)。在EPA PMF中,用户可以探索不同的旋转通过 选项(Paatero等人,2005),其详细解释在第6.1节。G空间图,也有用对因子源贡献之间关系的理解,图21显示区域的二次硫酸盐和当地钢铁生产之间没有关系。 因子贡献 因子贡献屏幕(图22)示出了两个图。上面图是饼状图,显示各物种在通过PMF解决的因子之间的分布(图22,1)。感兴趣的物种在屏幕左边的表中被选择,该物种的分类也显示以供参考。如果用户选择浓缩/不确定度屏幕下方的一个总变量,该变量在表中粗体显示。所选物种的饼状图在画面的右侧。如果用户已经指定了一个总的变量,该变量在整个因子的分布将是特别重要的。用户也可能希望检查关键的源示踪剂物种的跨因素的分布。底部图显示所有的因子对样品的总质量的贡献(图22中的2)。带点橙色线表示每年的1月1日。该图是正态化的,使得各个因子的加起来的所有贡献的平均值为1,以允许源贡献的时间模式的比较 诊断 诊断屏幕上显示两个输出,也保存在输出目录:*诊断和*_run比较文件。 输出文件 基本运行完成后,在GUI创建包含所有用于在屏幕上显示结果的数据的输出文件。创建的输出文件的数量取决于所选的输出文件的类型:制表符分隔(*。TXT),并用逗号分隔(*。CSV)创建五个输出文件 - * _诊断,*_contrib,*_profile,*_resid和*_runcomparison。Excel工作簿(* .xls)创建两个输出文件 - *_diag和*_base。输出文件被保存到数据文件中屏幕“输出文件夹”对话框中指定的目录中,使用“输出文件前缀”框中指定的前缀。 *诊断包含了用户输入和模型诊断信息(等同于诊断画面)的记录 贡献率-包含用于生成配置文件/贡献选项卡上贡献图的各基础运行的贡献。贡献是由运行次数排序. 首先显示正态化的贡献,接着是以质量单位表示的贡献如果指定了总变量的话。 文件,包含了每次用于在因子/贡献表中产生因子图的基础运行的文件。配置文件由运行次数进行排序,以质量单位的配置文件将首先写入,随后物种的百分比和物种的浓度百分数的配置文件,如果指定了总质量的变量。 残差-包含每个基础运行的残差(常规和不确定度缩放),用于产生残差分析屏 幕上的图表。 运行比较--包含了所有的PMF运行的各因素的物种贡献的总结和比较最低的Q(稳健)运行 *_base--包含*_contrib,*_profile,*_resid和**_run_comparison在同一个Excel工作簿单独的工作表。该输出文件只有当用户选择“Excel工作簿”作为输出文件类型出现。 5.6.4在基本模型运行画面上的因子名称 因子名称,可以在配置文件/贡献屏幕或基本运行画面上输入或修改。基本运行完成后,位于基本模型的左下部运行画面的“因子名称”框将被填充(图23,红色方框)。矩阵中的每一行都将用运行数来标记,以升序排列,每列由因子数来标记,以升序排列。然后填入该表与每个列标题相关的因素名字。 因子名称用于指示具体解决方案在用于评估模型结果的工具中。用户可以输入自己的因素名称,这将取代默认的在因子名称表中,并保存在配置文件中。用户可以为所有的基本运行设置一个唯一的名字通过在一个单元格输入名称,然后按“应用到所有运行”按钮,更新配置和贡献文件名里的因子名称按“更新Diag(诊断)文件”的按钮;或按重新加载预设系数的名字进入因子名称表“重置为默认值”。 应当指出的是,如果用户加载现有配置文件用用户定义的因子的名称,并用随机种子启动基本模型运行,运行解决方案中因子顺序可能改变。在这种情况下,GUI将生成一个弹出警告,提醒用户以确认先前的因子名称是合适的。 在PMF中可用的误差估计方法简短的描述连同例子因子浓度(蓝色)和三种方法误差上限如图24所示。对于BS上的错误估计上限锌来源是最低的和DISP和BS-DISP的估计增加。随机误差估计用BS法在本节中描述。此外,在因子解析解决方案文献中估计不确定度的方法(Paatero等,2014年)提供了PMF误差估计方法的一个详细说明。 5.7基本模型替代误差估计 该DISP明确探讨了PMF的解决方案的旋转歧义,通过评估源配置文件值的最大范围,而不明显增加Q值。DISP误差估计可以在不运行BS下运行,也可以BS与BS-DISP之后运行(分别在第5.8和5.9,讨论)。对于由用户选择的解决方案,在该因子信息的每个值是第一个上下调节,然后所有其它值被计算以实现相关联的PMF(收敛于一个Q最小值)。很重要的要注意新计算的最小Q值 (修改)可能与未调整的解决方案(碱)相关联的Q值不同。在因子信息的值的调整(向上和向下)总是允许的最大,随着该差的约束(DQ=基 - 修饰的),因为这种调整是不超过最大dQmax(DQD Q最大)。该模型产生的结果为下面为dQMax值:4,8,15,和25。对于每个Q最大值,总结了在各因子中每个元素的DISP执行和间隔(最小和最大的源信息的值)信息。例如,如果有20种是在一个数据集和一个7因子模型已被嵌合,则DISP方法将估计20×7 =140的间隔为每个dQMax最大值 模拟表明dQ的值4和8提供了最小的误差范围,以及范围外最少数目的基底因子值。 EPA PMF为所有的dQmax提供结果,但图仅显示了4 dQmax,因为这应该为几乎所有的数据集提供强大的间隔。 DISP间隔时间可以计算为基础的模型解决方案和添加了约束的基本模型解决方案。按“运行”按钮,在基本模型替代方法框中开始DISP。 该DISP输出示于图25中,随着指导有关解释输出。当DISP方法完成,两个输出文件(*_DISPest.dat和* _ DISP.text)都保存在数据文件屏幕中的输出文件夹中指定的目录中。该.DAT文件是在一个简洁的格式对软件最有用,但不打算供用户查看;在这个文件中没有标签,只有数字。该txt文件是关于模型嵌合和DISP间隔结果的非常大的文本文件。 四个文件是从DISP输出,一个用于每个dQmax,用户提供的输出文件前缀被放置在文件名的开始和显示在用户指南中以星号(*)(dQmax=4,8,16,32;*_DISPres1,*_DISPres2,*_DISPres3,*_DISPres4)。在每个文件中,存在着一个两个数的行,接着四行数据。在第一行中,第一个值是错误代码:0表示没有错误; 6或9表示运行被中止。如果该第一值是非零,则DISP分析结果被认为是无效的。第二个值是观察到的Q DISP过程中最大的下降。 第一行下面是包含为每个dQmax水平(行)交换计数因子(列)的四线表。第一行是dQmax=4,第二行dQmax= 8,第三行dQmax= 15和第四行dQmax= 25。交换计数是PMF解决方案稳定性的重要指标,在dQmax= 4的交换,或表中第一行显示该解决方案不应该被解释。 如果最小的dQmax发生了因子互换,则表明有显著旋转歧义和该解决方案不足够坚固以被使用。如果Q值的减小大于1,,则可能的是,没有DISP的结果应该发表除非DISP分析是找到Q的真实全局最小后重做,为了提高解决方案,该的因素数量可以减少,边缘物种可以被排除在外,或在时间序列图中的异常事件可以被排除在外。 在*_DISPresX数据文件的这些诊断下面是四个数据块,其中每列是一个因子, )在信息矩阵的上界,在浓度单位; (2)信息矩阵的下限,每行是一个物种:(1 在浓度单位;(3)在信息矩阵的上界,以,物质单位; (4)该信息矩阵的下界,在,物种。该DISPPres文件直接从ME输出,给想要处理输出的用户。该dQmax为4的DISP结果归纳在一个易于使用的文件:*_ErrorEstimationSummary。 5.8基本模型BS误差估计 BS被用来检测和估计对解决方案一小部分观测不成比例的影响,以及在较小程度上,旋转变模糊的影响。BS数据集是通过从原始数据集进行随机采样的观测块构成。该块的长度取决于数据集和被选择为使得每个BS的数据集将保留潜在的的序列相关性,这个相关性可能存在于基础的数据集中。观测块被随机选择,直到BS数据集与原始输入数据是相同的尺寸。 若干BS的数据集(例如,100),然后用PMF处理,并且对于每个BS运行,BS 因子与基础运行的因子进行比较使用下列方法:BS因子被映射到与该BS因子贡献具有最高相关性(高于用户指定的一个阈值)的基本因子。如果对于一个 给定的BS因子,没有基础的因子关联值高于这个阈值,该因子被认为是“未映射”。重复这一过程,像用户指定的BS运行那样多次。可能存在当从同一运行多个BS的因素可以被映射到相同的基本因子的实例。 EPA PMF然后总结所有的引导运行(bootstrapping runs).用户应当检查BS的结果以决定假如基本运行(BS run)(蓝色方块)在四分位数间距(盒)周围的轮廓之内。元素的基本运行值在四分位间距之外的结果应当被小心的解释,因为观察的一个小的组观察可能影响基本运行结果或者因子中的物种浓度可能是无关紧要。BS因子对基础因子的映射理想的是一对一。那就是说,来自于BS因子的每一个因子应该和一个唯一正确的一个基础因子对应。然而,很可能是几个重要观察的存在(或不存在)能极大地影响BS因子轮廓。 在这种情况下,受影响的BS因子可能接近与一个特定基础因子符合在大多数情况下,其他情况下,会和其他因子符合。另外,在基础模型中(BASE model)太多因子的规范也可能创造出一个虚拟因素。任何因子接近80%或者来自BS run的映射更少应当有主要贡献物种在调查轮廓当中,以及对基础模型结果更进一步的评估应该被做用BS-DISP and DISP错误估计的方法。 启动BS run BS捕获与随机误差相关的错误,它在BS模型标签框里触发,在Base Model Runs屏幕上(Figure 26, red box)。 对于base runs,用户必须作出多项选择在触发它之前。 Base Run – the base run用来映射每一次BS运行。base 运行在最低的Q(robust)条件下自动提供,用户可选择另一个运行数。 Block Size – 块大小,样品数将在每一步重采样的过程中被选择 例如,一个3的块大小意味着每一个BS块将包括来自输入数据集的三个样(例如,样8-10可以是一个块). 他默认的块大小的计算根据Politis and White (2003)写到的,但可以被用户重新选择。如果这个默认值被重新选择,用户可以按“Suggest”按钮保存这个默认值。 Number of Bootstraps – BS的运行被进行的次数。他要求100次BS运行以确保统计信息的正确性、稳健性。 对于初步分析,50次BS运行被进行以快速计算解决方案的稳定性。最少也要求20次BS运行。 最低相关性R值 - 最小Pearson相关系数将被使用在一个BS运行因子对一个基础运行因子的分配中,默认值是0.6。如果大量的因子未映射,用户可能想要调查降低R值的影响。这种变化应在最终解决方案中报告。 所有的输入参数设定后,BS运行就可以通过按“Run”按钮在Base ModelBootstrap框里。对于base runs,用户可以中断运行通过按“Stop”按钮。假如运行中断的话,没有输出将被保存或者覆盖。 5.8.1 Summary of BS Runs(BS运行总结) 一个BS运行总结呈现在(Figure 27),它仅当BS运行完出现。 前8行包含了用于bootstrapping的所有的输入参数与用户在输入屏幕上设定的一样。总结屏幕也包含了几个表总结BS运行结果。第一张表是一个矩阵包含多少BS因子与每个基础因子挈合。下一张表显示了这些值minimum, maximum, thmedian, and 25 and 75 th percentiles of the Q(robust)。总结的其他部分是每一个因子轮廓的变化性,也给出了 the mean, standard deviation, 5thpercentile, 25thpercentile, median, 75thpercentile, and 95thpercentile,这些值使用公式(5-2)。 每一个轮廓的基础运行包括在第一列作参考,作为一列显示如果运行轮廓在BS run profiles四分位间距内。 EPA PMF也计算与BS运行有关的离散差异百分比(DDP),并在Base Bootstrap Summary screen屏幕上报道这些值。这种方法估计围绕基地运行配置文件的第90和95个百分点的置信区间(CI),报道为百分比。DDP的计算通过在每个轮 廓的每个物种的BS运行与基础运行之间的绝对差值的第90和95百分位,作为基础运行值的百分比表达它。如果DDP百分数大于999,“+”显示在屏幕上。初始值保存在输出文件(*_diag and *_boot).如果一个物种的基础运行base run值是0,就不能计算DDP;在这些情况下,(*)显示。DDP值被用来报道BS错误估计。 对于这个例子,基础和引导因子是符合的,除了三次运行的三个因子被映射到因子7。尘土(因子4)和机动车(因子7)包含地壳元素和钢铁源也被映射到3个其他源,这可能是因为BS没有创造一个数据集包含所有的样受到高的钢铁产量影响。总的映射因子的数目可能没有加到BS运行的数目,如果boot factor运行没有收敛,因子的映射超过80%表明BS不确定度可以被解释,因子数目也是合适的。 5.8.2 Base Bootstrap 箱图 BS运行的变化性显示在Base Bootstrap Box Plots screen (Figure 28). 每个物种的百分比变化(Figure 28, 1)和每个物种的浓度变化(Figure 两张图存在: 28, 2),与在Base Bootstrap Summary screen中因子轮廓表中的变化相对应。 th在两张箱图中,box (Figure 29)显示了BS运行的四分位间距(25th–75 percentile)。水平绿线代表了BS运行的中位值,红线代表了四分位间距外的值。基础运行显示为一个绿色箱子图作为参考。四分位间距之外的值用红线表示。 在屏幕的底部,基础运行数目显示出来,不能选择;然而,对于bootstrapping的基础运行用黄线表示。用户可以选择他们想看的因子,通过单击因子数目在屏幕底部。物种浓度的变化显示在底部箱图中。四分位间距外的the base run profile value (blue box)的物种应被解释仅当评估了两个额外的错误估计结果在PMF。这些物种影响了BS观察值基于base or BS runs,the DISP and BS-DISP将提供更可靠的错误估计。 5.9 基础模型的 BS-DISP 错误估计 BS-DISP估计了与随机和旋转歧义有关的错误,它运行从the Base Model Runs screen的错误估计部分。BS-DISP可能花费好多个小时去运行,由于被评估的组合的数量。因此他要求用户第一次评估BS-DISP 结果少于100次运行(建议50次);对于最终的BS-DISP 结果,使用100次BS运行。 BS-DISP是BS和DISP方法的组合。BS错误估计必须先于BS-DISP运行,因为每次BS重新取样经历一个DISP分析因此误差限对所有的F (profile)因子元素 factor elements。这个过程可能如下:每一次DISP定义了旋转无障碍空间的跨度。每一次BS重取样移动这个空间,随及在不同方向。两者合计,旋转空间的所有复制,在随机的位置,代表了随即不确定性和旋转不确定性。 通过代替一个因子元素得到的限制包括旋转歧义和由于输入数据的不确定性引起的变化。为了加快BS-DISP的运算,建议所有F因子的元素只有一小部分被调整。向下加权变量创建了DISP计算的一个特殊的问题。如果这个变化被调整,错误间距将会非常大(基于模拟数据评估)。向下加权物种的错误估计从调整non-downweighted species的结果中得到最好评估 BS-DISP提供了与替代有关的Q值的变化。偶尔,也可看到替代引起Q值的显著降低,通常是10到数百个单位。如果这个降低出现在DISP or BS-DISP中,他就意味着the base case解决方案实际上不是最低,尽管他被假设成那样。与Q显著改变有关的值也被评估,但初始指导是Q改变大于1%被认为是显著的,如果Q改变大于0.5%,建议增加Base Model runs的数目到40以发现一个全局最小。 来自DISP和 BS-DISP分析的一个重要输出是要素交换的程度,通常从“未明确定义”的解决方案产生的(例如:一个解决方案,其中的因子身份为流动的)。BS-DISP输出的一个样本显示在Figure 30, 伴随着解释。从最合理的解决方案开始,因此能够逐步改变该解决方案,在不显著增加Q值得情况下,因此因子身份在改变。在极端的情况下,因子可能改变很多以至于他们交换身份。这称作因子交换。从物理角度来看,有因子交换的解决方案代表了相同的物理模型相对于原解决方案。然而,因子交换的存在,意味着所有的中间解决方案也存在并且必须被视为替代解决方案。 对于一个高的dQmax,通常可以得到很大的不确定性区间或CI。该区间越大,它包含的不确定真值的机会越大。CI伴随着配置文件值显示在the BS-DISP箱图选项卡.dQmax值也被评估,DISP的dQmax为4,BS-DISP的值为0.5,为真正的不确定性估算提供下界.如果输入数据的不确定性是合理的。小的dQmax值使用在BS-DISP对DISP比较中,因为bootstrapping and DISP的组合应捕获解决方案的几乎所有的不确定性。所有的dQmax值应该被评估以确定这个解决方案是否能很好地被定义。 来自BS-DISP 总结表的样本结果如图30所示在使用了来自各源的关键物种(硫酸盐,钾离子,总的硝酸盐,硅,锌,铁,和EC)。 在图30的BS-DISP 结果显示这个解决方案没有明显的旋转歧义,基础模型和错误估计可以被解释。没有交换,dQmax提供信息:解决方案被很好的约束和BBS-DISP结果可报告。 果因子互换在dQmax = 0.5产生,解决方案中的因子数目和BS and DISP如 结果应该被评估在报道BS-DISP结果之前。因为BS-DISP是BS and DISP的组合,建议各成分的结果应该被评估以理解什么可能引起交换。降低交换数目的步骤包括降低因子数和增加限制。 4个文件被输出来自BS-DISP,一个用于dQmax;用户提供的输出文件前缀放置在文件名的开始,并作为(*)标示在用户指导里,(dQmax=0.5, 1, 2, 4; * _BSDISPres1, *_BSDISPres2, * _BSDISPres3, *_BSDISPres4)。这些包含相同的诊断总结提供在BS-DISP总结表里。在诊断第一行的第5个值,显示。 1.k. 该文件中的个案数目。这包括全数据的个案情况下和接受的(不拒绝)重新采样。如果所有的bootstrap个案被接受,这个值将等于1加bootstraps的数目(额外的一次运行是初始化运行)。如果没有个案被排除,k应该等于bootstraps的数目乘以因子数目乘以BS-DISP选定的物种数。 2. Q的最大减小值。一个大的值不用着急,但它表明至少有一个重新采样,其中有一个更深的最小值出现。Q的减小的一个大的值接近Q(robust)的1%或更多。需要更多的测试提供更好的指导对此值。 3.Q下跌的案例数。 4.最适合的带有交换的个案数 5. DISP中带有交换的个案数 BS-DISP诊断总结的第一行下面是一个四线表,包括每个dQmax水平的因子(列)交换计数,以升序排列(dQmax=0.5, 1, 2, 4)。在最好的情况下,所有的交换为0,然而,创建一个BS数据集导致一个交换的可能性是基于数据的特点,BS运行的数目,因子数目。配置文件和DISP结果应被评估以决定是否有原因引起交换。在两个因子间带有交换的一个结果比多个因子间有交换的一个结果更可靠。例如,交换出现在土壤(因子4)和钢铁源(因子6),两者具有许多共同的元素。而且,交换的数目是一对两个因子来说,这表明有一些旋转歧义存在于因子间。 来自BS-DISP的文件包含许多数据块在图30包含的诊断后面。前两个数据块是初始运行数据,每行代表一个物种和每列代表一个因子。每个块的最后一行始终是一系列“1”作为占位符。每一次BS重取样包含四个数据块。(1)BS重取样,1的简介矩阵在置换下来后,以浓度单位。(2)BS重新取样,1简介矩阵在取代了后,以浓度单位(3)BS重新取样,1的简介矩阵在置换下来后,以,物种(4) BS重采样,1的轮廓矩阵在取代了之后,以,物种。这四个数据块在每个BS重采样之后重复。BS-DISP文件直接从ME输出,给想要处理输出的用户。dQmax为0.5的BS-DISP 结果总结在一个易于使用的的文件中:*_Base Error Estimation Summary。5.10解释误差估计结果 一套全面的错误估计可用,结果被加到总结文件中以便于使用在运行了每次错误估计方法以后 (*_BaseErrorEstimationSummary,*_FpeakErrorEstimationSummary,*_ConstrainedErrorE stimationSummary) 总结文件包含了物种和诊断也包括了通过因子浓度进行的错误估计,物种和的百分数,总变量的百分数加假如一个变量被选择。 错误估计信息总结在*_BaseErrorEstimationSummary文件中和接下来的图中在每个错误估计方法运行之后。*_BaseErrorEstimationSummary 文件有一个关于因子错误估计的有用的总结:Base Value, BS 5th, BS Median, BS 95th, BS-DISP 5th , BS-DISP Average, BS-DISP 95th, DISP Min, DISP Average, and DISP Max。图31显示了这3种错误估计的错误估计总结图。 6旋转工具 一般来说,非负限制不足以产生一个唯一的结果。一个不限数量的合理的解决方案可能产生并且不能使用数学算法简单地取消资格。旋转一个给定的解决方案并且评估旋转结果填充解决空间填充的怎样是一个减少解决方案的方法。额外的信息如知道源的贡献和/或源的组成对于减少解决方案的数目也是有用的,并且可以决定一个解决方案是否比其他解决方案更有现实的物理意义。 在数学上,一对因子矩阵(G and F)能被转换成为另外一对因子矩阵(G* and F*),在相同的Q值的情况下,被说成是旋转。这个转换发生像公式6-1描述的那样: T矩阵是一个p x p,非奇异矩阵。P代表因子数。在PMF中,这不是一个直接的旋转,而是G和F矩阵的一个线性变换。由于PMF中这个非负的限制,一个纯粹的旋转(i.e., a specific T-matrix) 是唯一可能的,如果新矩阵中没有元素是小于零的。如果没有旋转是可能的,这个解决方案就是唯一的。因此,近似的旋转,允许增加一些Q值,并防止解决方案中的任何元素成为负值,在PMF中是有用的。 对于一些解方案,非负的限制足以确保一个解决方案有一个很小的旋转歧义。 如果存在足够数量的零值在一个解决方案的因子 (F-matrix)和贡献(G-matrix)中,该解决方案将不会从“真正的”解决方案转动离开。然而,在许多情况下,一个非负的限制不足以防止旋转远离“真正”的解决方案。为了帮助确定一个最优的解决方案是否被建立,用户应当检查G-space 图对选定的因子对在原始解决方案中。当前的指导是选择一个区域源类型例如燃煤电厂(硫)并绘制它针对当地的工业源,如钢铁生产(铁)。 6.1 Fpeak模型运行规范 评估了基本运行BS的错误估计之后,旋转应该被利用。Fpeak运行被启动通过选择“Rotational Tools,” “Fpeak Rotation & Notes,” and “Fpeak Model Runs.” 以最低的Q(robust)的基础运行被程序自动选择,作为FPEAK运行的运行;这可以被用户覆盖在“Selected Base Run”对话框中。用户可以执行多达五个FPEAK运行通过检查框的适当数量并且进入每个峰值运行所需的强度。尽管对能够进入作为峰值强度的值没有限制(under “Selected Fpeak Runs"),在-5和5之间的一般值应当首先被利用。正峰值削减了F-矩阵,并涂抹了G-矩阵; 负峰值涂抹F-矩阵,增强了G-矩阵。更多关于正和负峰值的详细信息可以在Paatero (2000)中找到。在ME-2的峰强度不同于那些在PMF2中的;大约五倍PMF2值的值需要产生类似的结果在ME-2中。另外,峰值为0是不允许的;EPA PMF将给用户一个错误信息,如果输入0,在任何FPEAK强度框。 Fpeak运行开始当用户按下“Run”按钮在Fpeak Model Runs screen。Base run and BS run results将不会丢失当Fpeak运行时。Fpeak runs完成后,Fpeak results的总结,与Base Model Run Summary表中包含相同的信息显示在Fpeak Model Run Summary 表中(Figure 32, red box).。 额外的结果显示:Fpeak Profiles/Contributions, Fpeak Factor Fingerprints, Fpeak G-Space Plot, Fpeak Factor Contributions, and Fpeak Diagnostics;这些结果应当被用作一个参考当评估Fpeak运行时。FPEAK对于检 查可能的旋转跨度非常有用,得到一个最终结果在贡献或者因子文件中更多的值处于或接近0。 根据一个正或负的FPEAK是否在使用。从而DISP和BS-DISP带有FPEAK迫使将缩短EE间隔,可能导解决方案的不正确的解释。 6.1.1Fpeak结果 Fpeak因子/贡献屏幕显示了Fpeak运行的因子和贡献图(by Fpeak strength value and factor)以及为选定的基础运行。在因子图中中,物种的浓度(左边的 y轴)是一个绿色的条框,物种的百分数(右边的百分数)是一个橙色的条框。为了比较,原始基础运行结果也显示在轮廓图中。物种的质量(左边的Y轴) 是一个浅灰色的条,物种的百分数(右边的Y轴)是一个暗灰色的框。贡献图 代表了因子贡献的时间序列。基本模型结果的因子贡献也显示(灰线)。Fpeak值以同样的顺序像进入FPEAK模型运行屏幕的顺序那样;在这些图中,用户应 该寻找偏差(i.e., increases or decreases in a particular species in a factor)在FPEAK值 中,以及带有相应的基本运行结果。用户可以选择一个FPEAK值和因子数目通过点击想要的数目在屏幕的底部。在FPEAK文件/贡献屏幕的状态栏(Figure 33, red box)显示数据点的日期和贡献在贡献图最接近鼠标的位置上。状态栏显示日期、浓度、选择的总变量和物种因子,当他们的鼠标停留在因子贡献图上时。如果没有总变量的质量被分配到该因子,该图不显示,指导相应的显示为“总变量质量为0对于这次运行/因子。 Fpeak因子指纹 Fpeak因子指纹屏幕每个物种对每个因子贡献的浓度(以百分数表示)作为一个堆积柱形图(Figure 34). 此图可用于验证唯一的因子的名称和确定因子的分布为单个物种。用户应当找到偏差(i.e., increases or decreases in a particular species in a factor)在Fpeak值和相应的基本运行结果中间。用户可以选择Fpeak值通过在屏幕底部点击想要的数目。 Fpeak G-空间图 像在Base模型结果屏幕中的那样,Fpeak G-空间图屏幕显示了多种因子的散点图。用户指定一个因子到y轴和x轴通过选择想要的因子从屏幕左侧的列表中(Figure 35, 1)。峰值显示,the base run G-space plot (“Show Base”), and the delta in G-space plots between the base run and an Fpeak run (“Show Delta”)在屏幕的底部被选择(Figure 35, 2).。当一个Fpeak值被选择在Fpeak文件/贡献屏幕或者Fpeak G-空间图屏幕,它自动选择在其他屏幕。用户也可以选择一个点在任何Fpeak G空间图屏幕通过点击那个点。被选择的点将会变成橙色,日期和x-y值将会被储存在*_Fpeak_diag文件中。这个特点帮助用户识别和跟踪旋转。例如,假如一个G-空间图出现了旋转,用户可以标记这个边缘点。使用信息例如气象条件或排放信息,用户可以决定这些边缘点是否预期将有低的贡献来自源的。 Fpeak因子贡献 Fpeak因子贡献屏幕(Figure 36)显示了两张图。顶部图是一张饼状图,显示了每个物种的分布在由PMF解决的因子中(Figure 36, 1)。感兴趣的物种被选择从屏幕左侧的表中;那个物种的种类也显示作为参考。如果一个总变量被用户选择在浓度/不确定度屏幕,该变量将用粗体显示在表中。被选中的物种的饼状图将出现在屏幕的右侧。如果用户已经指定了一个总变量,这个变量在整个因子中的分布将会相当重要。用户可能会想要检查一个特定关键物种的分布,例如有毒物质在整个因子中。底部图显示了所有因子的贡献对样品总质量(Figure 36, 2)。黄色的虚线参考线表示每年的1月1日。该图是标准化的,使得每个因子所有的贡献的平均值为1。 Fpeak诊断 Fpeak诊断屏幕总结了Fpeak输入参数和输出作为参考。(e.g., Fpeak run summary, factor profiles and contributions, and samples that are marked on the Fpeak G-space plot)。屏幕上的所有信息保存在*_Fpeak。 6.1.2评估Fpeak结果 Fpeak运行应被用户视为探索所选择的解决方案全部空间的一种方法。解决方案的几个空间应该被评估以理解Fpeak怎样改变PMF解决方案。用户应该首先检查Fpeak运行(available in the Fpeak Model Run Summary on the Fpeak Rotation & Notes Fpeak Model Runs screen)的Q值,评估他们的增加从基本运行Q值来讲。在一个纯粹的旋转中,Q值将不会改变因为旋转仅仅是原始解决方案的线 性变换。然而,因为PMF的非负限制,纯粹的旋转通常不可能,由Fpeak引发的旋转是近 似的旋转,这将会改变Q值。一般来说,由于Fpeak旋转引起的Q值的增加在dQ小于5%基本运行Q值的情况下是可以接受的。相应的Fpeak解决方案因子的G空间图应该被检查 以查看该点是否移向了轴线或者降低/零贡献(Figure 37)。此外,轮廓和贡献应当被检查以 决定旋转的影响。 6.2约束模型运行 源组成和贡献知识可被用于限制模型运行。例如如果一个源已知在一段时间不活动,应该没有贡献来自代表那个源的那个因子在不活动时期。贡献可以设定为0或者下拉到0,Q的惩处被提供从最优解移动到一个依据外部知识得到的解。另外一个例子是从附近工厂的一个来源文件已被量化,用户可以限制轮廓文件在一个代表这个工厂类型的因子中来匹配所测量的轮廓。Q允许的约束的量取决于所述数据集;然而, 5,Q(稳健)值是当前要求的最大值。PMF自动计算Q的量与百分数相关的通过输入一个% dQ。限制的使用在其他地方详细讨论(Norris etal.,2009;Paatero et al., 2002; Paatero and Hopke, 2008; Rizzo and Scheff, 2007).。 6.2.1约束模型运行规范 约束模型运行屏幕用于规范约束与多种类型先前的信息有关的包括:a.使用表达式生成器生成限制b.从基本模型结果和约束表中指定约束点.开始一个选定的基础运行,两种类型的限制可以被运行:(1)“硬拉着”这是施加不考虑Q值的变化(例如一个特定的因子元素在轮廓或贡献矩阵中设置为0,给定一个下限和上限,或固定到它原始的值)或(2)“软拉动”,Q值有一个允许的改变限制(例 如一个元素或元素的表达被最大限度拉起,最大限度拉下,或者拉至目标值)。 表达式生成器有三个单选按钮用户可以选择来定义限制例如恒定比例(Figure 38),质量平衡(Figure 39),或个性化表达(Figure 40)。 比率(Figure 38)-选择一个因子和两个不同的物种从列表中,输入比率在“值”文本框中。 质量平衡(Figure 39)-选择和增加一个或多个因子物种到文本框中在等号两边在“质量平衡”设置一个平衡等式。如果需要的话,一个数字可以被输入“系数”文本框,将被作为选定物种的一个系数,点击“清除”按钮消除当前平衡等式的设定。 自定义(Figure 40)- 通过创建一个自定义的公式指定约束。自定义公式可以基于文件(物种为元素)或贡献(样品为元素)。自定义方程必须遵循相同的结构像由表达式生成器生成的方程的那样。 对于表达式生成器的三个功能的每个功能,在用户定义了一个限制,按下“应用到表达”按钮,以一个标准形式相应的的公式将出现在表达表里(Figure 41, red box)。由于使用表达式生成器中定义的约束是“软拉动”, Q值变化的一个限制必须指定。一个默认值(% dQ = 0.5)提供在表达表里,如果需要的话,可以由用户更新。允许用户删除选定的限制或所有的限制通过按“移除选定表达”或“移除所有表达”按钮在表达表的底部。 源贡献可以被限制;用户可以识别点在三个图中: 像在6.1.2讨论的那样,PMF解决方案中的G-空间图被评估以寻找表明旋转歧义的边缘,并决定在解决方案中是否有旋转。如果用户在G-空间图中确定了一个边缘,约束可被指定沿边缘拉数据点朝向轴线(即,朝向零)。用户应该沿着边缘检查点;如果有任何先验信息,表明一个值应该为0(例如,一个因子代表的源在特定时间内不活动),则点应被拉出使用相关的约束。各拉力的力度被控制通过指定一个Q值变化限制。如果用户希望执行一个弱上拉, Q值变化的一个小的限制应该被允许。相反,如果用户希望执行一个强拉,一个大的对Q值的变化的限制应该被允许。拉强度应根据一关于污染源的先验信息表明对于给定的样品的贡献应该为零。用户可以选择尽可能多的点拉,在尽可能多的因素中,像他们希望的那样。 约束点在前面的三个图形中定义了之后,约束表会出现在旋转工具里,约束屏幕,显示出 每一行中的约束(图44,黄色的框)。然后,用户需要选择包含在下拉列表中的六个约束类 型之一(列“类型”): 下拉最大-一个因子元素最大限度地拉低给予Q值变化的一个限制;用户可以更新默认的dQ值。 上拉最大-一个因子元素最大限度地拉高给予Q值变化的一个限制;用户可以更新默认的dQ值。 拉到一个指定值-一个因素元素被拉到目标值以给定Q值(默认,dQ的=0.5)变化的一个限制;用户需要输入目标值到“值”列。 设置为0-一个因子元素被迫等于零,对Q值的变化没有限制。 设置为原始值-一个因子元素被固定到它的原始值,对Q值的变化没有限制。 定义限制-一个因子元素被赋予一个下限和上限;用户需要输入的“低/高”限在列的“值”里面。 应当指出,通过表达式生成器或“约束点”所限定的约束条件特异于一个选择的基站运行。如果用户输入另一个运行数目,像在模型运行限制里“选定的基础运行”,与以前的基础运行有关的所有约束运行将从表达式和约束表中删除。 所有的约束模型参数规范后,用户应该按下“运行”按钮在约束模型运行框来启动一个约束模型运行。一旦运行开始,在屏幕的右下角的“运行进展”框被激活和约束模型运行可以在任何时候通过按“停止”按钮终止。没有有关约束模式运行的信息将被保存或者显示当运行停 止。当约束模型运行完成后,汇总表显示dQ,Q(稳健),,dQ(稳健),Q(AUX),Q(真)以及运行是否收敛(图44,红色框)。五个新选项卡与约束模型运行结果将显示,包括约束文件/贡献,约束因子指纹,约束G-空间图,约束因子贡献,约束诊断。 ,dQ(可靠)的值需要评估根据在约束中使用的dQ的量。所述,dQ(鲁棒)显示了Q的增加由于约束(多个)。一个dQ的增加高达1,对所有的限制是可以接受的;然而,因子文件解释,贡献的时间序列和误差估计结果也是关键的。文件/贡献表提供了基础和限制因子文件以及基础和限制因子时间序列。评估所有因子的图以理解限制的影响并决定限制是否提供了一个更可解释的方案。 6.2.2限制文件/贡献结果 限制文件/贡献屏幕(图45)显示因子文件和贡献图以相同的格式与上述FPEAK文件/贡献屏幕。质量和物种百分数和因子贡献的时间序列都呈现,在约束模式运行和选定的基础运行中。用户应该查看在这两个模型运行结果中的偏差并检查约束的影响。 通常情况下,物种对因子的贡献分为两类:在(1)硬,他们不会显著改变或者如果它们被约束,不合理的文件将会创建; (2)弱,它们很容易地移动,并且通常不被PMF很好的建模。理解硬和弱的源的关键示踪物种允许优化解决方案使用测的信息或其他信息。弱品种应该很容易理解为移动源之间,而硬物种与因子强烈相关联,并应在它的源解释中使用。 限制因子指纹 约束因素指纹屏幕显示每个物种对每个因子的贡献浓度(百分比)以堆积条形图(图46)。此图可用于验证独特的因子名称和单个物种在因子中的分布。用户应该寻找偏差(即增加或减少在一个因子中的特定物种)与指定的约束(S)和相应的基础运行结果。 约束G-空间图 约束G-空间图(图47)给出了约束模式运行的因子贡献的散点图。类似于FPEAK G-空间图屏幕,用户可以选择“显示基础”,以显示基础运行G-空间图,并选择“显示三角”以显示约束模型运行和基础运行之间的G-空间图的区别。 限制因子贡献 限制因子贡献屏幕(图48)显示了两个图。顶图是一个饼状图,显示了各个物种在因子间的贡献由PMF解决的。感兴趣的物种被从屏幕左侧选择;那个物种的种类也显示作为参考,如果总变量被选择在浓度/不确定度屏幕,那个变量将被粗体显示在表中。选择的那个物种的饼状图将会出现在屏幕的右边,如果用户定义了一个总变量,这个变量在各个因子中的分布将会相当重要。底部图显示了所有因子对总质量的贡献通过样品(图48,2。黄色的虚参考线表示每年的1月1号。图是正态化的,每个因子的平均贡献是1。 限制BS运行和结果 一个限制模型运行可被影射像基础模型运行一样,在一个限制模型运行完成后,用户能启动一个BS运行对限制模型,在限制模型映射屏幕。限制映射结果显示在限制映射箱图和限制映射总结中以同样的形式像在基础映射运行输出屏幕中那样以便于比较。BS文件保存在*_Gcon_profile_boot。 6.2.3评估限制结果 限制可被用于减少旋转歧义,提炼一个解决方案,理解强和弱的因子物种。所有因子和源贡献时间序列必须被评估以理解限制的影响。此外,错误估计结果需要被评估,以决定限制是否显著的改变了物种因子贡献。限制的指导将会继续发展像PMF一样应用到更多的数据集。第8部分的悬链联系训练联系提供了更多的例子关于结果如何解释。 7检修 EPA PMF 5.0的常见问题包括有指导产生的错误信息以及以及用户应该采取的措施在表3 中,详细描述。 8训练演习 以下各节提供了三种数据类型的PMF分析的例子:(1)在降雨期间的多个位置收集水样;(2)密苏里州圣路易斯市的每小时气雾剂金属数据;(3)从光化测站(保诚)网站在巴吞鲁日,路易斯安那州挥发性有机化合物的数据。该数据集被安装在EPA PMF/数据文件夹和被作为例子提供进行分析。用户可以按照每个例子中的概述步骤,以便更好地了解PMF的过程和本用户指南中所述的各组件之间的交互作用。 所有实施例跟随在图50所示的 流程 快递问题件怎么处理流程河南自建厂房流程下载关于规范招聘需求审批流程制作流程表下载邮件下载流程设计 中,建议所有的PMF分析使用。对于某些用户来说,基本模型可能就足够了。然而,FPEAK可以用来优化方案和约束可用于掺入的源信息,如混合物或排放物上。评估误差估计是PMF分析的重要组成部分。 8.1密尔沃基水资料 这项工作的重点在用水Samples.xls提供的数据集。这次演习的目的是展示思维过程以及参与评估来自多个站点的小数据集情况下的步骤;它并不打算成为一个完整的源解析分析。PMF的输入参数总结在表4和所有位点,在分析中使用。 8.1.1数据集开发 Soonthornnonda和Christensen(2008年)进行了污染物的源解析,19.5英里(31.4公里)内联存储系统在密尔沃基合流下水道(污水+雨水)。深层隧道系统的示意图示于图51和更多的信息可以在找到。来自同一天从多个站点收集样本,在用水Samples.xls文件有三个标签:浓度(浓度),UNC(不确定度)和站点信息。本文引用还包括该网站选项卡上 无论是CMB,还是 PMF版本都是由Bzdusek等人开发的(2006)。被用于数据分析和用于PMF建模的数据被张贴在环境科学和技术网站1上,作为补充信息。此外,作者假定的数据矩阵中的元素的20,的相对误差。所有的物种,最初用在基本模型运行,3个因素,和20次运行。一个随机种子最初用于评估运行的可变性和下面的结果是基于12的种子数目。 8.1.2输入数据分析 使用浓度散点图对物种间的关系进行了评估。生物需氧量(BOD 5)与总悬浮固体(TSS)(图52)是不相关的,这表明它们具有不同的来源。此外,镉浓度仅在两个浓度层次上(图53),从而可能指示使用的物种的一个问题。 8.1.3基本模型运行 使用OBS/ PRED散点图评估基本模型的结果,因为数据是在同一天从多个站点收集的。除镉外,所有物种都具有线性关系,如图53,基于这些结果,镉被设定为“坏”,基本模型重新运行。 在图54所示的叠积图形,这表明结果类似于Bzdusek等人的(2006年a),通 过在文件/贡献屏幕选择顶部图,单击鼠标右键,并选择堆栈中图表。选择新窗口,用鼠标右键单击文件存储选项,或者使用“复制到剪贴板”粘贴图到文档中创建。 此数据集对于绘制带来了一些挑战,由于样品是下雨的同一天从多个站点收集。而不是在一个固定的时间表,抽样是基于事件的。时间序列曲线在位点之间具有水平线(图55)。图上的一个点选择之后,站点名称和采样时间的信息显示在底部的状态栏。用户需要评估在PMF分析中,数据相结合是否是有道理的。关键的受体建模假设是影响采样点的源的组合物在站点之间并没有变化。 来源贡献和观察与预测浓度的时间序列提供了有用的信息。源的贡献的时间序列在不同地点之间应显示变化,一个位点被影响,其他位点之间的影响可忽略可以指示该源的组合物是不均匀不统一的。观察与预测的图提供了最重要的信息,观察预测(剩余)之间的差异大的站点 最有可能是由更独特的源影响,并能从分析中删除。在这两种情况下,一个站点或贡献率或残差有显著差异的站点之间在保留它们在多个站点的PMF分析之前需要更详细地评估,密尔沃基水的数据的时间序列图,是用于证明合并的PMF多个站点(图55,图56),并鼓励用户使用数据文件画面中的复选框和综合分析,单独运行每个站点。 源影响的相对幅度在采样点间是变化的,但是,影响是可变的,多个站点都有高和低的源贡献。位点的结合看来是有道理的在站点之间的变化的基础上。观察与预测浓度的时间序列也有线在不同站点之间(图56)。时间序列显示,几个采样点的观测和预测的浓度较大,其他采样点的低。不同站点之间的数据具有大的差异应该更详细地进行评价以确定这个样本是否应当结合到PMF分析中。 在Q / Qexp图也应接受评估,因为它提供了一个附加的时间序列图在OBS/ PRED种类图。旋转工具中的时间序列图中的也显示了不同采样点之间的线。 8.1.4误差估计 该BS,DISP和BS-DISP结果表明解决方案的一些不稳定性,这是由于数据 集小,和要素数目的限制。错误的估计结果显示在图57中。 DISP结果(图57,1)显示,该解决方案是稳定的,因为没有交换存在。 BS结果(图57中,2)为金属源显示源被映射到生活污水和雨水源6和8次。这可能是由于PMF不适合这高度变化源和所述BS的数据集也可能没有捕获金属的可变性。 BBS-DISP结果(图57,3)突出该解决方案可能是不可靠的,由于在两个因素互换。互换的数目是低的,其结果可能反映了由许多采样点引入的变异性相对小的数据集。 要求所有的结果被报告和解释,并且该*_ErrorEstimationSummary文件应作为出版物的补充信息。错误的估计汇总图提供了错误估计的总结。为了便于分析,BS-DISP错误同时捕获随机误差和旋转歧义具有最大范围(图58)。 8.2圣路易斯Supersite PM2.5的数据集 这项工作的重点是在圣路易斯 - con.csv和数据集 - 圣路易斯unc.csv提供的数据集。这次演习的目的是展示基本模型结果的评估和使用EPA PMF限制。许多论文已发表在圣路易斯颗粒物(PM)的分摊研究和阿马托和Hopke(2012)最近公布了圣路易斯的数据分析。这里所举的例子不是一个完整的分析;它说明如何用PMF分析数据和评估模型结果的重要性。 PMF的输入参数列于表5中。 8.2.1数据集开发 圣路易斯点数据集包括13种和420小时的样品,2001年6月,2001年11月和2002年3月期间,在东圣路易斯Supersite拍摄(图59)。该数据被格式化在csv文件中,每一行代表一个取样和每列一个物种。物种不确定度估计和样本由分析实验室提供 低于检测限的样品被给予5/6检出限的不确定度,缺失样品不确定度被定为浓度中位数的4倍和超出检测限的样品获得三分之一的检测限不确定度加上特异样本实验室的不确定度。特别地,该数据集被选择来说明添加约束到基于已知源配置PMF模型。 8.2.2分析输入数据 物种特征(浓度/不确定度和浓度时间序列) 该种类别在5.5.1节指导的基础上进行设置。用户应该首先检查输入数据,以确定是否与预期的源的物种浓度在时间上的相关。例如,铁和锌的含量一起变化,表明钢铁生产存在或其他来源,铁和锌的时间序列示于图60。放大的时间序列的图形是由同时 “Alt”键和鼠标左键的同时绕所感兴趣的时期绘制框围产生。选择“Alt”键和 单击鼠标左键,返回到原来的数字。 在图60中的曲线显示了一个复杂的图象,因为高锌浓度不对应于铁浓度。这种差异可能表明一个不包含铁的本地锌源。在圣路易斯的这个例子中,锌冶炼厂位于该监测点附近。 物种之间的关系(浓度散点图) 物种之间的散点图应检查关系,表明了一个共同的源发出两个物种(例如OC和EC都是由移动污染源排放)。在圣路易斯数据集,铅和锌是不相关的,这表明两种可能的来源(图61)。 排除样品(浓度时间序列) 用户应检查浓度时间序列图,以验证PMF选择的品种预料的季节性模式(在暑假期间如高硫酸盐),以及找出不寻常的事件(例如,在七月四日,其中高量的钾,锶,和其他微量金属的贡献烟花)。通常,这些事件被容易地识别。在这些确定的事件而采取的样品应当被排除,因为整体的配置文件可能不捕捉源的独特的组合物,或无事件源的配置文件可能失真。通过突出显示,然后点击“排除样本”在屏幕的右下方排除样本。所有的数据排除必须充分论证并形成文件。 8.2.3基本模型运行 初始模型参数(基本模型运行) 该模型是运行20次,8个因子和30种子。恒定种子被用于复制结果为练习目的和运行融合和Q值是非常稳定的。在Q(鲁棒)比Q(真)低约10,,表明对Q值的一些,但不重的异常值的影响。 根据观察与预测的散点图和时间序列,有些品种,如铅,进行建模很好,和其他,如镉,并没有很好的建模(图62)。这可能是不正确的不确定度,不正确的分类(例如,作为强势品种),过少的因素被用于模型,从源头上没有足够的影响,或PMF不正确的模拟品种差异的结果。这种嵌合微量物种缺乏已经被高时 间分辨率的采样(一小时的频率或更低)注意到了。镉源,如焚化炉的监测点附近极有可能存在。然而,数据不具有足够的信息用于PMF来解决它。模拟的不良物质(镉)应该被归类为“不良”。 此外,NO 3(在图63中的曲线图所示)2001年的夏天具有许多固定值用于第一密集可设定在MDL(方法检出限)(方法检出限)中。此问题是不存在下两个时间段如图63和NO 3如果整个数据集使用应设置为“不良”,和如果只有最后两个密集intensives使用则为“强”。 旋转(G-空间图解) G - 空间曲线的解决方案应进行检查,以确定是否贡献充满空间以及有边或点有低或零贡献。为这些点选择物种是重要的,品种应针对区域性源指标,如燃煤电厂。图64示出了两个例子,一个是点靠近两个轴,另一个点只在一个轴上。FPEAK进行评估,以确定更优的解决方案是否可以找到。如果在一个图中一个点被选择,同一个点在其他附图也会被加以强调。 因素识别(文件/贡献,总贡献) 因素可能会利用优势种和时间模式被识别。硝酸盐是从分析中除去与要素的数目被减少到7(因为硝酸盐是一个因素)。在圣路易斯的数据集确定的七个因素表示基于该地区已知的来源的一个现实的解决方案,这是晶体(锰),铜冶炼厂(铜),煤炭燃烧(SO4,硒),锌冶炼厂(Zn)煤铁(Fe和EC),铅冶炼厂(以Pb计),和机动车(OC,EC)。铁和煤因子似乎是物种的混合和因子稍后在本实施例中使用约束条件进行评价。该因子剖面示于图65。 质量分布(因子贡献) 图66所示为总质量变量(PM2.5)的饼图的因素的贡献。评估贡献的分配以确定它们是否在预期的样本范围之内。这个例子的主要来源是机动车和煤燃烧,有轻微的贡献来自地壳,锌冶炼,铅冶炼,铜冶炼来源。 8.2.4误差估计 *_ErrorEstimationSummary文件的误差估计结果的总结示于表6连同评论。结果是稳定的,没有交换出现。*_ErrorEstimationSummary文件在任何出版物和报告中应当报告。 这个例子说明了进行PMF的解决方案评估的迭代的方法:评估输入数据,计算和评估基础结果,并评估误差估计。误差估计浓度汇总如图67。 8.2.5模式运行约束 定义约束表达式(表达式生成器) 圣路易斯数据集,本地钢铁设备源配置用于测定钢中铁和锰的适当比率。样品被分析如圣潘克拉斯等人所述的那样(2005)。此方法提供了总的无机的浓度,这是可比的总无机浓度由能量色散X射线荧光(EDXRF)。花岗岩市炼钢转炉的资料被用来作为代表性的样品,因为它被认为是影响的地点;EDXRF铁和锰的比例在源配置文件为60。 铁和锰的平均比例在圣路易斯周围的空气数据为10.8。然而,从PMF基础模型运行结果表明,51的铁对锰的比例根据钢铁系数曲线有点低。比例约束被定义使用表达式生成器,它被解释为autopull式:铁减去60倍的锰在钢铁因子里,在给定的dQ限制下拉至零(比约束的定义[钢|铁] - 60* [钢|锰〕= 0)。此外,EC 在铁和煤因子里被选择和鼠标右键来切换EC作为一个约束。这可能允许EC是从钢源更好分离。,dQ的设定在每一个约束为5,和融合的结果用2.1,dQ 模型运行结果约束(约束概况/贡献和诊断) 在随后出现的限制运行结果来看,比例移到60和EC也显著降低到40,左右,如图68所示,EC转移到另外一个因素是很重要的。最大的变化是机动车。这表明,约束提供一种改进的结果相比该基础运行。 这些变化对总的因素贡献的质量并没有很大的影响(铁和煤因子减少了2.3,,并在机动车因子增加1.1,),但是,它展示了带来的外部信息的好处。添加约束后,运行所有三个错误估计和比较它们的基本模型的结果。误差估计摘要(图69)不显示显著变化。在其它的数据集,该另外的约束可以通过减小旋转歧义来降低误差估计值的大小。 8.3巴吞鲁日保诚的VOC数据集 以下各节是巴吞鲁日,路易斯安那州(保诚)的光化学空气监测站的VOC数据集的详细PMF分析。用户应该运行的EPA PMF5.0所提供巴吞鲁日,con.csv数据集和 - 巴吞鲁日,unc.csv的数据集,遵循下面描述的分析。这次练习的目的是展示思维过程和采用EPA PMF5.0找到解决方案的步骤;它并不打算成为一个完整的源解析分析。 PMF的输入参数总结于图69。 8.3.1数据集开发 此分析的浓度数据从环保署空气质量系统下载。从2005年六月至八月,,2006年六月-9月(307个样本)期间在巴吞鲁日监测站点收集3小时的Speciated挥发性有机化合物(VOC)样品的数据被下载列入PMF。PAM的VOC数据不经常报道不确定度。对于这种分析,每个种类和样品设置初始不确定度为浓度的15,,除非该值低于检测,其中浓度为MDL(方法检出限)(方法检出限)/ 2和不确定度(5/6)* MDL(方法检出限)(方法检出限)(表7)。 8.3.2分析输入数据 物种特征(浓度/不确定度和浓度时间序列) S / N比在这个分析不是有益的,因为所有的物种都给出一个设定的不确定度;因此,物种分类会根据残差和基础运行后观察/预计初始的统计数据进行评估。品种有较大的相对不确定度被归类为“不良”,并从分析中排除。对于初次运行,包括所有物种被归类为“强”和所有21种,包括总非甲烷有机物(TNMOC),被使用。 物种之间的关系(浓度散点图) 物种之间的散点图应进行检查以评估该物种之间的关系可能表明一个共同的来源。在巴吞鲁日数据集,汽油移动源物种之间预期的关系,如甲苯,邻 - 二甲苯,(图70,1)和重型车辆移动源物种,如正癸烷,正十一烷(图70,2)表。 乙烷和丙烷(图70,3)显示两个源影响的一些证据即两个源有不同的乙烷和丙烷的比例,可能表明混合新源来自其他地区的石化加工/天然气利用和其他地区转输。苯和苯乙烯(图70,4),经常移动源占主导地位的物种,并没有很好的相关性与其他移动源种;这种缺乏相关性可能是由于这些物种从该区域的几大石化来源的排放。 样品和种类排除(浓度时间序列) 每一种污染物的时间序列被检测为极端的事件和/或明显的阶跃变化在浓度上应该从分析中删除。步的变化(例如,差异由于改变了实验室分析技术)可能被错误地识别为单独的物种来源。如果样品被除去由于各种物种的异常事件,EPA PMF以外进一步的数据分析可以被用来确定该数据是否是真实的,信息量大的。 8.3.3基本模型运行 初始模型参数(执行模型) 最初,20个基础运行有4个因素与25种子进行了探讨。在此迭代中,由几百个单位而变化的Q值,这表明该解决方案可能并不稳定。种类和类别被示于表8。残差和图如下所述进行评价后,若干种类别分别变更为“弱”的。强/弱见表8的物种类别栏已更改。 8.3.4基本模型运行结果 模型重构(OBS/预测散点图,观测/预测时间序列) 种类的残差被分析,规模残差的直方图(选择自动缩放后)苯被显示,它有一个很好的符合,以及乙烯不适合如图71。此外,观察与预测散点图和时间序列在图72和图73中,示出分别。由于PAM的数据只在暑假期间收取,时间序列图有秋季至春季期间失踪的时间段。散点图和时间序列也显示所观察到的和预测的浓度之间的差异。不符合物种残差大于3.0,峰值观察不适合在分散或时间序列图。缩放的残差大于4的物种具有峰值浓度未适合在PMF:2 - 甲基丁烷,乙烯,异丁烷,异戊烷,正癸烷,正 - 己烷,正壬烷,正辛烷,正戊烷,邻乙基甲苯和丙烯。类别为这些物种被设定为“弱”。 因素识别(文件/贡献,总贡献) 该基本的运行重新运行,文件和贡献进行了检查以确定因素。测得的文件被用于支持各因素的识别和因子名称已被添加到图74通过右键单击配置文件/贡献,并通过“要素名称”选项命名这个因素。 PMF结果被进行比较以测试文件使用所述第一和第二列的,藤田(2001),在图75中示出。柴油机排气信息(要MCH)的正辛烷水平高,相对于车辆的排放(EXH J)和图76中的表示因子指纹情节的量正癸烷的主要是与柴油的因素有关。消息人士透露乙炔对源的贡献将在本例中后面讨论。乙炔主要与汽车尾气排放相关,并对汽油蒸气有小的贡献。它也存在于工业源和柴油。 旋转(G-空间图解) 机动车辆及柴油废气排放源贡献的G空间的图也有一个很虚弱的线性关系(图77)。这可能表明该柴油机动车源可与机动车源混合,或可能存在柴油燃烧的另一个来源。其它G-空间曲线的配对显示点被分布在解空间的轴线之间。FPEAK应进行调查,以确定是否旋转移动指向轴。 物种分布(因子饼图) 总的变量(TNMOC)主要由机动车尾气和汽油蒸气贡献。工业部件也是一个 主要因素,如图78。 8.3.5 FPEAK 检查机动车尾气对汽油蒸气FPEAK G-空间图表明,使用的-1.0的FPEAK一些优化可能会获得。本实施例的焦点是为了演示的源信息的限制,所以FPEAK结果将不作进一步讨论。基础,FPEAK和约束模型的结果,应进行比较以确定旋转工具和约束是否提供了一个不同因素和贡献的解释。 误差估计摘要 如表9所示,并非所有的主成分因素被映射到引导因素与那些没有正确映射的因子的数量约80,,这是比较稳定的。未映射的因素是由于数据的高变异性和PMF未嵌合所有数据的峰值(图79)的组合。所有的“强”品种入选对于BS-DISP误差估计。 DISP互换的数目是零,并且BS-DISP互换分布在三个因素。在BS-DISP互换的数量是相对高的,并且BS的结果和模型拟合统计报告结果之前需要要评价 8.3.6模型运行约束 约束被用来确定乙炔是否与工业来源密切相关,因为乙炔是为机动车排气的一 种关键的示踪剂。在基础运行而言,乙炔的84,和14,分别和汽油尾气和炼油厂的因素相关联。乙炔在炼油厂因素中选择,用切换限制,并在 “下拉期最大” 使用1,的dQ约束和乙炔在汽油的尾气因素也用“上拉期最大”用1,的dQ制约。 基地运行和约束运行结果示于图80。约束中使用0.84,dQ和乙炔在炼油厂因子被拉到为零(图80中,1),并用汽油尾气因数提高到接近100,(图80中,2)。乙炔移动所需的低量dQ表示它不是炼油厂因子的坚定特征,乙炔可以用作汽油机动车排气的示踪剂。
本文档为【PMF翻译】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: 免费 已有0 人下载
最新资料
资料动态
专题动态
is_321635
暂无简介~
格式:doc
大小:1MB
软件:Word
页数:94
分类:
上传时间:2018-02-24
浏览量:103