首页 医药卫生数据元标准

医药卫生数据元标准

举报
开通vip

医药卫生数据元标准医药卫生数据元标准 医药卫生科学数据共享工程数据标准 HSDS/T XXX—2005 医药卫生数据元标准 The basic principles and methods for the standardization of data elements in Medical Sciences ,征求意见稿, 2006-02-25 ××××-××-××发布 ××××-××-××实施 医药卫生科学数据共享网标准体系建设项目组 目 录 前言 .................................

医药卫生数据元标准
医药卫生数据元 标准 excel标准偏差excel标准偏差函数exl标准差函数国标检验抽样标准表免费下载红头文件格式标准下载 医药卫生科学数据共享工程数据标准 HSDS/T XXX—2005 医药卫生数据元标准 The basic principles and methods for the standardization of data elements in Medical Sciences ,征求意见稿, 2006-02-25 ××××-××-××发布 ××××-××-××实施 医药卫生科学数据共享网标准体系建设项目组 目 录 前言 ................................................................................................................................................................. 3 1 范围 ........................................................................................................................................................ 4 2 规范 编程规范下载gsp规范下载钢格栅规范下载警徽规范下载建设厅规范下载 性引用文件 .................................................................................................................................... 4 3 术语与缩略语 ........................................................................................................................................ 5 3.1 术语 ............................................................................................................................................... 5 3.2 缩略语 ........................................................................................................................................... 7 4 医药卫生科学数据共享数据元标准研究概述 .................................................................................... 7 4.1 数据元概述 ................................................................................................................................... 7 4.1.1 数据元简介 .............................................................................................................................. 7 4.1.2 数据元与其它数据概念的关系 .............................................................................................. 8 4.1.3 科学数据共享工程中的数据元 .............................................................................................. 9 4.2 医药卫生科学数据共享数据元标准研究概述 ......................................................................... 10 4.2.1 数据元标准研究的内容 ........................................................................................................ 10 4.2.2 数据元标准研究的目的 ........................................................................................................ 10 5 数据元的表达格式 .............................................................................................................................. 11 5.1 数据元基本属性 ......................................................................................................................... 11 5.1.1 基本属性模型 ........................................................................................................................ 11 5.1.2 必选属性与其他选择属性 .................................................................................................... 12 5.2 基本属性规范 ............................................................................................................................. 13 5.2.1 标识类属性 ............................................................................................................................ 13 5.2.2 定义类属性 ............................................................................................................................ 14 5.2.3 关系类属性 ............................................................................................................................ 14 5.2.4 表示类属性 ............................................................................................................................ 16 5.2.5 管理类属性 ............................................................................................................................ 18 5.3 基本属性描述 ............................................................................................................................. 19 5.3.1 常规描述符 ............................................................................................................................ 19 5.3.2 属性描述规则 ........................................................................................................................ 19 6 数据元的值域规范 .............................................................................................................................. 21 6.1 穷举域 ......................................................................................................................................... 21 6.2 可重复利用域与通配数据元 ..................................................................................................... 21 6.3 数据元值域的规范定义和来源 ................................................................................................. 21 7 数据元的提取 ...................................................................................................................................... 22 7.1 自上而下的数据元提取法 ......................................................................................................... 22 7.2 自下而上的数据元提取法 ......................................................................................................... 22 8 数据元的命名规则 .............................................................................................................................. 23 8.1 名称语义内容的规则 ................................................................................................................. 23 8.1.1 语义规则 ................................................................................................................................ 23 1 8.1.2 名称成分语义 ........................................................................................................................ 23 8.1.3 分隔符语义 ............................................................................................................................ 25 8.2 名称格式的规则 ......................................................................................................................... 25 8.2.1 句法规则 ................................................................................................................................ 25 8.2.2 词法规则 ................................................................................................................................ 26 8.3 唯一性规则 ................................................................................................................................. 26 9 数据元的定义 ...................................................................................................................................... 26 9.1 数据元定义规则 ......................................................................................................................... 26 9.2 数据元定义指南 ......................................................................................................................... 27 9.3 数据元定义要求 ......................................................................................................................... 27 9.3.1 前提 ........................................................................................................................................ 27 9.3.2 规则 ........................................................................................................................................ 27 9.3.3 指导原则 ................................................................................................................................ 30 10 数据元的分类 ...................................................................................................................................... 33 10.1 数据元分类模式 ......................................................................................................................... 33 10.1.1 关键字................................................................................................................................ 33 10.1.2 主题词表术语 .................................................................................................................... 33 10.1.3 分类法和本体论分类单元 ................................................................................................ 34 10.2 数据元的分类属性 ..................................................................................................................... 34 10.3 分类属性描述 ............................................................................................................................. 35 10.3.1 分类组分标识符 ................................................................................................................ 35 10.3.2 分类组分名称 .................................................................................................................... 35 10.3.3 分类模式类型 .................................................................................................................... 36 10.3.4 分类模式标识符 ................................................................................................................ 36 10.3.5 分类模式名称 .................................................................................................................... 36 10.3.6 分类模式版本 .................................................................................................................... 36 10.3.7 分类模式项类型 ................................................................................................................ 36 10.3.8 分类模式项值 .................................................................................................................... 37 11 数据元的注册与管理 .......................................................................................................................... 37 附录,资料性附录, ................................................................................................................................... 38 A.1什么是元数据 ................................................................................................................................... 38 A.2数据元、元数据、元模型................................................................................................................ 39 2 前言 医药卫生科学数据共享网是跨基础医学、临床医学、公共卫生、中医药学四个数据中心和药学、特种医学主体数据库~“物理上合理分布~逻辑上高度统一”的资源共享服务系统~数据元则是共享资源在共享网层面上实现数据的一致性表达、交换和共享的基础。 为此~研究建立医药卫生领域数据元标准~是提高医药卫生共享数据采集、加工和处理以及数据生产、汇交与共享效率和质量~确保共享目标实现的前提~也是医药卫生科学数据共享工程标准规范建设重要的基础工作之一。 本标准是基于上述目的提出和制定的~旨在指导和规范医药卫生科学数据共享工程各建设单位建立科学数据采集、加工、处理、汇集、分发、服务和应用全过程中各种通用或专用数据元目录,又称字典,标准~促进医药卫生共享数据的规范化整合与无歧义理解。 本标准是按照向上积极采用适宜的国家标准或国际标准~向下突出科学数据共享活动的特点和需求~遵循科技部科学数据共享工程技术标准—数据元标准化基本原则与方法~参考了包括GB/T 18391《数据元的规范与标准化》在内的大量国家标准~结合本领域各种类型科学数据资源建设和整合以及数据交换、共享、服务和应用对数据元标准化工作的特定需求~提出的医药卫生领域数据元标准化的具体方法和要求。 本标准为第一次制定。 本标准由医药卫生科学数据共享网标准体系建设项目组提出。 本标准主要起草单位:解放军总医院、中国疾病预防控制中心、北京协和医院 本标准主要起草人:刘丽华 金水高 李包罗 王骏 胡凯 张黎黎 郭赟 3 1 范围 本标准围绕医药卫生领域各种类型科学数据库的建设和整合以及科学数据交换、共享、服务和应用对数据元标准化的需要~规定了数据元的提取、命名、标识、描述、分类、值域范围确立的基本原则与方法~数据元目录的格式规范~以及医药卫生科学数据共享工程中数据元的维护与管理的级别与机制。 本标准适用于医药卫生领域科学数据共享工程各建设单位研究和制定通用和专用的数据元目录,又称数据元字典,使用。 2 规范性引用文件 下列文件中的条款通过本标准的引用而成为本部分的的条款。凡是注日期的引用文件~其随后所有的修改单,不包括勘误的内容,或修订版均不适用于本标准。然而~鼓励根据本标准达成 协议 离婚协议模板下载合伙人协议 下载渠道分销协议免费下载敬业协议下载授课协议下载 的各方~研究是否可使用这些文件的最新版本。凡是不注日期的引用文件~其最新版本适用于本标准。 GB/T 5271.4—2000 信息技术 词汇 第4部分:数据的组织,idt ISO/IEC 2382-4:1987, GB/T 10112—1999 术语工作 原则与方法,neq ISO/DIS 704:1997, GB/T 15237.1—2000 术语工作 词汇 第1部分:理论与应用,eqv ISO 1087:1-2000, GB/T 18391.1??信息技术 数据元的规范与标准化 第1部分:数据元的规范与标准化框架 (idt ISO/IEC 11179-1:1999) GB/T 18391.2??信息技术 数据元的规范与标准化 第2部分:数据元的分类,idt ISO/IEC 11179-2:2000, GB/T 18391.3—2001 信息技术 数据元的规范与标准化 第3部分:数据元的基本属性,idt ISO/IEC 11179-3:1994, GB/T 18391.4—2001 信息技术 数据元的规范与标准化 第4部分:数据元定义的编写规则与指南,idt ISO/IEC 11179-4:1995, GB/T 18391.5—2001 信息技术 数据元的规范与标准化 第5部分:数据元的命名和标识原则,idt ISO/IEC 11179-5:1995, 4 GB/T 18391.6—2001 信息技术 数据元的规范与标准化 第6部分:数据元的注册,ISO/IEC 11179-6:1997, GB/T 20001.1—2001 标准编写规则 第1部分:术语,ISO 10241:1992~International terminal-ogy standards—Preparation and layout,NEQ, SDS/T 2132—2004 科学数据共享数据元标准化的基本原则与方法 SDS/T 2131—2004 科学数据共享公用数据元目录 SDS/T 1003—2004 _ 科学数据共享概念与术语概念 SDS/T 1003.2—2004 _ 科学数据共享概念与术语术语 3 术语与缩略语 3.1 术语 下列术语和定义适用于本标准 3.1.1 数据元 data element 用一组属性描述其定义、标识、表示和允许值的数据单元~在一定语境下~通常用于构建一个语义正确、独立且无歧义的特定概念语义的信息单元。 3.1.2 数据元概念 data element concept 能以数据元的形式表示~且与任何特定的表示法无关的概念。 3.1.3 数据元目录 data element dictionary 列出并定义了所有相关数据元的一种信息资源。 3.1.4 数据元名称 data element name 用于标识数据元的主要手段~由一个或多个词构成的命名。 3.1.5 标识符 identifier 注册机构内与语言无关的唯一标识符。同数据标识符。给定相关环境的对象的无歧义的名称。 3.1.6 版本 version 注册机构内~一套数据元规范中的一个数据元发布的标识。 3.1.7 数据元注册系统 data element registry 由注册机构保存的用于描述数据元含义和表示形式的信息资源~包括注册标识符、定义、名称、值域、元数据和管理属性等。 5 3.1.8 实体 entity 任何具体或抽象的事物~包括事物间的联系。 3.1.9 对象 object 可以想象或感觉的世界的任一部分。 3.1.10 对象类 object class 现实世界中有清楚的边界和含义、其特性和其行为遵循同样的规则而能够加以标识 的想法、抽象概念或事物的集合。 3.1.11 属性 attribute 某个对象或实体的特征。 3.1.12 属性值 attribute value 某种属性的一个实例表示。 3.1.13 定义 definition 表述人和事物的基本特性、或其类别的词或短语。 3.1.14 相关环境 context 对使用名称或产生名称的应用环境或应用规程的指明或描述。 3.1.15 特性 property 对象类的所有个体所共有的某种性质。 3.1.16 特性术语 property term 用于表述对象类特性的术语~它是数据元名称的一个部分。 3.1.17 限定术语 qualifier term 用于定义和区分数据库中某个名称的词或词组。 3.1.18 表示术语 representation term 数据元中用于描述数据元表示的术语~它也是数据元名称的一个部分。 3.1.19 表示 representation 值域、数据类型的组合~必要时也包括度量单位或字符集。 3.1.20 注册机构标识符,RAI,registration authority identifier 赋予注册机构的标识符。 6 3.1.21 版本标识符 version identifier 赋予版本的一个标识符,用于提交或修改数据元注册,。 3.1.22 分类模式 classification scheme 依据对象所具有的共同特征~如:起源、组成、结构、应用和功能~而对其进行排列或划分的模式。 3.1.23 分类的组分 classified component 依据一个或多个分类模式可对其进行分类的一个数据元的任何组分。 注:组分包括对象类、特性、表示类、数据元概念、值域和数据元。 3.1.24 结构设臵 structure set 在相关环境中放臵对象的方法~用以展示与其他对象的关系~如各种实体关系模型、分类法,tax-onomies,和本体论法 (ontologies)。 3.1.25 关键字 keyword 用于数据元检索的一个或多个有意义的字、词。 3.1.26 分类法 taxonomy 依据类及子类间的固有关系进行分类的方法。 3.1.27 主题词表 thesaurus 按给定顺序排列参照词汇~其中显示和标识了词汇间的关系。 3.1.28 语义学 semantics 有关词义注释的语言学分支学科,韦氏词典,。 3.2 缩略语 IEC??国际电工委员会,International Electrotechnical Commission, ISO??国际标准化组织,International Organization For Standardizarion, RA??注册机构,Regidtratrin Authirity, ERD??实体关系图,Entity-Relationship-Diagram, 4 医药卫生科学数据共享数据元标准研究概述 4.1 数据元概述 4.1.1 数据元简介 数据元是可以用一组属性描述其定义、标识、表示和允许值的数据单元。在特定的语义环境中~它被认为是不可再分的最小数据单元。 7 数据元一般来说由三部分组成: , 对象类:现实世界中有清楚的边界和含义、其特性和行为遵循同样的规则而能够加 以标识的想法、抽象概念或事物的集合。 , 特性:对象类的所有个体所共有的某种性质, , 表示:值域、数据类型的组合~必要时也包括度量单位或字符集。 图1给出了数据元的结构模型。 数据元概念是一个对象类与一个特性的组合,而数据元是由数据元概念和表示两部分组成的。当一个表示与一个数据元概念结合时就能够产生一个数据元。根据图中所示~数据元和数据元概念之间存在多对一的关系~也就是一个数据元必须要有一个数据元概念~而一个数据元概念可以对应多个数据元~换句话说~多个数据元可以共享一个数据元概念。 数据元需要并且只能有一个表示。不同的表示与相同的数据元概念结合得到不同的数据元~数据元中的表示是描述数据元的特性的。也就是说在数据元中~特性都具有且只有一个表示。 与实体关系类数据模型相比~模型中的实体相当于数据元中的对象类~而实体的属性相当于数据元中的特性和表示。在面向对象的术语中~数据元概念还可以表示为对象类和特性的组合。在实体/关系的术语中~数据元概念是实体的属性。 数据模型 数据元概念 数据元 11 :1 :1 对象类 对象类 实体 1 :n 11 :1 :1 特性 特性 属性 1 :1 表示 图1数据元的结构模型 4.1.2 数据元与其它数据概念的关系 图2是数据层级的简化表示~表明数据元所在的那些层。 8 图2 数据层级简化表示 数据元出现在数据库、文件和事务集中。数据元是一个组织管理数据的基本单元~因而它必然是组织内部数据库和文件设计~并用于建立与其它组织交流的事务集的组成部分。 在组织内部~数据库或文件由 记录 混凝土 养护记录下载土方回填监理旁站记录免费下载集备记录下载集备记录下载集备记录下载 、段和元组等组成~而记录、段和元组则由数据元组成。数据元本身包含有字符、图像、声音等多类数据。 一个系统需要将数据传输给其它系统时~数据元构成了事务集的基本单元。事务主要发生于数据库间或文件间~但系统间的文件和数据库结构,如记录或元组,并不一定相同。信息,数据加上理解,传输的公共单元是数据元。 4.1.3 科学数据共享工程中的数据元 科学数据的数据元是指科学数据业务活动中涉及的所有数据单元。科学数据的数据元是属于科学活动这一特定领域的数据元。它的概念和结构遵循一般数据元的概念和结构~是通用数据元的一个子集~并具有自身的特点。 科学数据的数据元采用相关的元数据来描述数据元的属性。其目的为帮助用户理解和使用科学数据的数据元。科学数据的数据元标准中制订数据元所需的元数据~示例有分类模式、命名、定义、注册等。 9 科学数据的数据元标准由两大部分组成: 第1部分:基本原则与方法 主要阐述科学数据中数据元的设计、提取和管理的方法论。 第2部分:数据元目录 主要依照第1部分中规定的数据元标准化的基本原则和方法制订科学数据共享工程所需的各种数据元~并以目录形式汇集成册。 本标准是医药卫生数据元标准基本原则与方法。 4.2 医药卫生科学数据共享数据元标准研究概述 在医药卫生科学数据共享建设与运行过程中~包括与数据集制作在内的一系列数据共享与交换活动相关的数据工作和最终用于表达和呈现数据共享成果与内容的基本内容都是以数据元为主体。因此数据元标准化是医药卫生科学数据共享工程建设中必须进行的重要工作。 4.2.1 数据元标准研究的内容 本标准研究范畴包括医药卫生科学数据共享工程中对数据元进行标准化的原则、方法、管理机制和模式~具体内容包括数据元定义、命名、描述、著录、管理、注册等环节和过程。 4.2.2 数据元标准研究的目的 制定本标准目的在于确立面向医药卫生科学数据共享活动的数据元标准化的基本原则与方法~指导医药卫生科学数据共享网各建设单位规范数据元的定义、命名、著录、管理等各个环节~形成标准化、规范化的医药卫生领域数据元资源库~供本领域科学数据共享的建设与实施使用。 数据元的标准化对于医药卫生领域科学数据共享建设与运行过程中数据的交换、共享具有重要的意义。一方面~数据元标识、描述与表达的规范化和通用性~将提高数据在组织、生产、交换和共享的效率和质量~减少重复的投入和建设,另一方面~一致认可的相关标准或规范是领域中的各类数据元被不同的信息系统或应用系统所共享的前提。因此采用正确的原则和方法开展数据元标准化工作~以有效规避风险~提高数据组织和生产的效率和质量~达到共享目标~是科学数据共享活动面临的任务之一。 10 5 数据元的表达格式 5.1 数据元基本属性 5.1.1 基本属性模型 数据元表示规范是通过描述数据元的一系列属性来实现的。图3中描述的模型使用了两种准则对数据元的属性进行分组~分在同一组的属性共同拥有相似的基数和逻辑相关性。 图3 数据元基本属性模型 ??基数型 每一个数据元规范都可能包含0或1,0:1,、1且仅仅是1,1:1,、0或多,0:n,、1或多,1:n,个列于下节表1中的属性事件。 例如:一个数据元规范可能包含0或1个“主管机构”属性~但要求有1且仅仅是1个“定义”属性,可能包含0或多对“相关数据参照”与“关系类型”属性~但要求有1或多个“数据元允许值”属性。 ??逻辑相关性 属性除了有相似基数类型外~还可能彼此依赖~也就是说~某种属性在没有其他属性存在的情况下不可能存在。 例如:如果属性“同义名称”和“相关环境”两者有一个存在的话~那么它们两者就都应当存在。类似地~如果属性“相关数据参照”和“关系类型”两者有一个存在的话~那么 11 它们两者就都应当存在。另一方面~即使属性“相关数据参照”和“同义名称”有相同的基 数类型,0:n,~它们也不能相互依赖而存在~从而它们不能分在同一组。 5.1.2 必选属性与其他选择属性 表1中纵列“约束”是指在数据元字典中,该属性是“必选(M)”,还是“条件选(C)”, 或者是“可选(O)”。 表1 数据元属性 属性种类 数据元属性名称 约束 M 标识类 ?? 名称 C ?? 标识符 C ?? 版本 C ?? 注册机构 O ?? 同义名称 C ?? 相关环境 M 定义类 ?? 定义 O 关系类 ?? 分类模式 O ?? 关键字,词, O ?? 相关数据参照 C ?? 关系类型 M 表示类 ?? 表示类别 M ?? 表示形式 M ?? 数据元值的数据类型 M ?? 数据元值的最大长度 M ?? 数据元值的最小长度 C ?? 表示格式 M ?? 数据元允许值 O 管理类 ?? 主管机构 C ?? 注册状态 O ?? 提交机构 O ?? 备注 12 5.2 基本属性规范 数据元是由它们的属性来说明~这些基本属性在以下内容中给予了详细阐述。 5.2.1 标识类属性 名称: 名称 定义: 赋予数据元的单个或多个字词的指称。 约束: 必选 数据类型: 字符串 备注: 关于命名原则见GB/T 18391.5和GB/T 18391.6。 名称: 标识符 定义: 在一个注册机构内与语言无关的一个数据元的唯一标识符。 约束: 条件选 条件: 如果属性“数据元名称”在一个注册机构内部不是唯一的~那么本属性 就是必选的。 唯一标识符的分配可作为任何注册机构的注册程序的必选部分。 数据类型: 字符 名称: 版本 定义: 在一个注册机构内的一系列逐渐完善的数据元规范中~某个数据元规 范发布的标识。 约束: 条件选 条件: 当对属性进行了更新~并且这种更新满足注册机构制定的新版本的维 护规则时~则本属性就是必选的。 数据类型: 字符 名称: 注册机构 定义: 经授权可对数据元注册的组织。 约束: 条件选 条件: 每一个出现的标识符都应指明一个注册机构。 数据类型: 字符串 备注: 组合属性“注册机构”、“标识符”和“版本”可用来唯一地确定一个数据 元。 一个数据元可以由多个注册机构来注册。 13 名称: 同义名称 定义: 与给定名称有区别但表示相同的数据元概念的单字或多字的 指称。 约束: 可选 数据类型: 字符串 备注: 在确定的应用环境中~同义名称常常是熟悉的名称。如果是这种情 况的话~要使用属性“相关环境”来指明这个环境。 假如有更多的同义名称存在~则属性“同义名称”与“相关环境”应当作 为一对属性来规定。 名称: 相关环境 定义: 对使用或产生名称,或同义名称,的应用环境或应用规程的指明或 描述。 约束: 条件选 数据类型: 字符串 条件: 对于属性“同义名称”的每一次出现来说~本属性都是必选的。 当属性“名称”存在于一个信息交换过程中时~本属性是必须的。 备注: 为属性“名称”指定属性“相关环境”对于注册机构的注册程序来说是 必须的。 5.2.2 定义类属性 名称: 定义 定义: 表达一个数据元的本质特性并使其区别于所有其他数据元的陈述。 约束: 必选 数据类型: 字符串 5.2.3 关系类属性 名称: 分类模式 定义: 根据对象的来源、组成、结构、应用、功能等共同特性~将对象排列 或划分成组的模式的分类参照。 约束: 可选 数据类型: 字符串 14 备注: 分类模式可以用于使数据元与功能上的和,或,组织上的和,或,技 术上的分类模式和,或,概念模型相关联。 名称: 关键字 定义: 用于数据元检索的一个或多个有意义的字词。 约束: 可选 数据类型: 字符串 备注: 本属性可作为记录的关键字,搜索键,与所研究的数据元相关联。 名称: 相关数据参照 定义: 数据元与相关数据之间的参照。 注:参照的数据可以注册在同一数据元的字典中~或者注册在其他 的字典、字库中。 约束: 可选 数据类型: 字符串 备注: 1. 当相关数据被其他注册机构所控制时~本属性应当具有唯一的标 识符~举例来说:注册机构加上其所分配的有关数据的标识符即 构成唯一标识符。 2. 参见数据元的命名和标识原则。 3. 一个数据管理环境应当为应用本属性设臵一些规则和约定。 4. 如果本属性存~则它应当与属性“关系类型”作为一对属性来规定。 名称: 关系类型 定义: 数据元与相关数据之间关系特性的一种表达。 约束: 条件选 条件: 若属性“相关数据参照”存在~则本属性就是必选。 数据类型: 字符串 备注: 1. 本属性应当与属性“相关数据参照”作为一对属性来规定。 2. 关系类型的示例有: “……的限定符”“由……限定”“……的主体”“……的部分”“物理条 件”“外部参照”“更高级的标准”“数据元概念”。 3. 一个数据管理环境应当为应用本属性设臵一些规则和约定。 15 5.2.4 表示类属性 名称: 表示类别 定义: 用于表示数据元的符号、字符或其他表示的类型。 约束: 必选 数据类型: 字符串 备注: 表示类别应当由相关的标准来规定。可以用作表示类别的示例有: ??字符表示法,ISO/IEC 646, ??字符/符号表示法,ISO第143号注册出版物, ??条码表示法,EIA-556, ??图形表示法 名称: 表示形式 定义: 数据元表示形式的名称或描述~例如:“数值”“代码”“文本”“图标”。 约束: 必选 数据类型: 字符串 备注: 1. 参见GB/T 18391.2的有关适用术语,“特性词”或“类别词”,。 2. 示例1:对于名为“出生地代码”的数据元来说~本属性相当于“代 码”。 3. 示例2:对于数据元“产品描述”来说~本属性相当于“文本”。 4. 示例3:对于数据元“托运物重量”来说~本属性相当于“数值”。 名称: 数据元值的数据类型 定义: 表示数据元值的不同值的集合。 约束: 必选 数据类型: 字符串 备注: 示例: 可能的实例为:“字符”“序数”“整数”“实数”“比例数”“二进制数”“有 理数”。 名称: 数据元值的最大长度 定义: 表示数据元值的,与数据类型相对应的,存储单元的最大数目。 约束: 必选 16 数据类型: 整数 备注: 1. 示例: 对于数据元“发票号码”来说~属性“数据类型”的实例为“字 符”~并且属性“数据元值的最大长度”的实例值为“17”。那么“发 票号码”的数据元值最大不应超过17个字符。 2.“数据元值的最大和最小长度”这两个属性表明数据元值是“不变 的”,最大长度与最小长度相等,还是“可变的”,最大长度与最小 长度不同,。 名称: 数据元值的最小长度 定义: 表示数据元值的,与数据类型相对应的,存储单元的最小数目。 约束: 必选 数据类型: 整数 备注: 1. 示例:对于数据元“产品描述”来说~属性“数据类型”的实例为“字 符”~并且属性“数据元值的最小长度”的实例值为“10”那么“产品 描述”的数据元值最小不应少于10个字符。 2. “数据元值的最大和最小长度”这两个属性表明数据元值是“不变 的”,最大长度与最小长度相等,还是“可变的”,最大长度与最小 长度不同, 名称: 表示格式 定义: 用字符串表示数据元值的格式。 约束: 条件选 条件: 如果数据元属于“定量数据”类~那么本属性就是必选。如果属性“表 示形式”是“代码”~当代码表示需要有具体的结构或格式时~则建议 使用本属性。 数据类型: 字符串 备注: 1. 对于定量数据来说,区别整数、十进制标记和浮点计数法是必要的。 2. 对于有具体结构或格式的代码表示来说~代码结构中每个位臵的 字符类型对于有效意义来说都是重要的。 名称: 数据元允许值 17 定义: 根据相应属性中所规定的表示形式、格式、数据类型和最大与最小 长度而决定的数据元的允许实例表示的集合。该集合可以根据名称、 引用来源、实例表达的枚举~或者根据实例生成规则来规定。 约束: 必选 数据类型: 字符串 备注: 当数据元允许值是编码表示的枚举形式时~每一个数据元值及其实 例都应当成对表示。 5.2.5 管理类属性 名称: 主管机构 定义: 对必选属性内容负责的机构或机构内部的部门。数据元就是由这些 必选属性来规定的。 约束: 可选 数据类型: 字符串 备注: 该组织应当被视为数据元的“拥有者”。 名称: 注册状态 定义: 数据元在其注册的生存期内状态的标示。 约束: 条件选 条件: 在注册机构所规定的数据元生存期内~本属性是必选。 数据类型: 字符 备注: 判别注册状态的类型和注册状态的确定应当遵循在数据元注册规程 中所阐述的规则。 名称: 提交机构 定义: 为数据元字典的增补、变更或注销/撤消而提交数据元的组织或组织 内的部门。 约束: 可选 数据类型: 字符串 名称: 备注 定义: 数据元的注释。 约束: 可选 18 数据类型: 字符串 5.3 基本属性描述 5.3.1 常规描述符 数据元基本属性应依照一种标准方式来描述~以便数据元字典中的数据元在信息交换中保持一致性~并且能够在不同的数据管理环境中进行数据元比较。表2给出了关于描述数据元属性的常规描述符集。纵列“约束”表示描述数据元属性时~一个描述符是“必选”,M,~还是“条件选”,C,~或者是“可选”,O,。 表2 数据元属性常规描述符 属性描述符 约束 M ?? 名称,中、英文, M ?? 定义 M ?? 约束 C ?? 条件 O ?? 最多实例数 M ?? 数据类型 O ?? 最大长度 C ?? 字符集 C ?? 语言 ??备注 O 5.3.2 属性描述规则 , 必选描述符 下列数据元属性描述符是必选的: ??名称 ??定义 ??约束 ??数据类型 名称:赋予数据元属性标记。名称应当是唯一的~并且应当以字母数字式的字符串形式表示。 定义:数据元属性的描述,可使一种数据元属性与其他数据元属性清晰地区别开来。定义以字母数字式的字符串形式表示。 19 约束:显示一个数据元属性是始终还是有时出现,即含有的值,的描述符。该描述符可以有下列含义: ??必选:该数据元属性必须出现。 ??条件选:如果规定的条件存在的话~那么该数据元属性就应当出现。 ??可选:该数据元属性可以出现~也可以不出现。 条件:数据元属性应该出现的环境。 最多实例数:在一个数据元规范中~规定数据元属性可以拥有的最多实例数目的描述符。 注:描述符“最多实例数”可以实现为属性的重复出现的次数~或实现为属性出现一次但具有多个赋值,多值属性,。后一种情形需要句法约定~以使属性值相互区别。 实现示例1: 某种数据管理功能确定了这样的属性:在一个数据元规范中“同义名称”可以出现3次。数据元的3个“同义名称”被命名为“产品代码”~表达如下: 名称 产品代码 同义名称1: 物品号 同义名称2: 物料代码 同义名称3: 产品索引号 实现示例2: 某种数据管理功能确定了这样的属性:在一个数据元规范中“分类模式”~可以只出现1次但可以拥有2个值。数据元“元件体长”的两个“分类模式”~可以表达如下: 名称 体长 分类模式: IEC 元件种类: 元件 IEC 数据元类型种类:长度值,T03, 数据类型:为表达属性值而规定的特定值集合的描述符。属性值的数据类型示例有:“字符”、“序号”、“整数”、“字符串”。 最大长度:存储单元最大数目的规格以表达在数据类型中所规定的特定值。 示例:当“数据类型”实例被规定为“整数”并且“最大长度”描述符实例值是:“3”时~则表示属性值可以包含最多3位整数。 备注:与属性应用有关的注释。 20 6 数据元的值域规范 数据元的表示部分称为值域。 数据元在系统运作中呈现为值~并在信息交换等功能中得到共享。数据元通常有一个允许值的集合。这个允许值的集合被称之为值域。 数据元从不表示为一个单个的数值~因为它是一个类,是数据值完整的集合,而不是一个单个事例。比如~疾病编码是一个数据元~它的值域由国际疾病分类允许值的一个完整列表来描述。这里的数据值是疾病编码所有实例的一个列表。数据元的一个实例只有一个单个数据值~称之为一个“数据元实例”。 一个特性有定义并隶属一个对象类。相反~一个表示没有定义~但有一个格式类、允许值、最大字符数~如果可以度量~还应有一个度量单位。比如~数据元“月名称”就有以下表示: , 格式类 = alpha , 允许值 = 1,12 , 最大字符数 = 2 , 度量单位 = ,不适用~因为不存在度量的问题, 6.1 穷举域 穷举域是一个可以由所有允许值列表指定的值域。比如~人们给国家标上名称~就很容易引证它们。包含现今世界上所有国家名称的集合就是穷举域的一个例子。 特性和表示的有关值域可以考虑用来标识数据元一个潜在有效数据值的集合~对象类通常将宽泛的值域限定为数据值的一个具体的子集~以用于某个具体的数据元。 6.2 可重复利用域与通配数据元 一些域有被许多数据元使用的可能。比如~所有人类眼睛颜色的名称可用于病人、医务人员和数据库中其它类的人员。 一个指定了的并被严格定义的域可以被再利用。它们在用于数据元时~具有相同的值域、表示和特性。比如~病人眼睛颜色或医务人员眼睛颜色。我们称这些可再利用域为通配数据元。 6.3 数据元值域的规范定义和来源 名称:值域 21 定义:根据相应属性中所规定的数据类型、数据格式而决定的数据元的允许值的集合。 约束:必选 出现次数:1:1 数据类型:字符串 来源:该集合可以通过以下四种方式给出: , 通过名称给出~即直接指出值域的名称~比如数据元“两字母国家代码”的值域是GB/T 2659《世界各国和地区名称代码》中的全部两字母代码, , 通过参考资料给出~比如数据元“疾病编码”的值域是已经在国际疾病分类编码中心注册的所有疾病的码, , 通过一一列举方式给出所有可能的取值以及每一个值对应的实例或含义~比如数据元医院所有制性质~其值域可以定义为国有、集体所有、股份制, , 通过规则间接给出~比如数据元“无线电频率”的值域是从3kHz到300GHz~并且遵循IEC-50的规范。 , 无要求。 7 数据元的提取 为科学数据共享数据元提取提供一个方法论指南是确保提取数据元具有科学性和互操作性的关键。科学数据共享数据元的提取方法有两种:自上而下,top-down,提取法和自下而上,down-top,提取法。 7.1 自上而下的数据元提取法 对于新建系统的数据元提取~一般适用这种“自上而下”的提取法。基本步骤是~在流程和功能分析的基础上~通过建模分析、确立关心“对象”~从数据模式的角度看~数据元主要解决数据的概念和组成。在概念信息模式和逻辑数据模式的基础上~分析提取数据元及其属性。一般步骤为:功能建模、流程建模、信息建模、数据元的提取、数据元的提交。 7.2 自下而上的数据元提取法 对于已有的信息系统~可根据其自身数据库系统的ERD图进行数据元的提取。对于科学数据可能存在的信息模型、数据模型、数据流程图、数据库设计,模式、文件、格式,以及接口规范和计算机程序中数据元都可以进行共享。对这些系统中的已存在的数 22 据元要依据本标准~结合科学数据业务和管理要求~逐部门、系统收集、筛选、梳理、重排、找出共性~在协调的基础上定义、分类、整理、和提交。 8 数据元的命名规则 数据元由其成分的名称构成~在一个名称中设臵每个成分的含义,语义,和相对或绝对的位臵,语法,。它们可以用分隔符来分界。每个成分值的集合或范围应当由一个机构严格管理。 , 语法规则使含义能够传达, , 句法规则按一致性和指定顺序关联成分, , 词法,词形和词汇,规则减少冗余~增加精确度。 8.1 名称语义内容的规则 语义涉及到数据元各名称成分的含义~以及对其界定的分隔符。 8.1.1 语义规则 , 对象类表示在一个领域内有关的事物~例如:在某领域的一个模型中发现的事物。示例:费用 , 需要有一个且仅有一个对象类术语。 , 特性术语应当从特性体系结构设臵中产生~并表示出数据的类别。 , 需要有一个且仅有一个特性术语。 , 限定应由专业领域机构决定产生~当需要描述一个数据元并使其在特定的相关环境中唯一时~即可增加上限定术语。限定术语的顺序并不重要。限定术语是可选的。示例:预算周期 , 表示数据元的有效值集合由表示术语来描述。 , 需要有一个且仅有一个表示术语。 8.1.2 名称成分语义 成分由离散术语组成。本标准名称成分由以下术语描述: , 对象类术语 , 特性术语 , 表示术语 , 限定术语 23 8.1.2.1 对象类术语 对象类术语是构成数据元名称的一个成分~它表示某一相关环境中的一项行为或一个对象。 例如~有下列的数据元: ——雇员的姓名 ——病人的婚姻状况 ——调查对象的身高测量 ——医疗机构的所有制属性 这里组成数据元各个成分的雇员、病人、调查对象和医疗机构等都是对象类术语。 8.1.2.2 特性术语 一组特性术语是由一个特性分类中的一组名称成分构成的。这个组必须是由离散的,每个定义不能与其它定义相重叠,和完整的,全部的特性~这个组表示了所有说明数据元所需的信息概念,词构成。 例如~在上述的数据元中: ——雇员的姓名 ——病人的婚姻状况 ——调查对象的身高测量 ——医疗机构的所有制属性 姓名、婚姻、身高和所有制是特性术语。 特性术语当然要出现在数据元的定义中。使用两个结构设臵中的成分~提供了一种分类的补充方法。用数据元对象类和特性两个成分形成的一个名称~包含了有关数据元极为重要的信息~而且排除了当没有约定使用而被采用的不重要的或不合理的元素。 8.1.2.3 表示术语 表示术语是一个数据元名称中描述数据元表示形成的一个成分。每个表示术语由一个受控单词表或一个分类体系形成。表示术语的类别表现形式如下: ? 名称 ? 总额 ? 测量 ? 数目 ? 数量 ? 文本 24 这类术语描述了数据元有效值集合的形式。通常这类表示术语可能与特性术语有部分重复~此时~可以从结构化名称中将一个术语或术语的一部分删除。 例如~在数据元中: ——调查对象的身高测量 ——雇员的姓名 成分测量和姓名是表示术语。但由于姓名又是一个特性术语~为了表达的清楚~冗余的字可以删去。这类数据元可以表达为:调查对象的身高、雇员的姓名。 8.1.2.4 限定术语 如果必须对一个数据元进行唯一标识~可以将限定术语加到对象类术语、特性术语和表示术语上~这些限定术语也许是从一个相关环境规定的结构设臵中产生的。在,确立,命名约定的规则中,时,~建议对限定术语的数量予以限定。 例如~在数据元“传染病人的婚姻状况”中~成分“传染”是限定术语。 8.1.3 分隔符语义 术语的成分由分隔符来界定。它们可以是: , 没有语义含义。可以用一项命名规则说明分隔符由一个空格或一个确切的特定 字符,如一个连字符或下划线,组成~而不管各成分间的语义关系如何。这样 的规则简化了名称的生成过程。 , 有语义含义。语义含义能由分隔符表达~如将限定术语之间的分隔符和其它成 分之间的分隔符设定不同的分隔符。用这种方法~分隔符就把限定术语从名称 的其它部分清楚地标识出来了。 例如~在数据元中: ——费用-预算_周期-合计-总额 在限定术语之间的分隔符是下划线,其它名称成分之间的分隔符是连字符。 8.2 名称格式的规则 8.2.1 句法规则 句法原则详细说明了一个名称中各成分的排列。这一排列可能是相对的或者绝对的~或者二者兼有。 , 相对排列是依据其它成分确定该成分。如在一个约定中的一项规则可能要求一个限定术语必须总是出现在被限定术语的前面。 25 , 绝对排列是确定该成分的固定位臵。如~一项规则可能要求特性术语总是一个名称的最后成分。 , 对象类术语应处于名称的第一,最左,位臵。 , 限定术语应位于被限定成分的前面~限定名称的顺序不应用于区别数据元名称。 , 特性术语应处于第二位臵。 , 表示术语应处于最后位臵。假如表示术语中有任何字与特性术语中的字重复~则删去冗余词。 示例:费用 预算 周期 合计 总额 8.2.2 词法规则 , 名称的各个成分间和多个单词术语之间用空格分隔~不允许用特殊字符, , 名称中所有单词是组合在一起的, 8.3 唯一性规则 同一相关环境的所有名称应是唯一的。 9 数据元的定义 9.1 数据元定义规则 数据元的定义应该满足以下要求: , 具有唯一性,在出现此定义的任何数据字典或数据元目录中,。说明:每个定义必须区别于,字典或目录中的,任何其它定义~以保证专一性。定义中所表述的一个或多个特性必须使被定义的概念与其它概念相区别。 , 要阐述其概念是什么~而不是阐述其概念不是什么。说明:在阐述数据元的定义时~仅阐述其概念不是什么并不能对概念作出唯一的定义。 , 用描述性的短语或句子进行阐述。说明:必须使用短语来形成包含概念的基本特性的准确定义。不能简单地陈述一个或几个同义词~也不能以不同的顺序简单地重复这些名称。如果一个描述性短语不够~则应使用完整的、语法正确的句子。 , 仅可使用人们普遍理解的缩略语。说明:这是考虑到对缩略语~包括简称和英文首字母含义的理解~通常会受到特定环境的限制。如某一缩略语在不同环境下也许会引起误解或混淆。则为了避免词义不清~在该定义中就应使用全称~而不用缩略语。所有简称在第一次出现时~必须予以说明。 , 表述中不要加入不同的数据元定义或引用下层概念。 26 9.2 数据元定义指南 数据元的定义应尽量做到: , 阐述概念的基本含义, , 准确而不含糊, , 简练, , 能单独成立, , 表述中不应加入理论说明、功能说明、范围信息或程序信息, , 避免相互依存, , 相关定义使用相同的术语和一致的逻辑结构。 9.3 数据元定义要求 9.3.1 前提 数据元是为特定的目的而存在和被使用的。使用上的不同~将要求某些规则和指南具有不同的表现形式。例如~不同的相关环境通常要求数据元定义的不同层级特性。10.3.3列举了不同定义需要不同层级特性实例。 “阐述概念的基本含义”取决于相关环境。表述某一特定定义的基本含义所必须的主要特性~因数据元的通用化或专业化层级而异。这种主要特性应考虑到与所分析的概念有关的对象类、性质和修饰词的关联。GB/T 10112中阐述了有关不同相关环境中概念之间的关系以及利用特性来区别不同的概念。定义的撰写应让使用者和数据共享者易于理解。 9.3.2 规则 为了易于理解有关规范化数据元定义结构的规则~下面给出了有关说明和示例。每项规则之后都附有对其含义的简要说明。说明之后~则是一些示例。每项说明均配有好的示例~必要时还配有常见的错误示例~以说明定义的编写错误。为了说明好的示例与不好的示例之间的差别~在这些示例后附有对原因的说明。 数据定义应: a) 具有唯一性,在出现此定义的任何数据字典中,。 说明:每一定义必须区别于,字典中的,任何其他定义~以保证专一性。定义中所表述的一个或多个特性必须使被定义的概念与其他概念相区别。 示例:“发货日期”“收货日期” 1,好的定义: 27 “发货日期”??供货方发送货物的日期。 “收货日期”??收货方收到货物的日期。 2,不好的定义: “发货日期”??交付货物的日期。 “收货日期”??交付货物的日期。 原因:定义“交付货物的日期”不能既用于“发货日期”~又用于“收货日期”这两个数据元。每个定义必须是不同的。 b) 要阐述其概念是什么~而不是仅阐述其概念不是什么。 说明:编写定义时~仅阐述其概念不是什么并不能对概念作出唯一的定义。 示例:“运费总额” 1,好的定义: 发货人把货物从一个地方运到另一个地方所花费的费用总额。 2,不好的定义: 与包装、提供的文件、装货、卸货和保险无关的各项费用。 原因:不好的定义没有明确说明这个数据的含义。 c) 用描述性的短语或包子阐述,在大多数语言中,。 说明:,在大多数语言中,必须用描述性短语来阐述该概念基本特性的准确定义而不能简单地陈述一个或几个同义词~也不能以不同的顺序简单地重复这些名称词。如果一个描述性短语不够~则应使用完整的、语法正确的句子。 示例:“代理人名称” 1,好的定义: 被授权代表另一方的那一方的名称。 2,不好的定义: 代表。 原因:“代表”是这个数据元名称的同义词~不适宜用作定义。 d) 仅可使用人们普遍理解的缩略语。 说明:对缩略语~包括简称和首字母含义的理解~通常受到特定环境的限制。环境不同~同一缩写词也许会引起误解或混淆。因此~为了避免词义不清~在该定义中就应使用全称~而不用缩略语。 28 所有简称在第一次出现时~必须予以说明。 示例1:“潮高” 1,好的定义: 从平均海平面,MSL,到具体潮水平面的垂直距离。 2,不好的定义: 从MSL到具体潮水平面的垂直距离。 原因:不好的定义表达的不清楚~因为缩略语MSL不为人们普遍理解~一些使用者可能需要参阅其他资料才可确定其含义。没有全称~在词汇表中很难找到或根本找不到这个术语。 示例2:“密度计量单位” 1,好的定义: 测量物质密度所使用的单位~以单位体积质量,m.p.u.,表示,例如:磅每立方英尺,千克每立方米,。 2,不好的定义: 测量物质密度所使用的单位~以m.p.u.表示,例如:磅每立方英尺,千克每立方米,。 原因:m.p.u.不是常用的缩略语~一些使用者可能不理解它的含义。对该缩略语应写出全称。 e) 表述中不要加入不同的数据元定义或引用下层概念。 说明:次要的数据元定义或相关概念不应出现在主要数据元定义中。术语的定义应使用相关术语词汇编写。如果需要有次要的数据元定义~可用一个注释~附在主要定义正文的末尾或作为词典的分立条目。相关定义可通过关系属性,例如~相互参照,得到。 示例1:“样品类型码” 1,好的定义:标识样品种类的代码。 2, 不好的定义:标识被采集的样品种类的代码。样品是一个为试验而采集的小样本。它既可用作试验的实际样品~又可用作质量控制的代替样品。质量控制样品是用来检验实际样品结果的代替样品。 原因:不好的定义嵌入了两个与当前定义无关的定义。它们是“样品”的定义和“质量控制样品”的定义。 示例2:“发行银行跟单信用证号码” 29 1,好的定义:由发行银行分配给跟单信用证的号码。 2,不好的定义:由发行银行分配给跟单信用证的号码。跟单信用证是一份文件~ 在此文件中~银行声明它已签发了跟单信用证~凭此跟单信用证~受益人可以 得到支付、接受或按照某些条款和条件进行协商。无须出担保文件和诸如汇票 一类的东西。 原因:不好的定义含有另一个概念定义~这个概念定义应收入词汇表。 9.3.3 指导原则 数据定义宜: a)阐述概念的基本含义。 说明:表述概念的所有基本特性应在该相关环境各相应特性层级的定义中出现。应避免出现非基本特性。是否需要细分层级~取决于系统用户和环境的要求。 示例1:“托运货物装货序号”,预期环境:任何运输形式, 1,好的定义: 指明托运货物在一种运输工具或运输设备中的装载须序号。 2,不好的定义: 指明托运货物在卡车上的装载须序号。 原因:在预期环境下~托运货物可由各种运输方式实现~如卡车、船只或货运列车。托运货物并不仅局限于卡车运输。 示例2:“发票总额” 1,好的定义: 发票上的收费总计。 2,不好的定义: 发票上所列一切收费项目的总计~一方面要考虑减去诸如折扣和让利等数额~另一方面要加上保险费、运输费、装卸费等费用。 原因:不好的定义包含了与主题无关的内容。 b)准确而不含糊。 说明:被定义的概念的确切含义和解释应在定义中一目了然。定义应足够清楚明了~使之只存在一种解释。 示例:“收货日期” 30 1,好的定义: 收货方收到货物的日期。 2,不好的定义: 具体货物被交付的日期。 原因:不好的定义没有说明由什么来决定“货物交付”了。“货物交付”可理解为产品在预期的目的地卸下的行为~也可理解为客户实际收到这个产品的地点。有可能客户根本没有收到已被卸在货场的产品~也许客户在产品被卸在货场的几天之后才收到它。 c)简练。 说明:定义应简洁明了易于理解~应避免使用诸如“为了本数据字典”、“要描述的术语是”之类无关的限定性短语。 示例:“字符集名” 1,好的定义: 给一组表音或表意的符号起的名称~数据用这些符号来编码。 2,不好的定义: 给一组表音或表意的符号起的名称~数据用这些符号来编码。这个数据字典的目的~就像其他地方用的那样~系统硬件和软件的能力就是在多个版本中对编码的数据进行处理。 原因:在不好的定义中~在“数据用这些符号来编码”之后的所有短语~都是无关的限定性短语。 d) 能单独成立。 说明:概念的含义~从定义本身就能体现出来。理解定义的含义~不需要附加说明和引证。 示例:“学校所在城市名” 1,好的定义: 学校所在城市的名称。 2,不好的定义: 见“学校地点”。 原因:不好的定义不能单独成立~它需要借助另一个定义,学校地点,才能理解本定义的含义。 31 e) 表述中不要加入理论说明、功能说明、范围信息或程序信息。 说明:尽管它们通常是必要的~但这样的表述不应归入定义本身~因为它们含有与定义无关的信息。如果认为它们确实有用~可以把这类表述列为不同的数据元属性。 为列举的定义进行说明~不宜作为定义的组成部分,例如:如果一个数据元使用了英里而不用公里~其原因不用在定义中说明,。 诸如“此数据元不应用于…”这样的功能说明不宜出现在定义中。 关于程序方面的注释~例如~“这个数据元与数据元×××一同连用”这样的话不宜在定义中出现~而应当按GB/T 18391.3的规定~使用“相关数据参照”和“关系类型”。 示例:“数据字段标记” 1,好的定义: 索引、主题词表、查询、数据库等的数据字段标识。 2,不好的定义: 索引、主题词表、查询、数据库等的数据字段标识。数据字段标识用于诸如摘要、表格中的栏目等信息单元。 原因:不好的定义含有功能的陈述~以“数据字段标识用于…”开始的陈述必须从定义中删去。如果必须有此陈述的话~应将其放在其他属性中。 f) 避免相互依存。 说明:两个定义不应相互要据另一定义来为自身定义。一个定义也不应使用另一个概念的定义作为自身的定义。因为这样会导致定义一个概念时~附加了另一个概念,反之~在定义另一个概念时~又附加了原来已给出的那个概念。 示例:带有不好定义的两个数据元 1,“雇员ID号码”??分配给一位雇员的号码。 2,“雇员” ??对应于雇员ID 号码的人员。 原因:每个定义其含义涉及另一个定义。每个定义都没有指明含义。 g) 相关定义使用相同的术语和一致的逻辑结构。 说明:对相类似的或相关的定义~应使用共同的术语和句法。 示例:两个定义都与相关概念有关~因此应有相同的逻辑结构和相类似的术语。 1,发货日期??供货方发送货物的日期。 2,收货日期??收货方收到货物的日期。 32 原因:使用相同的术语和句法有利于理解。否则~使用者不知道使用同义的术语和变化了的句法是否意味着有一些不同。 10 数据元的分类 对数据元进行分类有几个目的:分类可帮助用户从众多的数据元中找出某个单一的数据元,方便对数据元进行数据管理分析,通过继承使原本借助其他属性,如名称和定义,不能完整表述的语义内容得以表达。 国际规范、通行的数据元分类一般通过数据元的分类模式和数据元的分类属性来进行。 10.1 数据元分类模式 规范的数据元的分类模式一般包括:关键字、主题词表、分类法和本体论~其主要作用在于: , 派生和形成抽象数据元和应用数据元 , 确保适当属性和属性值的继承 , 从参照词汇表中派生名称 , 消除歧义 , 辨识上位类、同位类和下位类的数据元概念 , 辨识数据元概念和数据元之间的关系 , 辅助模块化设计的名称和定义的开发 10.1.1 关键字 关键字作为基本属性可应用于对象类、特性、表示、数据元和数据元概念。关键字的描述如下: 名称:关键字 定义:用于数据元检索的一个或多个有意义的字词。 约束:条件选 数据类型:字符串 10.1.2 主题词表术语 主题词表术语能够与数据元和数据元概念关联起来。本标准并没有规定主题词表的结构。11.2中的属性可以用来捕捉与数据元或数据元概念关联的主题词表信息。 33 10.1.3 分类法和本体论分类单元 分类法是基于概化或特化以及集、子集和集隶属关系这样的数学概念的概念或分类单元的层次结构。本体论是关于分类单元的网状结构~目的在于为自然界某些部分提供模型~由关于对象的类别、对象特性以及自然界中该部分对象间可能联系的理论组成。一个本体论可以包括对分类单元的解释以及对符合语法规则的使用做出限定的正式通则。分类法和本体论中的分类单元可能与下列已分类的数据注册成分相关联:对象类、特性、表示类和数据元概念。本部分并不阐明分类法或本体论的结构~但是~列于11.2中的属性将被用来把握此类结构信息。 10.2 数据元的分类属性 数据元的主要成分包括对象类、特性、表示、值域、数据元概念以及数据元本身。它们成为数据元不同的分类需求。对数据元中任何一个成分的分类信息的记录可能用到下列属性~属性的使用应使各分类模式与数据元选定的成分联系起来。 , 分类组分标识符 , 分类组分名称 , 分类模式类型 , 分类模式名称 , 分类模式版本 , 分类模式项类型 , 分类模式项值 例如: , 分类组分标识符=对象类的标识符,如~CC0001,, , 分类组分名称=对象类,如~果蝇,, , 分类模式类型=分类法, , 分类模式名称=国际分类信息系统,生物分类法,, , 分类模式版本=2.1, , 分类模式项类型=分类单元标识符, , 分类模式项值=5411。 或 , 分类模式项类型=分类单元术语, 34 , 分类模式项值=果蝇。 图4刻画了分类属性间的关系。 图4 管理组分的分类属性及其用法示例 10.3 分类属性描述 10.3.1 分类组分标识符 定义:在语言上中性的、唯一且明确无误的标识符~用于标识和引用某个已分类 组分。 约束:条件选。 条件:如果分类项将被记录则为必要。 数据类型:字符串。 备注:示例:CC0001。 10.3.2 分类组分名称 定义:以分类为条件的数据元组分的名称~如对象类、特性、表示类、值域、数 据元概念和数据元。 约束:条件选。 条件:如果分类项将被记录则为必要。 数据类型:字符串。 35 备注:示例:对象类。 10.3.3 分类模式类型 定义:从中抽取分类项的分类模式的类型。 约束:条件选。 条件:如果分类项将被记录则为必要。 数据类型:字符串。 备注:示例:分类法。 10.3.4 分类模式标识符 定义:在语言上中性的、唯一的且明确无误的标识符~用于标识和引用某个已分 类组分。 约束:条件选。 条件:如果分类项将被记录则为必要。 数据类型:字符串。 备注:示例:CS0001。 10.3.5 分类模式名称 定义:从中抽取分类项的特定分类模式的名称。 约束:条件选。 条件:如果分类项将被记录则为必要。 数据类型:字符串。 备注:示例:Kenworthey 分类法 10.3.6 分类模式版本 定义:从中抽取分类项的特定分类模式的版本。 约束:条件选。 条件:如果分类项将被记录则为必要。 数据类型:字符串。 备注:示例:“版本2.1”。 10.3.7 分类模式项类型 定义:11.3.8中“分类模式项值”的类型。 约束:条件选。 36 条件:如果分类项将被记录则为必要。 数据类型:字符串。 备注:示例:“非智能标识符”、“术语”、“定义”。 10.3.8 分类模式项值 定义:一个分类模式项的名称、标识符或定义等的一个实例。 约束:可选。 条件:如果分类项已被记录则为必须。 数据类型:字符串。 备注:示例:在分类法的分类单元中~“5411”就是“非智能标识符”类型值的例子~ “果蝇”就是用来标识分类法中节点的“术语”类型值的例子 11 数据元的注册与管理 对于数据元的管理~采用动态维护的办法。对需要注册的数据元~应逐一赋予国际注册数据标识符,IRDI,。该标识符值唯一地标识数据元~它由三个标识属性值的组合来确定的: a)赋予注册机构的标识符~称为注册机构标识符,RAI,, b)注册机构,PA,赋予一个数据元的标识符~称为数据标识符(DI), c)赋予一个版本的标识符~用以提交或修改数据元注册~称为版本标识符,VI,。 一个数据元至少需要一个注册数据标识符~由注册机构分配。数据标识符在一个注册机构的范围内必须是唯一的。 由于每个注册机构可以决定其各自的分配 方案 气瓶 现场处置方案 .pdf气瓶 现场处置方案 .doc见习基地管理方案.doc关于群访事件的化解方案建筑工地扬尘治理专项方案下载 ~因此不能保证某注册机构的数据标识符能唯一标识一个数据元。例如~如果两个注册机构都用连续的6位号码~就会有一组数据元有相同的DI~而且完全有可能~不同的数据元具有相同的DI。相反~如果同一个数据元在两处机构注册~它就有两个DI。因此~对一个数据元的标识不仅需要DI还需要RAI。 如果数据元的特定属性改变了~就应产生并注册数据元的新版本~在这种情况下就需要VI来完成对数据元的唯一标识。 注册机构、主管机构及提交机构的设定、作用和职责以及数据元的注册程序请参考《GB/T 18391.6—2001 信息技术 数据元的规范与标准化 第6部分:数据元的注册》。 37 附录,资料性附录, 该附录讨论元数据和数据元之间的关系。 A.1什么是元数据 通常~元数据被定义为“关于数据的数据”~但是该定义并不确切~因而会导致歧义和混乱。实际上~元数据是一种信息和文献~它使得数据在经历了时间的推移后~对于用户来说~依然具有可理解性和共享性。它使得在元数据可获得的情况上,数据依然是有用的、可共享以及可理解的。 所有产生数据的组织都有义务提供,生成,必要的元数据~使得数据对于它的内部和外部用户都是可理解的。仅仅使用户可以获得数据~而缺乏理解和解释数据必要的信息显然是不够的。 每一个提供数据的组织还有一个义务就是对元数据的成分及构成~给出确切的定义。其原因包括三个方面: a) 在一定的相关环境中~必须对数据和元数据给出明确的界定, b) 元数据的整个范围必须被确定~即:充分、全面地描述数据所必需的所有元数据, c) 由于每一个组织对元数据的需求和应用都相差甚远~因而无法对元数据给出一个普遍可以接受的定义。 因为元数据也是数据~因此也可以像对数据库中其它类型的数据一样~在其储存库中~对元数据进行存储和检索。有序地存储和应用元数据~就可能使数据得到迅速、有效的使用。通过联机数据传播、发送~数据及其元数据就可以同时获得。这样~数据用户就可以通过元数据来了解其需要用的数据的信息。 由于各种组织提供了不同类型的数据~因此~对元数据也有不同的需要和要求。但是~元数据宽泛的分类模式使之在不同组织间具有更多的共性。一个普遍确立的分类模式是: a) 系统??计算机程序设计及数据库管理所必需的物理及逻辑特征~包括文件的定位、存储介质、记录格式、数据库模式、数据字典等信息, b,应用??数据理解和应用所必需的信息~以及术语定义、搜集程序和工具、数据采集处理等信息, 38 c) 管理??成本、时间表、预算及与数据搜集项目、分析管理的相关信息。 综上所述~元数据是数据~并且就形式而言~可以依据数据模型和元模型进行组织。 对元数据的全面理解是所有数据用户建立此类模型的首要步骤。这些模型将成为建立元数据库的基础。同时这些模型也成为一些元数据分类的依据~因而~它们也成了分类方案的部分。 关于元数据的另一种观点则考虑了数据和元数据的可能用户的因素。每一类型的用户会有不同的需求~而且一些用户的需求是互不重叠的。一个程序员也许只需知道系统的元数据~而一个管理人员可能只想看看管理元数据。通常~数据分析员有更为广泛的需求~特别当他们是数据提供组织的外部用户时。总之~不同类型的用户~其需求,基于他们利用数据要回答和解决问题的类型,和水平都会对生成适合于他们的元数据产生影响。 A.2数据元、元数据、元模型 有关数据元的相关信息是元数据的不可缺少的组成部分。GB/T 18391.2至GB/T 18391.6是这样描述元数据的:一个组织的数据元必须具备元数据。这些元数据将便于用户理解和共享该组织的数据。对于潜在的数据用户来说~分类、基本特性、定义、命名和注册是信息的最主要的几个方面。 将元数据存储于一个库中并使之条理化就需要建模。GB/T 18391.2至GB/T 18391.6是这样描述信息元模型的:元模型是从一个注册系统或库中获取信息所必需的。开发这样的元模型是一件不太容易的事情~但它的开发将大大地增加该标准实施的有用性。 元数据不可能涵盖理解数据元所要表示的数据所必需的所有信息。许多关于数据的内容和管理元数据及组织在该标准中是缺省的~而计算机处理的元数据几乎也是缺省的。例如~一个收集调查资料的组织将会有许多关于如何收集数据的信息。这些诸如样本和问卷设计等常常是理解数据所必要的。但是~样本和问卷设计并不是用来表示和描述数据元的元数据的一部分,源自GB/T 18391,。 确立一个宽泛的元模型将有可能对额外的元数据进行描述。内容、计算机处理和管理区域均超出了GB/T 18391的范围~它们都需要开发自己的元模型和数据模型。可扩展性将会使新模型拥有自己的位臵~以适应于基本的数据元的元模型。这样~就可以建立起一个更加完善的模型。 39 40
本文档为【医药卫生数据元标准】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: 免费 已有0 人下载
最新资料
资料动态
专题动态
is_014457
暂无简介~
格式:doc
大小:175KB
软件:Word
页数:57
分类:企业经营
上传时间:2017-11-26
浏览量:56