首页 决策树c4.5论文

决策树c4.5论文

举报
开通vip

决策树c4.5论文决策树c4.5论文 摘 要 数据挖掘(,,)是当前涉及统计学、人工智能、数据库等学科的热门的研究领域,是从数据中提取人们感兴趣的、潜在的、可用的知识,并表示成用户可理解的形式。分类是数据挖掘的一个重要分支,分类能找出描述数据类或概念的模型,以便能使用模型预测类标记未知的对象类。 最早的决策树算法是由Hunt等人于1966年提出的CLS。当前最有影响的决策树算法是Quinlan于1986年提出的ID3和1993年提出的C4.5。ID3只能处理离散型描述属性,它选择信息增益最大的属性划分训练样本,其目的是进行分枝...

决策树c4.5论文
决策树c4.5论文 摘 要 数据挖掘(,,)是当前涉及统计学、人工智能、数据库等学科的热门的研究领域,是从数据中提取人们感兴趣的、潜在的、可用的知识,并表示成用户可理解的形式。分类是数据挖掘的一个重要分支,分类能找出描述数据类或概念的模型,以便能使用模型预测类标记未知的对象类。 最早的决策树算法是由Hunt等人于1966年提出的CLS。当前最有影响的决策树算法是Quinlan于1986年提出的ID3和1993年提出的C4.5。ID3只能处理离散型描述属性,它选择信息增益最大的属性划分训练样本,其目的是进行分枝时系统的熵最小,从而提高算法的运算速度和精确度。ID3算法的主要缺陷是,用信息增益作为选择分枝属性的标准时,偏向于取值较多的属性,而在某些情况下,这类属性可能不会提供太多有价值的信息。C4.5是ID3算法的改进算法,不仅可以处理离散型描述属性,还能处理连续性描述属性。C4.5采用了信息增益比作为选择分枝属性的标准,弥补了ID3算法的不足。 本文研究的是基于决策树的分类技术。运用了C4.5算法将一组数据进行分类并生成决策树,首先对数据进行处理,利用归纳算法生成可读的规则和决策树,然后使用决策对新数据进行分析。 关键词:数据挖掘;分类技术;决策树;C4.5 I 西北师范大学数信学院本科论文 Abstract Data mining ( DM ) is relevant to statistics, artificial intelligence, database and other disciplines hot research field, is extracted from the data of interest, potential, the available knowledge, and understandable form. Classification is an important branch of data mining, classification can find to describe the data type or conceptual model, so as to use the model to predict the class label unknown object class. The earliest decision-making algorithms is CLS-1966, by Hunt et al. The most influential decision tree algorithm is ID3 proposed by Quinlan in 1986 and 1993, the C4.5. ID3 can handle only a discrete description of property, it chooses the information to gain the greatest attribute divided training samples, the purpose is carried branching entropy of the system, thereby improving the computational speed and accuracy of the algorithm. The major drawback of the ID3 algorithm, information gain as the choice of branches properties of the standard, biased in favor of the more the value of the property, and in some cases, these properties may not provide much valuable information. C4.5 is the ID3 algorithm, the improved algorithm can handle not only the discrete description of property, can handle continuous description of the property. C4.5 uses information gain ratio as the standard to select the branching property, to make up for the lack of ID3 algorithm. Of this study is based on decision tree classification techniques. Use of a set of data classification and generates a decision tree algorithm C4.5, the first data processing, the use of rules and decision tree induction algorithm to generate readable, and then use the decision-making to analyze the new data. Keywords: Data mining; classification; decision tree;C4.5 II 西北师范大学数信学院本科论文 目录 第一章 绪论 ................................... 1 1.1 研究背景及意义 .................................................................................................. 1 1.2 国内外研究现状 .................................................................................................. 2 1.2.1 国外研究现状 ............................................................................................ 2 1.2.2 国内研究现状 ............................................................................................ 3 第二章 文献综述 ............................. , 2.1数据挖掘发展简述 ............................................................................................. , 2.2数据挖掘基本知识 ............................................................................................. , 2.3数据挖掘功能 .................................................................................................... , 2.3.1概念描述:定性与对比............................................................................. , 2.3.2关联分析.................................................................................................. , 2.3.3分类与预测 .............................................................................................. , 2.3.4聚类分析............................................................................................... ,, 2.3.5异类分析............................................................................................... ,, 2.3.6演化分析............................................................................................... ,, 第三章 决策树算法 .......................... ,, 3.1决策树的定义 ................................................................................................. ,, 3.2决策树的优点 ................................................................................................. ,, 3.3决策树结构图 ................................................................................................. ,, 3.4决策树的建立 ................................................................................................. ,, 3.5树剪枝 ............................................................................................................ ,, 3.6生成分类规则 ................................................................................................. ,, 第四章 用C4.5算法实现weather数据的分类 ...... ,, 4.1 ID3算法的缺点 .............................................................................................. ,, 4.2 C4.5算法做出的改进 ................................................................................... ,, 4.2.1用信息增益率来选择属性 ...................................................................... ,, 4.2.2可以处理连续数值型属性 ...................................................................... ,, 4.2.3采用了一种后剪枝方法.......................................................................... ,, 4.2.4对于缺失值的处理................................................................................. ,, 4.3 C4.5算法的优缺点......................................................................................... ,, 4.4 将“weather”数据分类................................................................................... ,, 4.4.1 数据及属性分析 ................................................................................... ,, III 西北师范大学数信学院本科论文 4.4.1 weather数据的分类结果 ....................................................................... ,, 第五章 结论 ................................ ,, 参 考 文 献 ................................... I IV 第一章 绪论 1.1 研究背景及意义 近年来,随着计算机技术的不断发展,我们存储的信息数据越来越多,如何发现信息数据背后隐藏的知识,进一步指导我们的行业行为是我们面临的一个重要问题。数据挖掘技术正是为解决上述问题而产生的,它能找出数据之间的潜在联系,进行更高层次的分析,以便更好的做出理想的决策,预测未来的发展趋势。经过近几年的发展,数据挖掘已越来越现实出其强大的生命力。 数据挖掘的核心部分是为数据集建立模型的过程,不同的数据挖掘方法构造数据模型的方式也不相同,在进行数据挖掘时可采用许多不同的方法,如神经网络、决策树、遗传算法和可视化技术等。数据分类是数据挖掘中的一项重要功能。用于数据分类的方法有很多,如决策树方法,贝叶斯网络,遗传算法,基于关联的分类方法,粗糙集,k-最邻近方法等。其中,决策树方法是数据分类常用的方法之一,与其它分类方法相比决策树方法具有如下显著优点: (1)速度快:计算量相对较小,且容易转化成分类规则。只要沿着树根向下一直走到叶,沿途的分裂条件就能唯一确定一条分类的规则。 (2)准确性高:跟其它分类方法相比,利用决策树挖掘出的分类规则准确性更高,能更好的指导人们的决策。 (3)易被人理解:决策树不需要使用者了解很多背景知识,且生成规则简单,还可以清晰的显示哪些字段比较重要。 (4)可伸缩性强:既可用于小数据集,也可用于海量数据集。 目前,基于决策树的数据挖掘技术已被广泛应用于各个领域:在零售业,其应用主要涉及客户细分和交叉销售等方面;在金融业,其应用突出表现在信用评估和防止欺诈等方面;在电信业,其最突出表现是其在客户保持方面的应用;在电子商务领域,其在在线销售、数字销售、网络广告、客户关系管理等诸多方面有着广泛的应用;在气象领域,其在预测严重暴风雨方面有重要应用;在安全反恐领域,数据挖掘可以解决视频图像序列中的动作识别问题,能给专家提供重要 1 西北师范大学数信学院本科论文 的技术支持。 基于决策树的数据挖掘技术目前还存在以下问题: (1)信息增益方法偏向于选择取值较多的属性,即内偏置问题。该问题造成了决策树容易过分拟合、规模过大、产生的规则长度过长等缺点。 (2)计算效率较低。目前的决策树算法在进行属性选择时多数都采用基于信息熵的理论,由于计算信息熵的时间复杂度较高,并且决策树的构造是一个循环递归的过程,多次计算将导致复杂的计算费用。 (3)测试属性约简问题。目前的测试属性约简算法还不够成熟,现有的决策树算法大多都针对原始的训练集进行构建,没有经过测试属性的约简,从而导致算法增加了大量的多余计算。 (4)决策树剪枝问题。随机噪声和某些决策仅取决于少量的训练数据,都会导致决策树的分类精度下降,并且过度拟合训练数据集。解决这些问题主要是通过对决策树进行剪枝来实现的。目前的剪枝算法在精度和复杂度方面还不够理想,有待进一步改进。 1.2 国内外研究现状 1.2.1 国外研究现状 目前,决策树技术已经在许多数据挖掘系统中得到研究者的关注,国内外许多公司均已推出自己的数据挖掘系统,其中大多都采用决策树方法。 比较成熟的决策树算法有ID3,C4.5,CHAID,CART,PUBLIC,SLIQ,SPRINT等。C4.5算法是QUINLAN本人针对ID3算法提出的一种改进算法,1993年,QUINLAN出版了专著《机器学习规则》对C4.5算法进行详细描述。CHAID算法是GORDON.B.KASS博士在1976年提出的,可用来对分类性数据进行挖掘。CART算法从1984年开始得到普及推广,可对连续性因变量进行处理。PUBLIC算法是RAJEEV,RASTOGI等人在2000年提出的,它不但继承了CART算法建树的基本原理,而且还使用了更加高效的剪枝策略。SLIQ算法可以处理大规模的训练样本集,具有较好的伸缩性,但对主存容量要求较高。JHON SHAFER 等人提出SPRINT算法的目的就是要彻底解决主存容量的限制,与SLIQ相比,SPRINT算法完全摆脱了主存容量的限制,同时也具有并行性。 2 西北师范大学数信学院本科论文 针对现有决策树算法的不足,很多研究人员尝试在控制决策树决策树的精度方面做出努力,通过研究各种预剪枝算法和后剪枝算法来控制树的规模,同时在修改测试属性空间、改进测试属性选择方法、限制数据集、改变数据结构等方面提出了新的算法和标准。 1.2.2 国内研究现状 与国外相比,国内对数据挖掘的研究稍晚,没有形成整体力量。1993年国家自然科学基金首次支持对该领域的研究项目。目前,国内的许多科研单位和高等院校竞相开展知识发现的基础理论及其应用研究,这些单位包括清华大学、中科院计算技术研究所、空军第三研究所、海军装备论证中心等。其中,北京信息工程研究所对模糊方法在知识发现中的应用进行了较深入的研究,北京大学也在开展对数据立方体代数的研究,华中理工大学、复旦大学、浙江大学、中国科技大学、中科院数学研究所、吉林大学等单位开展了对关联规则开采算法的优化和改造,南京大学、四川联合大学和上海交通大学等单位探讨、研究了非结构化数据的知识发现以及WEB数据挖掘。 3 第二章 文献综述 数据挖掘作为一个新兴的多学科交叉应用领域,正在各行各业的决策支持活动扮演着越来越重要的角色。 2.1数据挖掘发展简述 随着计算机硬件和软件的飞速发展,尤其是数据库技术与应用的日益普及,人们面临着快速扩张的数据海洋,如何有效利用这一丰富数据海洋的宝藏为人类服务,业已成为广大信息技术工作者的所重点关注的焦点之一。与日趋成熟的数据管理技术与软件工具相比,人们所依赖的数据分析工具功能,却无法有效地为 了一种独特的现象“丰富的决策者提供其决策支持所需要的相关知识,从而形成 数据,贫乏的知识”。为有效解决这一问题,自二十世纪80年代开始,数据挖掘技术逐步发展起来,数据挖掘技术的迅速发展,得益于目前全世界所拥有的巨大数据资源以及对将这些数据资源转换为信息和知识资源的巨大需求,对信息和知识的需求来自各行各业,从商业管理、生产控制、市场分析到工程设计、科学探索等。数据挖掘可以视为是数据管理与分析技术的自然进化产物。 自上个世纪六十年代开始,数据库及信息技术就逐步从基本的文件处理系统发展为更复杂功能更强大的数据库系统;七十年代的数据库系统的研究与发展,最终导致了关系数据库系统、数据建模工具、索引与数据组织技术的迅速发展,这时用户获得了更方便灵活的数据存取语言和界面;此外在线事务处理(OLTP:on-line transaction processing)手段的出现也极大地推动了关系数据库技术的应用普及,尤其是在大数据量存储、检索和管理的实际应用领域。 自上世纪八十年代中期开始,关系数据库技术被普遍采用,新一轮研究与开发新型与强大的数据库系统悄然兴起,并提出了许多先进的数据模型:扩展关系模型、面向对象模型、演绎模型等;以及应用数据库系统:空间数据库、时序数据库、多媒体数据库等;日前异构数据库系统和基于互联网的全球信息系统也已开始出现并在信息工业中开始扮演重要角色。 , 西北师范大学数信学院本科论文 图2. 1数据挖掘进化过程示意描述 2.2数据挖掘基本知识 数据挖掘(Data Mining,简称DM),简单地讲就是从大量数据中挖掘或抽取出知识,数据挖掘概念的定义描述有若干版本,以下给出一个被普遍采用的定义描述: 数据挖掘,又称为数据库中知识发现(Knowledge Discovery from Database,简称KDD),它是一个从大量数据中抽取挖掘出未知的、有价值的模式或规律等知识的复杂过程。数据挖掘的全过程定义描述如图2. 所示。 , 西北师范大学数信学院本科论文 图2. 2知识挖掘全过程示意描述 如图2. 所示,整个知识挖掘(KDD)过程是由若干挖掘步骤组成,而数据挖掘仅是其中的一个主要步骤。整个知识挖掘的主要步骤有: ?,数据清洗(data clearning),其作用就是清除数据噪声和与挖掘主题明显无关的数据; ?,数据集成(data integration),其作用就是将来自多数据源中的相关数据组合到一起; ?,数据转换(data transformation),其作用就是将数据转换为易于进行数据挖掘的数据存储形式; ?,数据挖掘(data mining),它是知识挖掘的一个基本步骤,其作用就是利用智能方法挖掘数据模式或规律知识; ?,模式评估(pattern evaluation),其作用就是根据一定评估标准(interesting measures)从挖掘结果筛选出有意义的模式知识; ?,知识表示(knowledge presentation),其作用就是利用可视化和知识表达技术,向用户展示所挖掘出的相关知识。 尽管数据挖掘仅仅是整个知识挖掘过程中的一个重要步骤,但由于目前工业界、媒体、数据库研究领域中,“数据挖掘”一词已被广泛使用并被普遍接受,因此也可以广义地使用“数据挖掘”一词来表示整个知识挖掘过程,即数据挖掘 , 西北师范大学数信学院本科论文 就是一个从数据库、数据仓库或其它信息资源库的大量数据中发掘出有趣的知识。 图2. 3数据挖掘系统总体结构描述 基于图2. 所示的数据挖掘过程,一个典型的数据挖掘系统(如图2. 所示)主要包含以下主要部件: ?,数据库、数据仓库或其它信息库,它表示数据挖掘对象是由一个(或组)数据库、数据仓库、数据表单或其它信息数据库组成。通常需要使用数据 清洗和数据集成操作,对这些数据对象进行初步的处理; ?,数据库或数据仓库服务器,这类服务器负责根据用户的数据挖掘请求,读取相关的数据; , 西北师范大学数信学院本科论文 ?,知识库,此处存放数据挖掘所需要的领域知识,这些知识将用于指导数据挖掘的搜索过程,或者用于帮助对挖掘结果的评估。挖掘算法中所使用的用户定义的阈值就是最简单的领域知识; ?,数据挖掘引擎,这是数据挖掘系统的最基本部件,它通常包含一组挖掘功能模块,以便完成定性归纳、关联分析、分类归纳、进化计算和偏差分析等挖掘功能; ?,模式评估模块,该模块可根据趣味标准(interestingness measures),协助数据挖掘模块聚焦挖掘更有意义的模式知识。当然该模块能否与数据挖掘模块有机结合,与数据挖掘模块所使用的具体挖掘算法有关。显然若数据挖掘算法能够与知识评估方法有机结合将有助提高其数据挖掘的效率; ?,可视化用户界面,该模块帮助用户与数据挖掘系统本身进行沟通交流。一方面用户通过该模块将自己的挖掘要求或任务提交给挖掘系统,以及提供挖掘搜所需要的相关知识;另一方面系统通过该模块向用户展示或解释数据挖掘的结果或中间结果;此外该模块也可以帮助用户浏览数据对象内容与数据定义模式、评估所挖掘出的模式知识,以及以多种形式展示挖掘出的模式知识。 从数据仓库的角度来看,数据挖掘可以被认为是在线分析处理(OLAP)的高级阶段,但是基于多种数据理解先进技术的数据挖掘,其数据分析能力要远超过以数据汇总为主的数据仓库在线分析处理功能。 2.3数据挖掘功能 利用数据挖掘技术可以帮助获得决策所需的多种知识。在许多情况下,用户并不知道数据存在哪些有价值的信息知识,因此对于一个数据挖掘系统而言,它应该能够同时搜索发现多种模式的知识,以满足用户的期望和实际需要。此外数据挖掘系统还应能够挖掘出多种层次(抽象水平)的模式知识。数据挖掘系统还应容许用户指导挖掘搜索有价值的模式知识。数据挖掘功能以及所能够挖掘的知识类型说明描述如下。 2.3.1概念描述:定性与对比 一个概念常常是对一个包含大量数据的数据集合总体情况的概述。如对一个 , 西北师范大学数信学院本科论文 商店所售电脑基本情况的概述总结就会获得所售电脑基本情况的一个整体概念。对含有大量数据的数据集合进行概述性的总结并获得简明、准确的描述,这种描述就称为概念描述。获得概念描述的方法主要有以下两种: (1)利用更为广义的属性,对所分析数据进行概要总结;其中被分析的数据就称为目标数据集; (2)对两类所分析的数据特点进行对比并对对比结果给出概要性总结;而其中两类被分析的数据集分别被称为目标数据集和对比数据集。 数据概要总结就是利用数据描述属性中更广义的(属性)内容对其进行归纳描述。其中被分析的数据,常常可以通过简单的数据库查询来获得。如:对我校的讲师情况进行概要总结(给出概念描述)。数据概要总结通常都用更广义的关系表或特征描述规则来加以输出表示。 2.3.2关联分析 关联分析就是从给定的数据集发现频繁出现的项集模式知识。关联分析广泛用于市场营销、事务分析等应用领域。 2.3.3分类与预测 分类就是找出一组能够描述数据集合典型特征的模型(或函数),以便能够分类识别未知数据的归属或类别,即将未知事例映像到某种离散类别之一。分类模型(或函数)可以通过分类挖掘算法从一组训练样本数据(其类别归属已知)中学习获得。 分类挖掘所获的分类模型可以采用多种形式加以描述输出。其中主要的表示方法有:分类规则、决策树、数学公式和神经网络。决策树是一个具有层次结构的树状结构,如图1.7所示就是一个决策树。决策树可以很容易地转换为分类规则。 分类通常用于预测未知数据实例的归属类别(有限离散值),如一个银行客户的信用等级是属于6级、_级还是)级。但在一些情况下,需要预测某数值属性的值(连续数值),这样的分类就被称为预测。尽管预测既包括连续数值的预测,也包括有限离散值的分类;但一般还是使用预测来表示对连续数值的预测;而使 , 西北师范大学数信学院本科论文 用分类来表示对有限离散值的预测。 2.3.4聚类分析 聚类分析与分类预测方法明显不同之处在于,后者所学习获取分类预测模型所使用的数据是已知类别归属,属于有教师监督学习方法;而聚类分析(无论是在学习还是在归类预测时)所分析处理的数据均是无(事先确定)类别归属,类别归属标志在聚类分析处理的数据集中是不存在的。究其原因很简单,它们原来就不存在,因此聚类分析属于无教师监督学习方法。聚类分析中,首先需要根据“各聚集内部数据对象间的相似度最大化;而各聚集对象间相似度最小化”的基本聚类分析原则,以及度量数据对象之间相似度的计算公式,将聚类分析的数据对象划分为若干组。因此一个组中数据对象间的相似度要比不同组数据对象间的相似度要大。每一个聚类分析所获得的组就可以视为是一个同类别归属的数据对象集合,更进一步从这些同类别数据集,又可以通过分类学习获得相应的分类预测模型(规则)。此外通过反复不断地对所获得的聚类组进行聚类分析,还可获得初始数据集合的一个层次结构模型。 .3.5异类分析 2 一个数据库中的数据一般不可能都符合分类预测或聚类分析所获得的模型。那些不符合大多数数据对象所构成的规律(模型)的数据对象就被称为异类。之前许多数据挖掘方法都在正式进行数据挖掘之前就将这些异类作为噪声或意外而将其排除在数据挖掘的分析处理范围之内。但在一些应用场合,如各种商业欺诈行为的自动检测,小概率发生的事件(数据)往往比经常发生的事件(数据)更有挖掘价值。对异类数据的分析处理通常就称为异类挖掘。 数据中的异类可以利用数理统计方法分析获得,即利用已知数据所获得的概率统计分布模型,或利用相似度计算所获得的相似数据对象分布,分析确认异类数据。而偏离检测就是从数据已有或期望值中找出某些关键测度显着的变化。 2.3.6演化分析 数据演化分析就是对随时间变化的数据对象的变化规律和趋势进行建模描 ,, 西北师范大学数信学院本科论文 述。这一建模手段包括:概念描述、对比概念描述、关联分析、分类分析、时间相关数据分析(这其中又包括:时序数据分析、序列或周期模式匹配,以及基于相似性的数据分析)。 ,, 西北师范大学数信学院本科论文 第三章 决策树算法 3.1决策树的定义 决策树(DECISION TREE)是用于分类和预测的主要技术,决策树学习是以实例为基础的归纳学习算法,通过一组无次序、无规则的实例中推理出决策树表现形式的分类规则。 决策树算法是一种逼近离散函数值的方法。它是一种典型的分类方法,首先对数据进行处理,利用归纳算法生成可读的规则和决策树,然后使用决策对新数据进行分析。本质上决策树是通过一系列规则对数据进行分类的过程。 3.2决策树的优点 决策树技术是应用最广泛的分类技术,它具有以下优点: (1)决策树方法能够生成可以理解的规则。 (2)决策树方法的计算量相对其它方法来说比较小,这样可以大大地缩短计算时问,提高系统的效率。 (3)决策树方法可以处理连续和离散数据。 (4)决策树可以清晰地显示出属性的重要程度。 3.3决策树结构图 一般来说,决策树是一个类似于流程图的树结构,其中每个内部节点表示在一个属性上的测试,每个分支代表一个测试输出,而每个节点代表类或类分布,树的最顶层节点是根节点。更明确的说,决策树是根据根节点到叶节点的顺序对实例进行分类,其中,每个节点代表一个属性,每个分支代表它所连接的上节点在其属性上的可能取值。 在决策树的基本结构图中,中间节点常用矩形表示,叶子节点用椭圆形表示,如下图所示。 ,, 西北师范大学数信学院本科论文 属性A a1 a3 a2 属性B 属性C 类1 b1 b2 c1 c2 类1 类2 类1 类2 它采用自顶向下的递归方式,在决策树的内部节点进行属性值的比较,并根 据不同的属性值判断从该节点向下的分枝,在决策树的叶节点得到结论,整个过 程都是以新节点为根的子树上重复。举例来说,一个实例的分类是从树的根节点 开始,测试该节点所代表的属性,然后沿属性取值的某个分枝向下移动,不断重 复这个过程,直至到达叶节点,即得到该实例所属的类。从根节点到叶节点的每 一条路径就对应着一组属性测试的合取规则,整个决策树就代表实例属性值约束 的合取的析取表达规则。这样就很容易转换成IF—THEN形式的分类规则,根据这个分类规则就可以比较容易对未知数据对象进行分类识别和预测。 用决策树进行分类主要包含两步。第一步是利用训练数据集构造一棵决策树 模型。这个过程实际上是一个从数据中获取知识,进行机器学习的过程。第二步 是利用已经生成的决策树模型对未知输入的数据样本进行分类。对输入的记录, 从根节点依次测试记录的属性值,直到到达某个叶子节点,从而找到该记录所在 的类。在这两个过程中关键是决策树的构造。 3.4决策树的建立 决策树的建立过程主要由两个阶段组成:第一阶段,建树阶段。选取训练 数据集进行学习,导出决策树。决策树归纳的基本算法是贪心算法,它采用的是 自项向下递归的各个击破方式来构建判定树,算法概述如下。第二阶段,剪枝阶 段。用测试数据集检验决策树,如果所建立的决策树不能正确回答所研究的问题, ,, 西北师范大学数信学院本科论文 我们要对决策树进行剪枝以解决过分适应数据问题,直到建立一棵正确的决策 树,目的是降低由于训练集的噪声而产生的起伏。 建立决策树的算法可以被描述成一个递归的过程:首先,选择训练样本的一 个属性作为节点,对该属性的每种可能的取值创建一个分枝,并据此将训练样本 划分为几个子集。然后,对每个分枝采取相同的方法,训练样本是其父节点划分 的若干子集中的对应于该分枝取值的那个样本子集。当以下情况出现时停止该节 点分枝的分裂,并使其成为叶节点: (1)给定节点的所有训练样本属于同一类 (2)没有剩余属性可以用来进一步划分样本 (3)该分枝没有样本。 建立决策树的算法如下: 算法:Generate_decision_tree由给定的训练数据产生一棵判定树。 输入:训练样本samples,由离散值属性表示;候选属性的集合attribute_jist。 输出:一棵判定树。 方法: ; (1)创建节点N (2)If samples都在同一个类C then (3)返回N作为叶节点,以类C标记: (4)If attribute_list为空。then (5)返回N作为叶节点,标记为samples中最普通的类; (6)选择attribute_list中具有最高信息增益的属性test_attribute; (7)标记节点为test_attribute: (8)For each test_attribute中的已知值ai: (9) 由节点N长出一个条件为test_attribute=a(的分枝: (10)设S1是samples中test—attribute=a(的样本的集合: (1I)If S1为空,then (12)加上一个树叶,标记为samples中最普通的类; (13)Else 加上一个由 Generate_decision_tree (s1, attribute_1ist_test_attribute)返回的节点。 ,, 西北师范大学数信学院本科论文 说明如下: 1、决策树开始时,作为一个单个结点(根节点)包含所有的训练样本集。 2、若一个节点的样本均为同一类别,则该节点就成为叶节点并标记为该类别。 3、否则该算法将采用信息熵方法(信息增益)作为启发信息来帮助选择合适 的属性,以便将样本分为若干子集。这个属性就成为该节点的测试属性。 在算法中,所有属性均为离散值,若有取连续值的属性,就必须首先进行 离散化。 4、一个测试属性的每个值均对应一个将要被创建的分枝,同时也对应着一个 被划分的子集。 5、算法递归使用上述各处理过程,针对所获得的每个划分均又获得一个决策 树。若一个属性一旦在某个节点出现,那它就不能再出现在该节点之后所 产生的子树节点中。 6、算法递归操作停止的条件是: (1)一个节点的所有样本均为同一类别。 (2)若无属性可用于当的样本集,这里用少数服从多数的原则,将当前节 成叶节点,并标记为当前所合样本集中类别个数最多的类别。 点标记 (3)没有样本满足条件,则创建一个叶节点并将其标记为当前节点所含样 本集中类别个数最多的类别。 3.5树剪枝 通常在实际应用中,直接生成的完全决策树不能立即用于对未知样本进行分 类。由于完全决策树对训练样本的特征描述得“过于精确”,无法实现对新样本 的合理分析,所以此时它不是一棵分析新数掘的最佳决策树。一棵完全决策树能 准确地反映训练集中数据特征,但因失去了一般代表性而无法用于对新数据的分 类或预测,这种现象称为“过适应”。解决过适应问题的主要方法是对决策树进 行剪枝。 剪枝(Pruning)方法的主要目的是去掉那些噪声或异常数据,使决策树具有 更泛化能力。剪枝常采用统计度量,剪掉最不可靠的分枝,从而带来较快的分类, 提高树独立于测试数据进行证确分类的能力。 ,, 西北师范大学数信学院本科论文 剪枝按其实施的时间分为两种方法:事前修剪法和事后修剪法。 (1)事前修剪法 该方法通过提前停止树的构造而对树“剪枝”,即通过在当前节点上判断是 否需要继续划分该节点所含训练样本集来实现。一旦停止,节点不再继续分裂, 当前节点就成为一个叶节点。该叶节点中可能包含多个不同类别的训练样本,由 于该修剪是在分枝之前做出的,所以称之为事前修剪。 事前修剪法的优点是在树生成的同时进行了剪枝,因而效率高,但是它可能 剪去了某些有用但还没生成的节点。常用的方法是设定决策树的最大高度(层数) 来限制树的生长。还有一种方法是设定每个节点必须包含的最少记录数,当节点 中记录的个数小于这个数值时就停止分割。然而,选择一个适当的阈值是比较困 难的,较高的阈值可能导致过分简化的树,而较低的阈值可能会导致多余树枝无 法修剪。 (2)事后修剪法 该方法是由完全生长的树剪去分枝。通过删除节点的分枝,剪掉树节点。它 在允许决策树得到最充分生长的基础上,再根据一定的规则,剪去决策树中的那 些不具有一般代表性的叶节点或分枝。修剪后,被修剪的分枝节点就成为一个叶 节点,并将其标记为它所包含样本中类别个数最多的类别。 事后修剪是一边修剪一边检验的过程,一般规则是:当树建好之后,对每个 内部节点,首先计算该节点上的子树被剪枝可能出现的错误率,然后,使用每个 分枝的错误率,结合沿每个分枝观察的权重评估,计算不对该节点剪枝的期望错 误率。如果剪掉该节点能够降低错误率,那么该节点的所有子节点就被剪掉,该 节点成为叶节点。产生一组逐渐被剪枝的树之后,使用一个独立的测试集评估每 棵树的准确率,就能得到具有最小期望错误率的决策树。 当然也可以结合使用事前修剪和事后修剪,形成混合的修剪方法。事后修剪比事前修剪需要更多的计算时阃,但通常产生的决策树更为可靠。 3.6生成分类规则 决策树构造完毕后,就可以由决策树直接提取出分类规则,并以IF-THEN形 式来表示规则。对从根到叶节点的每条路径创建一个规则。沿着给定路径上的每 ,, 西北师范大学数信学院本科论文 个属性-值对形成规则前件(IF部分)的一个合取项。叶节点包含类预测,形 成规则的后件(THEN部分)。如下图是已生成的一棵决策树,其中年龄属性的 Attributes={青,中,老},学生属性的Attributes={是,否},信誉属性的 Attributes={优,良),BuyComputer={买,不买},其中BuyComputer是一个类。 由此决策树,我们可提取出的规则是: 年龄 青 中 老 学生 信誉 买 否 是 优 良 不买买 不买 买 买 IF年龄=“青”AND学生=“否”THEN BuyComputer=“不买” IF年龄=“青”AND学生=“是”THEN BuyComputer=“买” IF年龄=“中”THEN BuyComputer=“买” IF年龄=“老”AND信誉=“优”THEN BuyComputer=“不买” IF年龄=“老”AND信誉:“良”THEN BuyComputer=“买” ,, 西北师范大学数信学院本科论文 第四章 用C4.5算法实现weather数据的分类 4.1 ID3算法的缺点 (1)ID3算法在选择根节点和各内部节点中的分支属性时,采用信息增益作为评 价标准。信息增益的缺点是倾向于选择取值较多的属性,在有些情况下这类 属性可能不会提供太多有价值的信息。 (2)ID3算法只能对描述属性为离散型属性的数据集构造决策树。 4.2 C4.5算法做出的改进 4.2.1用信息增益率来选择属性 克服了用信息增益来选择属性时偏向选择值多的属性的不足。信息增益率定义为: 其中Gain(S,A)与ID3算法中的信息增益相同,而分裂信息SplitInfo(S,A)代表了按照属性A分裂样本集S的广度和均匀性。 其中,S到Sc是c个不同值的属性A分割S而形成的c个样本子集。 1 如按照属性A把S集(含30个用例)分成了10个用例和20个用例两个集合 则SplitInfo(S,A)=-1/3*log(1/3)-2/3*log(2/3) ,, 西北师范大学数信学院本科论文 4.2.2可以处理连续数值型属性 C4.5既可以处理离散型描述属性,也可以处理连续性描述属性。在选择某节点上的分枝属性时,对于离散型描述属性,C4.5的处理方法与ID3相同,按照该属性本身的取值个数进行计算;对于某个连续性描述属性Ac,假设在某个结点上的数据集的样本数量为total,C4.5将作以下处理。 (1)将该结点上的所有数据样本按照连续型描述属性的具体数值,由小到大进行排序,得到属性值的取值序列{A1c,A2c,„„Atotalc}。 (2)在取值序列中生成total-1个分割点。第i(0 表格 关于规范使用各类表格的通知入职表格免费下载关于主播时间做一个表格详细英语字母大小写表格下载简历表格模板下载 线,WORD 表格上下竖线不能对齐,用鼠标拖动其中一条线,可是一拖就跑老远,想微调表格竖线让上下对齐,请问该怎么办, 答:选定上下两个单元格,然后指定其宽度就可以对齐了,再怎么拉都行pressAlt,打开绘图,其中有个调整坐标线,单击,将其中水平间距与垂直间距都调到最小值即可。打开绘图,然后在左下脚的绘图网格里设置,把水平和垂直间距设置得最小。 13. 问:怎样微调word 表格线,我的word 表格上下竖线不能对齐,用鼠标拖动其中一条线,可是一拖就跑老远,我想微调表格竖线让上下对齐,请问该怎么办, 答:可以如下操作:?按住ctl 键还是shift,你have a try?double click the line, try it )?打开绘图,设置一下网格(在左下角)。使水平和垂直都为最小,试一把~,?press Alt 14. 问:怎么把word 文档里已经有的分页符去掉, 答:先在工具―― 选项―― 视图―― 格式标记,选中全部,然后就能够看到分页符,delete 就ok了。 III 西北师范大学数信学院本科论文 15. 问:Word 中下标的大小可以改的吗 答:格式―字体 16. 问:Word 里怎么自动生成目录啊 答:用“格式样式和格式”编辑文章中的小标题,然后插入-索引和目录 17. 问:Word 的文档结构图能否整个复制 论文要写目录了,不想再照着文档结构图输入一遍,有 办法 鲁班奖评选办法下载鲁班奖评选办法下载鲁班奖评选办法下载企业年金办法下载企业年金办法下载 复制粘贴过来吗, 答:可以自动生成的,插入索引目录。 18. 问:做目录的时候有什么办法时右边的页码对齐,比如:1.1 标题..........11.2 标题...............2 答:画表格,然后把页码都放到一个格子里靠右或居中,然后让表格的线条消隐就可以了,打印出来就很整齐。 19. 问:怎样在word 中将所有大写字母转为小写,比如一句全大写的转为全小写的答:格式-更改大小写-小写 20. 问:在存盘的时候,出现了问题,症状如下:磁盘已满或打开文件过多,不能保存,另开新窗口重存也不管用。如何解决, 答:把word 文档全选,然后复制,然后关掉word,电脑提示你粘贴板上有东西,要不要用于别的程序,选是,然后,再重 新打开word,然后粘贴,然后,保存。 21. 问:WORD 中的表格一复制粘贴到PPT 中就散掉了,怎么把WORD 里面的表格原样粘贴到PPT 中, 答:1)比较好的方法是:先把表格单独存为一WORD 文件,然后插入,,对象,选由文件创建,然后选中上面的WORD 文件,确定;2)还可以先把表格copy 到excel 中,然后copy 到PPT 中,这个也是比较好的办法;3)可以先做成文本框,再粘贴过去;4)复制粘贴,但是在PPT 中不能粘在文本框里面;5)拷屏,做成图片,再弄到PPT 里面。 22. 问:有没有办法将PPT 的文字拷入WORD 里面, 答:另存就可以了。只要以.rtf 格式另存即可 23. 问:word 中图片的分栏如何处理,假如有:1 2 图3 4 这样的结构,我想实现:1 3 图(要横跨两栏)2 4 但是,试了半天总是:1 2 图3 4 怎么办呀,help~ IV 西北师范大学数信学院本科论文 答:设置图片格式――版式――高级――文字环绕――环绕方式选上下型――图片位置――对齐方式选居中――度量依据选页面,要先改文字环绕,然后才能改图片位置 24. 问:用word 写东西时字距老是变动,有时候自动隔得很开,有时候进入下一行的时侯,上一行的字距又自动变大了,这是为什么,怎么纠正啊, 答:是因为自动对齐的功能,格式――段落――对齐方式可以选。还有允许断字的功能如果check 上,就不会出现你说的情况了。 25. 问:在使用WORD 的样式之后,如标题1、标题2 之类的,在这些样式前面总会出现一个黑黑的方块,虽然打印的时候看不到,但看着总是不舒服,有没有办法让它不要显示呢, 答:“视图”,,“显示段落标志”,把前面的勾去掉。其实这个很有用,可以便于知道哪个是标题段落 26. 问:文章第一页下面要写作者联系方式等。通常格式是一条短划线,下面是联系方式,基金支持等。这样的格式怎么做出来,就是注明页脚吗, 答:插入――脚注和尾注 27. 问:文字双栏,而有一张图片特别大,想通栏显示,应该怎么操作, 答:可以选择的内容,按双栏排。选择其他内容,按单栏排。 28. 问:Word 里面如何不显示回车换行符, 答:把视图-显示段落标记的勾去掉或工具-选项-视图-段落标记 29. 问:有没有方法把WORD 里的软回车一下子替换掉,识别出来的文字全带着软回车,能把他们一次全删掉吗,, 答:查找,替换,按CTRL+H;软回车好象是^l,在特殊字符里有 30. 问:在WORD 里的框框里怎么打勾, 答:画个文本框,文本框里写一个钩,然后拖过去;或者先在WORD 里插入符号“?”,然后选中“?”,到-》格式-》中文版式-》带圈字符-》选“?” 31. 问:还是不行,这样拷过去的框框字体是windings 的,而原来的是宋体的,两者有很大的区别。 答:根据模板新建专业型传真,里面有框,双击后打勾,copy 就ok 32. 问:Word 中怎么在一个英文字母上打对号, V 西北师范大学数信学院本科论文 答:透明方式插入图片对象,内容是一个? 33. 问:WORD 里怎么显示修订文档的状态,文档修订后,改后标记很多,但是在菜单里没有“显示修订最终状态”等,怎么调出来, 答:工具,自定义,命令,类别(工具),命令(修订),把“修订”等拖到工具栏上 34. 问:怎样把许多分开的word 文档合并成一个文档。我的论文是按照章节分开写的,但现在图书馆要提交电子版的学位论文,是一个文档的,我找了很多选项但好象不能合并,选择插入文件功能,可以加入内容,但文档中的页眉却插不进去,有谁有高见, 答:acrobat6 可以直接把多个文档打印成一个pdf 文档。可以提交pdf 格式的论文,先一个一个word 文档转换为pdf 格式的,然后在pdf 文档菜单的文件菜单中,选上作为pdf 格式打开,追加上就可。 35. 问:Word 里面要写方程式怎么办啊, 答:插入,对象,公式编辑器equation,如果没有公式编辑器Equation,要自己从光盘中安装,或者安装Mathtype 公式编辑器按右键把它拖出来,,插入,,命令,,自定义,,工具应该是倒过来 36. 问:想在WORD 里面表示矩阵,怎样才能画出那个很大的矩阵括号, 答:装公式编辑器mathtype 好了~:) 37. 问:Word 的公式编辑器怎么安装, 答:工具,自定义,插入,公式编辑器,把它拖到工具条上即可;或者安装OFFICE 后,再次安装,选增加功能吧,会有提示的 38. 问:Word2000 下调用公式编辑器的快捷键 答:点击菜单[工具]-[自定义],点击对话框下方[键盘],在[类别]里选择[插入],在命令里选择[InsertEquation],指定你的快捷方式 39. 问:WORD 中出现公式的行往往要比只有文字的行来得宽,如何把这些行改的跟只有文字的行一样宽, 答:段落行距设为固定值即可。这样会有一个问题,比如设置为18 磅,有些公式符号(特别是有下标的)不能全部显示打印稿可以显示。怎么解决这个问题,这个如何解决还需要考虑。 40. 问:我的文档就是公式多,应该怎么办, VI 西北师范大学数信学院本科论文 答:公式多的时候,最好的消除这个问题的办法就是每打几个公式就要存盘,如果连续打太多,就会出现这个问题。出现问题的时候:?选中所有内容,ctrl,C?把WORD 所有文档关闭。 ?最关键:出现一条信息,务必选择“是”?重新打开WORD 编辑器,?ctrl,V,粘贴?ctrl,S,存盘 41. 问:怎样在word 里面的公式编辑器中输入空格, 答:ctrl+shift+space 42. 问:如何使word 中公式全都小一号,一个一个选实在麻烦 答:在Mathtype公式编辑器中:首先,在Mathtype 中的菜单Size 中选define,定义所需的字号大小;再次,在Mathtype 中的菜单preferences 中的equation preference 的save to file 存贮所定义的字号文件;返回word 中:在Mathtype菜单中选Format equation1)在MathType preference file 中,选你刚才所定义的文件;2)在Range 中,选Whole document。最后,选OK,即OK了。 43. 问:如何将WORD 中的公式编缉拉到外面 答:工具,自定义,命令,插入,右边找公式编辑器,往上脱 44. 问:怎样可以去掉word 里面公式,或是图片上方总是出现的灰色的横条啊,以前没有的,不知道怎么跑出来了,看着怪晕糊的。。。。。 答:工具,选项-视图-域底纹,选不显示,或选取时显示,就可以了 45. 问:整个论文用一个WORD 文档,太大,不好编辑,一个地方有增删,后面那么长一个文档版面分布会变得乱七八糟,特别是图表之类的东东。想让每章的偶数页自动显示自己的章号和题目,WORD 里这个能够自动实现吗, 答:不要整个论文放一个WORD 文档,一章一个,然后每章就可以奇偶分开处理了 46. 问:论文按照章节写的,想把它们合并成一个文件,并保持原有的文件格式。采用了在文件末尾插入分节符的方法,但插入后有些文件的部分格式发生了变化,请问如何解决, 答:用主控文档的方法比较好,在大纲模式里设置的;采取插入文件的方式,格式有些变化 47. 问:WORD 里边怎么样显示行号, 答:在页面设置那里,板式选项,最下面有个行号选项 48. 问:Word 里面怎么插入半个空格, 答:先在word 的工具栏上,点中双箭头那个纽,就可以看到原先看不到的空格,然后再编 VII 西北师范大学数信学院本科论文 辑一下这个空格的大小,比如小五或小四什么的。 49. 问:只要一回车,或是改变光标位置的任何操作,都会使上一行的)变成,,有人遇到过这个问题么, 答:是不是设置了自动替换啊,符号里的自动替换看看吧~ 50. 问:WORD 有没有可以按单词的首字母进行排序,就是从A-Z 进行排 答:表格中的内容可以按照拼音排序,弄到excel 里,排序,再回来 51. 问:怎么在word 里面打R^2 答:先打R2,然后用鼠标选中2,同时按Ctrl,“shift”和+ 52. 问:Word 中发现空格都是小圆点,是怎么回事情,每输入一个空格就出现一个小圆点,怎么把它消除掉啊,这个空格会打印出来吗, 答:不会打印出来,如果想不显示:工具,选项,视图格式标记中前面的勾去掉即可 53. 问:word 如何使两个表格能排在一起,我做的表格每一个都比较小,但是表格数比较多,我想两个表格排成一行,请问该怎么做, 答:试试在局部分栏,每个分栏中一个表格。 54. 问:为什么换机器打开WORD 文档排版变了,在一台机器上排好板的WORD 文档换在另一台机器打开就变了,页码都不对了,怪哉。 答:是默认的页面设置不一样吧,或者版本不同 55. 问:Word 里面插入表格的问题,同一表格前后两行被分在了不同的页上,想他们在同一页怎么做, 答:转换成图文框可能更容易排版一点,或者加个文本框 56. 问:怎么在word 里画坐标图在word 里有了坐标图,文字却加不加去怎么办 答:作图时直接将文字加上去;word 中的绘图工具条,文字环绕里面寻找合适的 方案 气瓶 现场处置方案 .pdf气瓶 现场处置方案 .doc见习基地管理方案.doc关于群访事件的化解方案建筑工地扬尘治理专项方案下载 ,把图放在文字的底层 57. 问:WORD 文件有密码,怎么办呢, 答:找破解软件,比如advanced_office_2000_password_recovery_pro_v1.03,但不一定好用。 VIII 西北师范大学数信学院本科论文 58. 问:怎么给word 文档加密, 答:打开文档,另存为―工具―常规选项―打开、修改权限密码,保存 59. 问:Word 文件怎么转化为postscript 文件, 答:先转化为pdf,然后打印到文件,通过distiller 生成ps。 60. 问:Word 无法识别origin 中的汉字怎么办,用origin 做的图形中有汉字,copy 到word 中就成了问号,因此我不得不先用export 把图形变为jpg 文件才能解决这个问题,有没有方便的解决办法, 答:ORIGIN 里面的字体改成宋体或者仿宋 61. 问:请教怎么把Origin 中的图表拷贝到Word, 答:点origin 的Edit 菜单里的copy page 到word 里粘贴就行了 62. 问:把origin 的图复制粘贴到word,总有一大块的空白,这个空白有什么工具可以去掉吗,还有就是用word 自带的图表工具画图时,也是有一大块空白去不掉,这个可以解决吗, 答:右键选择图片工具栏,点裁减 63. 问:插入的图片为什么老是处于页面的顶端,想拖下来放到其他地方,却又自动跑到顶端去,就是拖不下来,请问该如何处理 答:改变图片的属性,就可以了。 64. 问:如何保证一幅图像固定在某一段的后面,另一段的前面,而不会因为前面段落的删减而位置改变, 答:右键点击图片,设置对象格式―版式―嵌入型 65. 问:如何把在WORD 里面图形工具画的图转化为jpg, 答:另存为html 格式,然后在html 文件对应的文件夹里找 66. 问:请问什么格式的图片插入word 最清晰,手头持有png 和tif 格式,复制粘贴到word 中模糊一片,请问转换成什么图片格式用于word 最清晰,什么方法(插入图片来自文件还是直接复制粘贴)对清晰度有否影响, 答:emf,eps 等矢量图最清晰,不会因为缩放损失分辨率,而jpeg,bmp 等点阵图就不行了。 IX 西北师范大学数信学院本科论文 67. 问:在WORD 中如何让图片的左、上、下边都是文本, 答:在分栏的数量为1的情况下实现。图片选中后右键,设置图片格式--版式-四周型就可以了 68. 问:jpg 文件插入word 文件以后怎么让文件变小,jpg 格式图片插到word文件以后文件变的巨大,有什么方法可以让它小一点,最好能一张软盘放的下。 答:两个方法:?用photoshop 改变图片的分辨率,当然要看得清楚,然后插入word?word 有强大的压缩功能,把文档另存为比如:temp.doc,看看是不是小了很多。 69. 问:Matlab 仿真图片大家一般怎么弄到word 里面的相对横轴和纵轴修改一下的说 答:一般都是在Matlab 里面把所有的直接修改好了,然后再保存的时候用jpg 格式,在word 中间导入就好了 70. 问:如何向WORD 中的图片添加文本,想在图片上输入一些说明文字 答:插入文本框,将版式设成“悬浮”在WORD 的绘图工具里面有个自选图形,找到你要的括号,直接在页面上画就可以了。可以移动,大小也可以改。然后把他挪到文字边上,即可。一个小窍门就是用CTRL+箭头可以进行微调。如果你觉得经常需要对这些文字编辑,怕图形错位的话,可以将需要的文字打在一个文本框里,记得将文本框设置成透明无色的(这样就看不见文本框了),然后将文本框和你的括号(或其他符号)组合成一个图形,就万无一失了 71. 问:AUTOCAD 的图拷贝到WORD 下如何处理 答:有几种办法:一是可以在WORD 中进行CAD 编辑的方法:将CAD 的背景设为白色,然后将CAD 窗口缩小,到你想复制的图形的大小,正好可以容纳就可以了,否则WORD 里面有很大的空白,然后,拷贝,选中所有的图形中的线条,右键。到WORD 中粘贴。二是,先转为wmf 文件,具体先将窗口缩小,如上,然后,按emport,选中线条,存储。WORD 中,插入,图形,来自, 文件,找到文件就可以插入了。 72. 问:文章用WORD 打开时,原有的公式全是红叉,以及WORD 中图变成red cross(红叉)怎么办, 答:基本上没有办法挽救回来了,只能重新插一遍图。据微软的技术支持所说,红叉是由于资源不够引起的。也就是说,如果你所编辑的文档过大,可能因为资源问题导致图片无法调入,从而显示红叉。可是实际情况是,有时候所编辑的文档并不大,可是还是出现红叉。这就可能是因为你设置了快速保存,在选项菜单中可以找到。这是由WORD 的文档结构所决定的。当你设置为快速保存时,每次保存的时候只是把你改动过的部分添加到文档尾部,并不重写文档本身,以达到快速的目的。所以,你会看到一个本来并不长的文档的实际大小可能有好几兆。当取消了快速保存后,文档长度将大大减小。还有一个减小红叉出现可能性的办法是把图片的属性中的浮动去掉。这样可能在编辑的时候有一定的困难,但是对于避免红 X 西北师范大学数信学院本科论文 叉的出现确实很灵。再说一句,一旦红叉出现了,应该是没有办法恢复的,只有再重新贴图。 73. 问:如果Word 突然定在那里了怎么办, 答:重新打开会回复,或者在word自身的templates 里面找到近期文件,重写的不用太多。 74. 问:如何解决word 说磁盘已满不让保存的问题, 答:有时候,当要保存一个文件时,Word 会弹出一个对话框说是磁盘空间已满,无法保存文件,可实际上磁盘上空间还很大。这是非常令人恼火的一件事情。这一信息最常见的原因是Temp 文件夹已经达到了一个文件夹中可以包含的最多文件数的上限。这时的解决方法很简单:在【资源管理器】中右击安装有Windows 系统的磁盘,在出现的快捷菜单中单击【属性】,将出现【属性】对话框,从【常规】选项卡中选择【磁盘清理】按钮,此时将出现【磁盘清理】对话框。执行磁盘清理完毕以后,Windows 会弹出一个新的对话框。在【要删除的文件】框中选中【临时文件】选项,然后选择【确定】。Windows 将删除临时文件。要人工删除临时文件,进入临时文件夹,删除任何旧的临时文件(临时文件以波浪号开始,以(tmp 扩展名结束),返回Word,再次试着保存文件。如果此时还不能正确保存文档,可以采取以下的方法,步骤如下:(l)按Ctrl,A 选定整个文档。(2)按Ctrl,C 将整个文档复制到内存中。(3)关闭Word 程序。此时系统会提示:您将大量文本放在了'剪贴板'中,是否希望在退出Word 后这些文本仍可用于其他程序,。(4)选择【是】按钮。(5)重新打开Word 程 trl,V,将复制下来的文本粘贴到新文件中。注意:在删除临时文件时,可能序。(6)按C 会出现一个对话框,提示不能删除正在使用的文件。这是因为Windows 运行的时候,需要不断地用到一些临时文件。因而,在人工删除临时文件时,试着在开始时只删除几个文件,然后对桌面上的回收站进行清空。否则可能无法删除所有选择的文件。 XI
本文档为【决策树c4.5论文】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: 免费 已有0 人下载
最新资料
资料动态
专题动态
is_044822
暂无简介~
格式:doc
大小:172KB
软件:Word
页数:0
分类:
上传时间:2018-05-25
浏览量:8