网络信息管理
第一章
1、网络信息资源的开发层次
答:网络信息资源的开发可分为两个层次:?基础层次的开发
?应用方面的开发
基于网络信息资源开发的内涵可分为
?可得性开发:?建网与联网
?信息资源建设(网上信息资源从无到有、从有到优化的开发)
? 可用性开发: 主要包括免费信息资源深度与广度的挖掘、镜像资源的开发、收费
资源的代理服务、局域网和区域网资源的组织和服务等。
? 高水平利用状态的开发:?专题性开发利用
?预测性开发利用
?创新性开发利用
2、网络信息资源开发利用的主要方式
答:?建立信息导航库:概念导航和结构导航
是一种利用最多、最简单、最直接的网络信息资源开发模式
主要功能:a帮助浏览者进行整体文档结构定位
B根据浏览者的浏览行为给予浏览导航
?网络信息的重组—信息重构
?网络专业信息指南系统开发
?专业信息资源指引库的开发
?基于元搜索引擎的开发
?网络信息资源的内容挖掘
?虚拟数据库开发
?主题网关的开发
?网络信息资源的优化配置
网络信息资源的配置类型:?时间上矢量配置
?空间上矢量配置
?品种类型配置
第二章
1、内容
分析
定性数据统计分析pdf销售业绩分析模板建筑结构震害分析销售进度分析表京东商城竞争战略分析
法的概念
答:1. 顾名思义,内容分析法是对文献内容进行客观、系统、量化分析的一种科学研究方
法。
2. 内涵特征:?研究对象的特征,是具有明确特性的传播内容。
?分析方法的特征,是客观、系统和定量。
?结果
表
关于同志近三年现实表现材料材料类招标技术评分表图表与交易pdf视力表打印pdf用图表说话 pdf
述的特征,是描述性的。
2、内容分析法的方式
答:?解读式内容分析法
?实验式内容分析法
?计算机辅助内容分析法
3、什么是解读式内容分析法
答:解读式内容分析法是一种通过精读、理解并阐释文本内容来传达作者意图的方法,适用
于以描述事实为目的的个案研究。
4、文本分析含义:指忽略网页上的多媒体信息,只考虑文字本身的网络内容分析方法。
文本分析是传统内容法在网络上的具体应用,有词频分析和篇幅分析。
5、文本分析软件的功能
答:?文本输入与管理
?分析
?词典、分类
方案
气瓶 现场处置方案 .pdf气瓶 现场处置方案 .doc见习基地管理方案.doc关于群访事件的化解方案建筑工地扬尘治理专项方案下载
及编码
?输出
6、网络内容分析的基本框架(图见书190) 答:?确定目标
?选择样本
?数据收集
?选择分析要素
?建立分析类目
?编码
?数据统计
?数据表达与解释
7、网络内容分析的优势与局限性
答:优势: ?定性与定量相结合
?数据库的发展提高了内容分析的效率
?网络使得内容分析的层次得到扩展
局限性:?网络信息质量问题
?选择样本问题
?分析要素和分析类目问题
?研究方法问题
?信度和效度问题
?内容分析不确定的属性(随机性、模糊性、非唯一性、局限性)
8、网络内容分析法的两层含义: ?对网络内容分析
?基于网络技术和网络环境来研究内容分析法
第三章
1、网络信息过滤中间的基本原理
答:?用户对某种信息的选择需求是信息过滤的前提
?用户的信息需求以计算机能够识别的形式揭示出来,就是用户需求模板
?用户需求模板的构建、信息的揭示、匹配算法和反馈机制是最为关键的部分
2、信息过滤中的一般模型
答:匹配算法与用户需求模板的描述方法、信息的揭示方法是相互联系的,常用的匹配模型有 布尔模型、向量空间模型、概率模型、基于知识的表示模型、混合模型等
动态信息集 用户信息需求
揭示信息 用户需求模板
匹配算法
过滤结果
反馈机制
3、信息过滤和信息检索的关系
答:相同:?目的相同(都是根据用户的信息需求从信息集中获取信息,目的是要满足用户的信息需求)
?原理基本相同
?效率的评价基本相同(过滤正确率、过滤错误率、滤准率、滤全率)
不同:?用户:网络信息检索一般是对一个用户;网络信息过滤争对一个或一组用户
?信息需求:网络信息检索? 用户一次性的或短期的信息需求,信息需求的描
述为检索表达式;网络信息过滤 ?用户长期的信息需求,信息需求的描述为
用户需求模板
?信息集合:网络信息检索 ?必须对信息集进行标引,结果存储在数据库中;
网络信息过滤?对信息集不作预处理,过滤时自动分析
?对象:网络信息检索的对象是相对静态的结构化的数据;网络信息过滤过滤
的是动态的半结构化或非结构化的数据
?结果:网络信息检索输出的是相关的信息,带有回滞性;网络信息过滤不仅
输出需要的信息,更着重于剔除不需要的信息,具有即时性
过滤正确率=被正确过滤的信息/应该过滤的信息*100%
过滤错误率=被错误过滤的信息/不应该过滤的信息*100%
滤准率=过滤得到的用户需要的信息/过滤得到的信息*100%
滤全率=过滤得到的用户需要的信息/用户需要的所有信息*100%
4网络信息过滤的作用:?减轻认知压力的减压阀
?开展个性化信息服务的推动者
?保持网络顺畅的把关人
?清楚不良信息的净化器
5网络信息管理的主要方法:?分级法:包括,分级体系、PICS规范、PICS技术规范介绍
(详细见书)
?URL地址列表法(详细见书)
? 动态文本分析法
第四章
1、电子文件的微观管理
指文件和档案管理人员从以电子文件为客体对象,运用一定的技术,方法对其加以组织和控制,形成有序,系统的电子文件信息资源,维护电子文件信息的真实性、完整性、有效性,并向社会提供利用服务
2、电子文件的宏观管理
指文件和档案的行政与业务管理部门以电子文件管理为客体对象,运用法律法规、
制度
关于办公室下班关闭电源制度矿山事故隐患举报和奖励制度制度下载人事管理制度doc盘点制度下载
办法、规划标准等对电子文件管理工作的组织和人员加以指导控制,并提供相应技术,条件支持,以形成有效运作机制、管理机制,使电子文件微观管理工作规范制度化,确保电子文件完整保存的历史责任得以实现。
3、电子文件管理模式
A、分散保管模式
1、指政府机构以及各种社会组织产生的电子文件不集中在各级档案馆保存,而采用分布式管理方法,将其保存在产生这些文件的机构内,由档案馆对电子文件信息及以控制,并对其保护管理加以指导和帮助
2、理论基础是:后保管模式(案例:澳大利亚档案馆)
B、集中保管模式
指将具有永久价值的电子文件传送到档案馆集中保存,即对电子文件实体和信息进行双重控制
第五章
1、数据挖掘:是从大量的、不完全的、模糊的、随机的数据中提取人们感兴趣的知识的过
程。
2、网络数据挖掘:(1)网络数据挖掘有多种称法,如:网络信息挖掘、Web数据挖掘和网
络知识发现等;
(2) 网络数据挖掘是数据挖掘技术在网络信息处理中的应用,是指从与
网络相关的资源和行为中抽取感兴趣的、有用的模式和隐含的信息,是从Web
网站的数据中发掘关系和规则。
(3)其挖掘对象是大量、异质、分布的Web文档,可以对数据库、Web
服务器上的日志、用户信息等数据开展挖掘工作。
3、数据挖掘步骤
答:1、准备数据 2、定义问题 3、选择方法 4、挖掘数据 5、选择模式 6、评估
模式 7、更新知识 8、运用知识
4、数据挖掘的方法
答:1、统计分析方法
2、遗传算法
3、粗集方法
4、决策树方法
5、神经网络方法
6、聚类法
7、可视化技术
8、分类法
聚类法:
1、 定义:聚类算法是通过对变量的比较,把具有相似特征的数据归于一类。
2、 聚类与分类不同:分类的类别是按应用的要求事先给定的,根据表示的事物特征
的数据可以识别其类别;而聚类的类型不是指定的,而是分析数据的结果
3、 聚类大致上可以分为:分类聚类、概念聚类
5、网络数据挖掘方法:(1)网络信息挖掘:Web文本挖掘、多媒体数据的挖掘
(2)网络信息结构的数据挖掘
(3)网络使用记录挖掘
Web文本挖掘:(1)文本挖掘是从非结构化的文本中发现潜在的知识
(2)文本挖掘处理的对象主要是大量的、无结构的文本信息
(3)Web文本挖掘可以对Web上大量文档的集合的内容进行总结、分类、
聚类、关联分析,以及利用Web文档进行趋势预测
(4)Web文本挖掘面临的首要问题是如何在计算机中合理的表示文本
(5)文本挖掘的相关技术:a文本分类;b文本聚类;c自动摘要;d文
本可视化
web网页链接挖掘意义:(1)Web网页链接分析是网络信息计量学的一项重要的内容;
(2)分析和评价网页的质量;
(3)指导网络资源的组织建设;
(4)应用于网络资源检索和利用
(5)网页链接分析有利于分析和掌握学科发展状况,如:学科
的独立性、吸收能力、渗透性、地位、发展动态和趋
势等;
(6)有利于开发和应用智能超文本链接
第六章
1、网络信息集成的9种方式:(1)基于虚拟数据库的网络信息集成
(2)基于XML的网络信息集成
(3)基于Web数据仓库的网络信息集成
(4)基于智能代理的网络信息数据的集成
(5)基于Web服务的网络信息集成
(6)基于本体的网络信息集成
(7)基于开放链接的网络信息集成
(8)基于跨库检索的网络信息集成
(9)基于信息门户的网络信息集成
2、9种方式中实体的是:基于Web数据仓库的网络信息集成、
虚拟的是:基于虚拟数据库的网络信息集成、基于XML的网络信息集成、基
于本体的网络信息集成、基于信息门户的网络信息集成
3、9种方式的优缺点
(1)基于虚拟数据库的网络信息集成
(2)基于XML的网络信息集成优点:
(1)以解决集成中的分布与异构问题
(2)以对非结构化信息进行XML标记定义,从而实现非结构化信息查询与存储的
小粒度
(3)基于Web数据仓库的网络信息集成优点
1、更容易访问;
2、平台独立无关性;
3、低建设和管理成本
(4)基于智能代理的网络信息数据的集成优点
1、可以减轻网络负载
2、移动智能代理可以异地自主运行
3、移动智能代理具有很强的应变能力
4、移动智能代理具有异构性
(5)基于Web服务的网络信息集成
(6)基于本体的网络信息集成
优点
1、本体提供了丰富的、预定义的词汇作为数据库稳定概念的接口,而且是独立于数据
库模式的;
2、由本体表示的知识对于所有的相关数据源之间的转化都是可理解的;
3、本体支持一致的管理知识和识别不一致性的数据
缺点:1、缺乏一个成熟的开发和使用本体的方法学
2、建立映射、尤其是本体间的映射时,随意性比较大,并且映射关系多是一对一
的
3、很大程度上依赖于领域专家的帮助,一些工作很烦琐
(7)基于开放链接的网络信息集成
(8)基于跨库检索的网络信息集成
(9)基于信息门户的网络信息集成
4、虚拟数据库的含义
虚拟数据库(VDB),是使外界的数据表现为一个特定的关系数据库系统的一个扩展
5、什么是信息门户
答:信息门户主要指根据一定的需求,采用一定的技术和标准,将某一领域的重要资源及其之间的关联集成到一个平台上,并提供相应的检索与服务。
第七章
1、信息资源存储的概念
答:信息资源存储是指将经过加工处理后的信息资源,按照一定的规定记录在相应的信息载体上,并将这些载体按照一定的特征和内容性质组织成系统化的检索体系。信息存储是传播过程的终端,即把信息保存起来,而存储的信息可以作为下一轮信息源
2、数字信息长期保存技术:(1)拷贝;(2)技术仿真;(3)迁移;(4)更新;(5)再生性
保护技术;(6)数字图形输入板
3、信息资源长期保存技术的选择依据:(1)可行性
(2)可持续性
(3)可操作性
(4)合理性
4、信息存储类型:(1)人脑载体存储
(2)语言载体存储
(3)文字载体存储
(4)书刊载体存储
(5)电信载体存储
(6)计算机载体存储
(7)新材料载体存储
5、信息资源长期保存的主要内容:(1)保存数据信息流
(2)保存数字格式与处理信息
(3)保存数字信息处理环境
(4)保存数字信息的内容检验、身份认证、版本演变、
知识产权的管理机制、确保能可靠与合法的鉴别、使用被保护
的数字信息
(5)保存数字信息资源的知识组织体系和数字信息的组
织利用环境
(6)技术保存
6、存储网格:指的是具有海量数据存储能力的信息网格,具体来说它是指运用网格技术 包括虚拟化和开放标准,实现分布、异构的存储共享和数据一体化,为各类用户提供统一的 网格存储服务
7目前存储系统根据服务器类型分为:A封闭系统的存储
B开放系统的存储:a内嵌式存储
b外挂存储:1、直连式存储
2 网络化存储:网
络接入存储和存储区域网络
8存储虚拟化:利用虚拟化技术将不同厂商的FC-SAN、NAS、IP-SAN和DAS这4类存储资源整合起来,形成一个可统一管理、监控和使用的公用存储池