数据仓库与数据挖掘
设计并构造AdventureWorks
数据仓库实例
2015-2016学年第1学期
学院:电子工程学院
学号:
姓名:
2016年1月
实验二 设计并构造 AdventureWorks 数据仓库实例
1. 实验目的
在 SQL Server 平台上,利用AdventureWorks 数据库作为商业智能解决
方案
气瓶 现场处置方案 .pdf气瓶 现场处置方案 .doc见习基地管理方案.doc关于群访事件的化解方案建筑工地扬尘治理专项方案下载
的数据源,设计并构造数据仓库,建立 OLAP 和数据挖掘模型,并以输出报
表
关于同志近三年现实表现材料材料类招标技术评分表图表与交易pdf视力表打印pdf用图表说话 pdf
的形式满足决策支持的查询需求。
2. 实验环境及工具
实验环境:win7 系统
实验工具:Microsoft SQL Server 2012
SQL Server Management Studio
SQL Server Data Tools
3. 实验内容
3.1 需求分析
AdventureWorks 数据库中有很多实体关系表,涉及到自行车制造企业的人力资源、产品管理、市场销售和采购、供应商管理及生产管理多个方面。而作为自行车的决策者,最关心的就是销售业绩的问
题
快递公司问题件快递公司问题件货款处理关于圆的周长面积重点题型关于解方程组的题及答案关于南海问题
。
而这里经过思考,主要是对这几个主题完成以下三个目标:
(1)分析不同类别的产品通过网上销售在不同时间段内销售的业绩;
(2) 生成分析结果的报表;
(3)分析影响客户所有车的数量的因素。
3.2 确定主题与边界
对于该类自行车商品的公司管理层,需要关注和分析的主题主要是四个:供应商、产品、库存、和客户。其中商品主题的内容包括记录超市商品的采购情况、商品的销售情况和商品的存储情况;客户主题包括的内容可能有客户购买商品的情况;仓库主题包括仓库中商品的存储情况和仓库的管理情况等,简单的主题关系图如图 3-1 所示。
图3-1 主题关系图
分析销售业绩主要基于三个维度:产品、客户和时间。事实数据为销售记录。
3.2.1 产品维度
对于产品,起关键作用的是产品名称和分类。所以对产品实体,应该具备表3-1 中的属性。产品的各个属性存在 dbo.DimProduct表中。
属性
含义
类型
约束
ProductKey
确定唯一产品的主键
int
Not null
EnglishProductName
产品英文名
nvarchar(50)
Not null
Color
产品颜色
nvarchar(15)
Not null
表3-1 产品维度属性表
3.2.2 客户维度
客户维度则主要关心姓名、年龄、性别、受教育程度、子女个数、是否拥有房产、拥有汽车数量、所在地区等信息,如表格 3-2 中所示。
客户的各个属性存在 dbo.DimCustomer 和 dbo.DimGeography等表中,表之间通过主键或外键连接。
属性
含义
类型
约束
CustomerKey
表示唯一客户的主键
int
Not null
CustomerAlternateKey
客户全称
nvarchar(15)
Not null
GeographyKey
客户地理位置,外键
int
表3-2 客户维度属性表
3.2.3时间维度
对于时间维度,相关的是年、月、日、季度、半年等,与时间相关的信息存放在dbo.DimDate 表中。
图3-2时间维度图
3.2.4事实数据
对于事实数据,只关心订单产品价格、折扣、数量和总价等情况,它的所有属性如表格 3-4 中所示。其中,单位产品价格及折扣、订单总数和订单总价等信息在dbo.FactInternetSales 表中,如下图所示。
图3-3 事实数据图
3.3 逻辑模型创建
3.3.1 添加数据源
(1)运行AdventureWorksSQLServer 2005示例数据库.msi 文 件,生成AdventureWorks_Data.mdf和AdventureWorks_Log.ldf 文件。
在 Microsoft SQL Server Management Studio 工具中,右键点击对象资源管理器中的数据库节点,选择“附加”选择AdventureWorks_Data.mdf ,可看到AdventureWorks 中的表格及其内容,如图 3-2 所示。
图3-4. AdventureWorks导入数据库
同样的方法,附加了AdventureWorks SQL Server 2012示例数据库AdventureWorksDW2012。在后续操作中使用AdventureWorks DW 2012。
图3-5. AdventureWorksDW2012导入数据库
(2) 在 SQL Server Data Tools工具中,创建一个Analysis Services商业智能项目Analysis Services Tutorial,为它创建新的数据源,选择步骤(1)中的数据库。生成AdventureWorks 对应的数据源,如图 3-6 所示。新建完成后数据源下出现AdventureWorks DW 2012。
图3-6. 添加数据源
3.3.2 添加数据源视图
右击添加数据源视图,选择AdventureWorks DW 2012数据源,选择需要添加的表格,这里我关心的只有产品、客户的信息,所以选择DimProduct、DimCustomer、DimDate、FactInternetSales及相关的表格,并以此将表名中的Dim去掉。
添加好后的数据源视图如图 3-7 所示。
图3-7. 数据源视图
3.3.3 添加维度
维度的添加方式都是右击维度,使用现有表来新建。
(1)添加时间维度,选择相应的属性。
图3-8. 时间维度
(2) 添加产品维度,选择相应的属性。
图3-9. 产品维度
(3) 添加客户维度,选择相应的属性
图3-10. 客户维度
3.3.4 添加多维数据集
根据上面添加生成的维度,生成多维数据集。右键点击多维数据集,选择新建,使用现有表建立,度量值选为InternetSales,维度选择上一步生成的即可。
图3-11. 度量值与维度
图3-12. 多维数据集
3.4 部署 Analysis Services 项目
新建多维数据集成功之后,进行部署。第一次部署失败,提示错误28000。如图3-13所示。
图3-13. 部署失败
解决方法:在SQL Server Management Studio中新建一个账户,并映射到AdventureWorks DW 2012、权限设置为db_datareader。然后在Data Tools中双击数据源下的AdventureWorks DW 2012,把模拟信息改成使用服务账户。最后重新点击部署,部署成功。
图3-14. 部署成功
3.5决策树建立
上述完成后可以可以在工具栏的窗口中查看信息。如图 3-15 所示,为维度用法。
图3-15. 浏览维度用法
右击挖掘结构,建立相应的挖掘结构模型,通过决策树等直观查看挖掘结果。
图3-16. 决策树结果示例
4. 实验总结
通过本次实验,熟悉了 SQLServer2012 的使用以及 Analysis Services项目的创建和部署,加深了数据仓库中数据源、维度、多维数据集等概念的理解,并且练习运用这些组成部分构建和部署数据仓库,通过建立决策树对数据进行挖掘。对本课程的学习内容,也有了更为深入的理解。
实验过程持续较长时间,也遇到一些问题。通过上网查询
资料
新概念英语资料下载李居明饿命改运学pdf成本会计期末资料社会工作导论资料工程结算所需资料清单
以及跟大家讨论,难题一一迎刃而解。
报告
软件系统测试报告下载sgs报告如何下载关于路面塌陷情况报告535n,sgs报告怎么下载竣工报告下载
中若有不完善之处,还请老师多多包涵。最后,非常感谢王老师通过建立QQ群的方式进行信息传达、问题讨论。即时通讯的一切优点在教学和实践中都有所体现,这样的平台让学生受益良多。再次感谢!