首页 SybaseIQ非结构化数据解决专业方案

SybaseIQ非结构化数据解决专业方案

举报
开通vip

SybaseIQ非结构化数据解决专业方案SybaseIQ非结构化数据处理方案SybaseIQ是Sybase企业推出尤其为数据仓库设计HYPERLINK""\t"_blank"关系型数据库。IQ架构与大多数HYPERLINK""\t"_blank"关系型数据库不一样,它尤其设计用以支持大量并发用户即时查询。其设计与实施进程优先考虑查询性能,其次是完成批量HYPERLINK""\t"_blank"数据更新速度。而传统HYPERLINK""\t"_blank"关系型数据库引擎设计既考虑在线事务进程又考虑数据仓库(而实际上,往往更多关注事...

SybaseIQ非结构化数据解决专业方案
SybaseIQ非结构化数据处理 方案 气瓶 现场处置方案 .pdf气瓶 现场处置方案 .doc见习基地管理方案.doc关于群访事件的化解方案建筑工地扬尘治理专项方案下载 SybaseIQ是Sybase企业推出尤其为数据仓库设计HYPERLINK""\t"_blank"关系型数据库。IQ架构与大多数HYPERLINK""\t"_blank"关系型数据库不一样,它尤其设计用以支持大量并发用户即时查询。其设计与实施进程优先考虑查询性能,其次是完成批量HYPERLINK""\t"_blank"数据更新速度。而传统HYPERLINK""\t"_blank"关系型数据库引擎设计既考虑在线事务进程又考虑数据仓库(而实际上,往往更多关注事务进程)。列存放IQ以列存放数据,而不是行——这与其她全部HYPERLINK""\t"_blank"关系型数据库引擎广泛使用存放方法方向相反。在其她HYPERLINK""\t"_blank"关系型数据库内核中,数据库一张表经典表示为一条数据库页链,每一数据页中有一行或多行数据统计。在HYPERLINK""\t"_blank"数据仓库应用中,从查询性能见解出发,这种存放方法是全部可能HYPERLINK""\t"_blank"数据存放方法中最不可取。在IQ中,每张表是一组相互独立页链集合,每一页链代表表中一列。所以有100列表将有100条相互独立页链,每一列都有一条页链与之对应,而不是象其她数据库引擎,一张表对应一条页链。列存放所固有优越性在于:大多数数据仓库应用查询只关心表中全部列一个很小子集,从而能够以极少磁盘I/O得到查询结果。现在考虑这么一个例子,假设我们要得到全部生日在七月份用户名字和电子邮件地址。在一个经典OLTP数据库引擎中,HYPERLINK""\t"_blank"查询优化器将依据返回行百分比(如1/12,在本例中,假设各月生日都基础平均)来决定是否值得在该列上使用索引。所以,经典数据库引擎对该查询可能会做全表扫描。为了对扫描成本做一估算,我们假设每个用户行统计为3200个字节,共有1000万个条统计。所以,HYPERLINK""\t"_blank"表扫描必需读取320亿个字节数据。IQHYPERLINK""\t"_blank"数据库引擎能够只读取查询所需列。在本例中,有三个相关列:全名、电子邮件地址和出生日期。假设全名为25个字节,电子邮件地址为25个字节,出生日期为4个字节(日期以二进制做内部编码)。那么IQ只需要读取5400万个字节数据——大约降低了59倍!数据压缩传统数据库引擎不能以一个通用方法进行数据压缩,关键是因为存在以下三个问 快递公司问题件快递公司问题件货款处理关于圆的周长面积重点题型关于解方程组的题及答案关于南海问题 :1.第一个问题是其按行存放数据存放方法不利于压缩。这是因为数据(大多为二进制数据)在以这种方法存放时反复并不多。我们发觉,按行存放数据,最多能有5-10%压缩百分比;2.第二个问题是对于很多2K和4K二进制数据页来说,为压缩和解压缩而增加开销太大;3.第三个问题是在OLTP环境中,大量读取和更新混杂在一起。每一次更新需要进行压缩操作,而读取只需解压缩操作,大多数数据压缩算法在压缩时比解压缩时慢4倍。这一开销将显著降低OLTP数据库引擎事务处理效率而使得HYPERLINK""\t"_blank"数据压缩代价昂贵到几乎不能忍受。在HYPERLINK""\t"_blank"数据仓库应用中,HYPERLINK""\t"_blank"数据压缩能够用小得多代价换取更大好处。其中包含降低对于HYPERLINK""\t"_blank"存放量要求;增大数据吞吐量,这相当于降低查询响应时间。SybaseIQ使用了HYPERLINK""\t"_blank"数据压缩。这是因为数据按列存放,相邻字段值含有相同数据类型,其二进制值范围通常也要小得多,所以压缩更轻易,压缩比更高。SybaseIQ对列存放数据通常能得到大于50%压缩。更大压缩百分比,加上大页面I/O,使得SybaseIQ在取得优良查询性能同时,降低了对HYPERLINK""\t"_blank"存放空间需求。1SybaseIQ独特优势面描述了IQ独特技术特征所带来部分关键应用效果。查询效果—瞬间响应IQ经过列存放、革命性HYPERLINK""\t"_blank"位图索引方法以及智能动态访问技术实现了快速查询响应速度,比传统数据库查询速度提升10-1000倍。这关键表现在以下多个方面:降低磁盘I/OSybaseIQ经过独特列存放,索引与HYPERLINK""\t"_blank"压缩技术,大大降低了查询中磁盘I/O次数,其杰出磁盘I/O效果带来了愈加快速查询反应,更高吞吐量和更低成本。并行列处理IQ支持列向量HYPERLINK""\t"_blank"并行处理,这么,在查询中,大量列向量将被并行扫描,从而达成显著降低响应时间目。 智能优化IQ许可在每个列上建立多个索引,IQHYPERLINK""\t"_blank"查询优化器在不一样使用情况下为查询选择不一样索引。提升Cache命中率大多数传统关系型数据库实施决议支持类型查询时会进行HYPERLINK""\t"_blank"表扫描。HYPERLINK""\t"_blank"表扫描使Cache命中率降低。列存放方法使Cache命中率大大提升,查询响应加紧。IQ 并行结构对多用户查询性能影响大多数HYPERLINK""\t"_blank"传统数据库采取并行HYPERLINK""\t"_blank"表扫描方法在一个大型SMP上只有一个用户情况下,效果是最好,但在多用户查询环境中性能会大打折扣。原因是现在大多数SMP系统只能同时支持一至两个大型并行HYPERLINK""\t"_blank"表扫描,假如扫描数量增加,不是CPU资源不够,就是耗尽了I/O总线带宽。每一个表扫描同时也使数据库缓冲完全失效,因为大多数大型数据仓库应用HYPERLINK""\t"_blank"表扫描都远大于物理缓冲区存放能力。IQ独特并行结构能够在大量并发查询情况下提供优异查询性能。存放效果—节省存放成本智能HYPERLINK""\t"_blank"压缩技术,与精巧索引结构和列存放结合,IQ比其她数据库引擎拥有愈加好存放效果。这将取得更低存放成本与更高查询性能(因为系统仅需极少磁盘I/O读取或写入任何给定数据库块)。在传统数据库中,为提升查询性能所建索引占用磁盘空间往往需要比数据本身需要磁盘空间多出3-10倍。而SybaseIQ存放数据所占用磁盘空间通常只是原数据文件40%-60%,是HYPERLINK""\t"_blank"传统数据库所占用空间几分之一。数据加载—更高效率数据加载,包含向一个现有数据仓库中增加数据,其加载效率大大高于传统数据库。这是因为IQ列存放、列HYPERLINK""\t"_blank"并行处理与索引技术,为快速批量数据加载时提供了强大技术确保。假如在数据加载时考虑索引增量式加载,大多数传统HYPERLINK""\t"_blank"关系型数据库在数据增量式加载方面都存在严重问题。这就是说,假如你一次装入了100GBHYPERLINK""\t"_blank"原始数据并在其上创建了索引,再在此基础上增加100MB或多个GB数据都会非常非常慢,以至于假如先删除全部索引,再装入增加数据,然后重新对整个数据库创建索引反而会快一点。SybaseIQ在装入第二个100MB或100GB时候速度几乎与装入第一批数据一样快。这就给最终用户带来更大灵活性。SybaseIQ使得索引开销大大降低,并提供了一个新开发环境,在这么开发环境中,索引使用能够比过去任何时候更充足。可扩展性SybaseIQ设计许可数据仓库从基础开始扩展,从很小扩展到非常巨大规模。这一点已经完全被验证,(具体情况请参考全球最大数据仓库——企业数据仓库参考架构一节)以及HYPERLINK""\t"_blank"基准测试汇报。可扩展性对SybaseIQ而言,举重若轻,你能够从一个小型数据仓库开始,扩展到大型数据仓库。也能够从大型开始扩展到超大型数据仓库。大幅降低总拥有成本正如上面所述,SybaseIQ大大节省了HYPERLINK""\t"_blank"数据存放成本,而且经过其强大可扩展性为企业提供了灵活选择。另外,IQ比传统数据库更轻易维护,不需要常常人工调优,简单扩展实现,快速布署时间等等都大幅降低了企业开发数据仓库总拥有成本。相关技术报导:搜狐新闻对于IT行业来说,无疑是大数据之年。据HYPERLINK""\t"_blank"IDC统计,数据总量将达成1.8万亿GB,对这些海量数据分析已经成为企业和机构非常关键且紧迫需求。面临着占据不到15%传统 标准 excel标准偏差excel标准偏差函数exl标准差函数国标检验抽样标准表免费下载红头文件格式标准下载 化、结构化信息,企业已经无法捕捉正确、全部市场信息,剩下85%非结构化数据则广泛存在于社交HYPERLINK""\t"_blank"网络、互联网和电子商务之中。面对席卷而来大数据浪潮,企业更需要一个全新技术,帮助她们实时处理海量复杂性信息,挖掘大数据分析价值。在大数据分析中,传统数据库布署已经不能承载TB数据,也不能很好支持高等级数据分析。“大数据应用关键在于可高度扩展分析,包含处理海量、高速、种类繁多以及无法估计数据类型等极端情况”,Forrester研究机构于10月公布汇报《企业Hadoop:新兴大数据关键》指出。在大数据分析领域,Hadoop和MapReduce越来越受到关注。Hadoop是一个开放源码分布式数据处理系统架构,关键面向存放和处理结构化、半结构化或非结构化等真正意义上大数据(通常成百上千TB甚至PB等级数据)应用。MapReduce能将大数据问题分解成多个子问题,将它们分配到成百上千个处理节点之上,然后将结果聚集到一个小数据集当中,从而更轻易分析得出最终结果。SybaseIQ15.4采取业内领先MPP列式数据库和最优异数据库内分析技术,并革命性地加入MapReduce与Hadoop集成,以应对大数据时代分析挑战,开启洞察关键业务能力。SybaseIQ15.4正在打破数据分析壁垒,根本改变“大数据分析”领域。SybaseIQ15——创新性列式数据库面对大数据分析全新需求,SybaseIQ列式数据库无疑更能够驾驭大数据浪潮。相比于传统“行式存放”关系型数据库,SybaseIQ使用了独特列式存放方法,在进行分析查询时,仅需读取查询所需列,其垂直分区策略不仅能够支持大量用户、大规模数据,还能够提交对商业信息高速访问,其速度可达成传统关系型数据库百倍甚至千倍。“伴随SybaseIQ不停地在分析应用POC测试中拔得头筹,有时甚至超出其她对手100倍之多”,Gartner评价道,“SybaseIQ逐步成为从数据集市到企业数据仓库架构最令人渴望DBMS(数据库管理系统)。”在此基础上,SybaseIQ15提升了关键引擎基础架构能力,包含数据加载和查询性能、改善安全架构、强大集群管理和因数据分区而增强管理等等。自推出以来,Sybase陆续公布了SybaseIQ15.1、15.2、15.3以至最新SybaseIQ15.4版本,每个版本都着力于增加新关键能力以促进更深入高级分析。SybaseIQ15.3在内置分析、 全文 企业安全文化建设方案企业安全文化建设导则安全文明施工及保证措施创建安全文明校园实施方案创建安全文明工地监理工作情况 检索等功效基础上,采取PlexQ技术全共享MPP架构,扩展后可支持实时访问数千个用户、多个混合工作负载和大规模数据集,将性能、分析、灵活性提升前所未有高度,从而重新定义企业级业务分析。SybaseIQ15.4已将SybaseIQ性能、分析、灵活性提升到了更高等级,深入推进了其在商业智能方面业已非常强势增加。长久以来,SybaseIQ这些技术革新使得SybaseIQ一直以来位于列式分析服务器市场领导者地位。现在,全球已经有2,000多名用户采取了SybaseIQ创新列式处理方法,为其关键分析和 报表 企业所得税申报表下载财务会计报表下载斯维尔报表下载外贸周报表下载关联申报表下载 系统提供支持。在过去三年,每年都有大约200个新用户加入SybaseIQ用户阵营。SybaseIQ15——采取更灵活、效益更高PlexQ技术Sybase在推出SybaseIQ15.3就采取了全共享架构PlexQ技术,该技术重新定义了企业范围业务信息,全共享架构可轻松支持包含海量数据集、海量并发用户数和独特工作步骤多个复杂分析样式,大大增加了其效益。与其她MPP处理方案不一样,SybaseIQPlexQ网格技术能够动态管理可轻松扩展而且专用于不一样组和步骤一系列计算与存放资源中分析工作量,从而使其能够以更低成本更轻松地支持日益增加数据量以及快速增加用户小区。基于成熟PlexQ技术构建SybaseIQ采取下图所表示三层构架:基础层:数据库管理系统(DBMS),这是一个全共享MPP分析DBMS引擎,是SybaseIQ最大独特优势。第二层:分析应用程序服务层,其提供C++和Java数据库内API,并可实现与外部数据源集成和联邦;包含四种与Hadoop集成方法。顶层:SybaseIQ HYPERLINK""\t"_blank"生态系统,由四个强大且不一样合作伙伴和认证ISV应用程序组成。基于这种PlexQ技术,SybaseIQ15.4将大数据转变成可指挥每个人都行动情报信息,从而在整个企业用户和业务步骤范围内轻松含有大数据分析能力。SybaseIQ15.4——面向大数据高级分析平台SybaseIQ提供了一个统一DBMS平台,可使用多种算法分析不一样类型数据,这包含结构化数据和半结构化数据。另外,该版本还做了以下扩充:扩大了对数据库内分析功效支持,包含MapReduceAPI、估计模型标识语言(PMML)支持、与Hadoop集成以及基于SybaseIQPlexQ大规模并行处理(MPP)技术统计和数据挖掘算法扩展库。新API帮助开发人员快速、安全地实施数据库内算法,实现优于现有方法10倍以上性能加速。SybaseIQ15.4含有以下关键功效:1.更强数据管理大量增强功效改善了SybaseIQ数据管理、布署和可维护性。•愈加快速批量加载:批量加载数据经过ODBC和JDBC接口插入到Sybase中,从而实现含有更高可扩展性应用程序,同时可极大提升加载性能。•更出色文本压缩:更出色地对VHYPERLINK""\t"_blank"ARCHAR、VAHYPERLINK""\t"_blank"RBINHYPERLINK""\t"_blank"ARY、CHAR和BINARY压缩可实现以更高效率、更低成本布署高性能文本分析应用程序,同时极大提升压缩速率。2.丰富应用程序SybaseIQ15.4增加了一系列API和工具,用于创建在数据库内运行高级分析算法,而且能经过PlexQ网格能充足利用大规模并行处理能力。支持自带MapReduce表参数化用户自定义函数(UDF)——这是SybaseIQ当地应用程序编程接口,可使应用程序编程人员在SybaseIQ数据库服务器内构建和布署C++库。使用这些API可实现专有算法或算法包,安全地位于SybaseIQ内,经过在保留于SybaseIQ数据库服务器中数据周围实施,以快10倍速度返回结果。此框架可实现在SybaseIQ中开发和布署MapReduce程序,以分析包含结构化、半结构化和非结构化数据格式超大数据集。C++、Map和Reduce算法经过标准SQL加以调用,而且由SybaseIQ强大查询引擎自动在PlexQ网格中进行分发和并行化。Hadoop集成与联邦——将基于Hadoop分析结果与运行于SybaseIQ中查询相集成。Sybase是唯一一家提供4种不一样方法将标准SQL查询(用户端联邦、ETL处理、数据联邦和查询联邦)中Hadoop数据和分析与分析数据库相集成厂商。SybaseIQ15.4充足利用Hadoop来识别海量结构化和非结构化数据集中相关数据点,然后将Hadoop中相关数据点集成到SybaseIQ中,方便利用传统数据和来自其她数据源结果集进行分析。估计模型标识语言(PMML)支持——经过Zementis提供认证插件,自动实施使用业界标准语言定义在SAS、SPSS、“R”等工具以及其她流行估计工作平台产品中所创建分析模型。充足利用流行分析工具构建估计模型,自动实施在SybaseIQ中布署估计模型,并使用业界标准语言,以避免形成厂商捆绑。“R”集成:——用户可使用RJDBC接口,以及流行开源统计工具“R”查询SybaseIQ数据库。另外,用户还能够未来自SybaseIQ“R”库作为SQL查询中函数调用加以实施,并返回结果集。3.数据库内分析库更新数据库内统计和数据挖掘库(来自Fuzzy•LogixDBLytix):在SybaseIQ内运行高级分析、统计和数据挖掘算法库。SybaseIQ15.4中更新可使该库充足利用部分数据挖掘算法中MapReduceAPI进行大规模并行处理,而且包含多个新函数,比如支持向量机、神经网络和AdaptiveBoosting。4.扩展生态系统SybaseIQ还非常适合面向大数据分析端到端全方面处理方案。关键工具和互补合作伙伴产品可在以下方面提供帮助:SybasePowerDesigner®16.1参考架构生成器:可经过在实施SybaseIQ数据仓库和数据集市时生成最好硬件配置,快速实现价值。SybaseControlCenter(SCC):改善方面包含大量管理功效,比如过程、函数、UDF(表、TPF和JavaEE)及文本索引。用户能够更轻松地管理SCC中频繁使用功效,以及更轻松地布署内置、外部和文本数据库内分析。另外该版本还包含了新SQL实施窗口,该窗口可实现易于测试特定SQL例程。已经过 HYPERLINK""\t"_blank"SAP®BusinessObjects™认证:SybaseIQ15.4已经过认证,可与SAPBusinessObjectsBusinessIntelligencePlatform4.0和SAPBusinessObjectsDataServices4.0配合使用,以提供丰富端到端业务分析框架。基于合作伙伴处理方案:SybaseIQ拥有基于与Solix、KXEN、Quest、BMMSoft、Zementis及FuzzyLogix之间合作伙伴关系多个新处理方案,从而可使SybaseIQ提供可满足多种需求优质处理方案。总结以上新功效充足利用PlexQ智能分析网格技术,能够在一个企业级数据分析平台上实施大规模分析。凭借SybaseIQ15.4,企业能够有效地将海量数据转变成可操作信息,管理海量增加半结构与非结构化数据、实现复杂数据环境下高效大数据分析。在大数据浪潮下,Sybase从行业改变以及用户真实需求出发,不停革新技术并调整服务,为全球用户提供适应大数据环境产品与处理方案。
本文档为【SybaseIQ非结构化数据解决专业方案】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: ¥20.0 已有0 人下载
最新资料
资料动态
专题动态
is_769254
暂无简介~
格式:doc
大小:18KB
软件:Word
页数:0
分类:建筑/施工
上传时间:2018-05-18
浏览量:7