首页 大数据的应用现状与展望

大数据的应用现状与展望

举报
开通vip

大数据的应用现状与展望 自然辩证法小论文 大数据的应用现状与展望 指导老师:张立 组长、主讲:刘开耀21428164 PPT制作:刘玉婷 21428171 论文撰写:雷颖颖21428172 陈瞳21421083 资料收集:毕晨光21428165 黄一锋21428170 邵炳21428166 姜灵轩21428163 董丽华21435015 周晴21418185 黄河羚婕JX14014 2015/4/18 大数据的应用现状与展望 摘要:大数据具有规模大、种类多、生成速度快、价值巨大但密度低的特点。大数据应用就是利...

大数据的应用现状与展望
自然辩证法小论文 大数据的应用现状与展望 指导老师:张立 组长、主讲:刘开耀21428164 PPT制作:刘玉婷 21428171 论文撰写:雷颖颖21428172 陈瞳21421083 资料收集:毕晨光21428165 黄一锋21428170 邵炳21428166 姜灵轩21428163 董丽华21435015 周晴21418185 黄河羚婕JX14014 2015/4/18 大数据的应用现状与展望 摘要:大数据具有规模大、种类多、生成速度快、价值巨大但密度低的特点。大数据应用就是利用数据分析的方法,从大数据中挖掘有效信息,为用户提供辅助决策,实现大数据价值的过程。本文主要介绍了大数据的分析方法、分析模式以及常用的分析工具,将大数据应用归纳为6个关键领域:结构化数据分析、文本分析、Web分析、多媒体分析、社交网络分析和移动分析,并列举了若干大数据的典型应用。最后从基础理论、关键技术、应用实践以及数据安全等4个方面总结了大数据的研究现状,并对大数据应用未来的研究进行展望。 关键词: 大数据  数据分析  数据存储  4V 在过去的20年中,各个领域都出现了大规模的数据增长,包括医疗保健和科学传感器 用户生成数据、互联网和金融公司、供应链系统等。 国际数据公司IDC报告[1]称,2011年全球被创建和复制的数据总量为1.8ZB(1ZB≈1021ZB),在短短5年间增长了近9倍,而且预计这一数字将每两年至少翻一番。大数据这一术语正是产生在全球数据爆炸增长的背景下 用来形容庞大的数据集合。与传统的数据集合相比,大数据通常包含大量的非结构化数据,且大数据需要更多的实时分析。此外,大数据还为挖掘隐藏的价值带来了新的机遇,同时给我们带来了新的挑战,即如何有效地组织管理这些数据。 1 大数据的定义 目前,虽然大数据的重要性得到了大家的一致认同,但是关于大数据的定义却众说纷纭。大数据是一个抽象的概念,除去数据量庞大,大数据还有一些其他的特征,这些特征决定了大数据与“海量数据”和“非常大的数据”这些概念之间的不同。一般意义上,大数据是指无法在有限时间内用传统IT技术和软硬件工具对其进行感知、获取、管理、处理和服务的数据集合。科技企业、研究学者、数据分析师和技术顾问们,由于各自的关注点不同,对于大数据有着不同的定义。通过以下定义,或 许可 商标使用许可商标使用许可商标使用许可商标使用许可商标使用许可 以帮助我们更好地理解大数据在社会、经济和技术等方而的深刻内涵。 2010年Apache Hadoop组织将大数据定义为,“普通的计算机软件无法在可接受的时间范围内捕捉、管理、处理的规模庞大的数据集”。在此定义的基础上,2011年5月,全球著名咨询机构麦肯锡公司发布了名为“大数据:下一个创新、竞争和生产力的前沿”的报告,在报告中对大数据的定义进行了扩充。大数据是指其大小超出了典型数据库软件的采集、存储、管理和分析等能力的数据集。该定义有两方而内涵:(1)符合大数据 标准 excel标准偏差excel标准偏差函数exl标准差函数国标检验抽样标准表免费下载红头文件格式标准下载 的数据集大小是变化的,会随着时间推移、技术进步而增长;(2)不同部门符合大数据标准的数据集大小会存在差别。目前,大数据的一般范围是从几个TB到数个PB(数千TB)[2]。根据麦肯锡的定义可以看出,数据集的大小并不是大数据的唯一标准,数据规模不断增长,以及无法依靠传统的数据库技术进行管理,也是大数据的两个重要特征。 大数据价值链可分为4个阶段:数据生成、数据采集、数据储存以及数据分析。数据分析是大数据价值链的最后也是最重要的阶段,是大数据价值的实现,是大数据应用的基础,其目的在于提取有用的值,提供论断建议或支持决策,通过对不同领域数据集的分析可能会产生不同级别的潜在价值。 2 大数据的特点     大数据的4V特点:Volume(大量)、Velocity(高速)、Variety(多样)、Value(价值)。     “大数据”是一个体量特别大,数据类别特别大的数据集,并且这样的数据集无法用传统数据库工具对其内容进行抓取、管理和处理。“大数据”首先是指数据体量(volumes)大,指代大型数据集,一般在10TB规模左右,但在实际应用中,很多企业用户把多个数据集放在一起,已经形成了PB级的数据量;其次是指数据类别(variety)大,数据来自多种数据源,数据种类和格式日渐丰富,已冲破了以前所限定的结构化数据范畴,囊括了半结构化和非结构化数据。接着是数据处理速度(Velocity)快,在数据量非常庞大的情况下,也能够做到数据的实时处理。最后一个特点是指数据真实性(Veracity)高,随着社交数据、企业内容、交易与应用数据等新数据源的兴趣,传统数据源的局限被打破,企业愈发需要有效的信息之力以确保其真实性及安全性。 “大数据”的概念远不止大量的数据(TB)和处理大量数据的技术,或者所谓的“4个V”之类的简单概念,而是涵盖了人们在大规模数据的基础上可以做的事情,而这些事情在小规模数据的基础上是无法实现的。换句话说,大数据让我们以一种前所未有的方式,通过对海量数据进行分析,获得有巨大价值的产品和服务,或深刻的洞见,最终形成变革之力。 从某种程度上说,大数据是数据分析的前沿技术。简言之,从各种各样类型的数据中,快速获得有价值信息的能力,就是大数据技术。明白这一点至关重要,也正是这一点促使该技术具备走向众多企业的潜力。 大数据最核心的价值就是在于对于海量数据进行存储和分析。相比起现有的其他技术而言,大数据的“廉价、迅速、优化”这三方面的综合成本是最优的。 3 大数据分析 众所周知,大数据已经不简简单单是数据大的事实了,而最重要的现实是对大数据进行分析,只有通过分析才能获取很多智能的,深入的,有价值的信息。那么越来越多的应用涉及到大数据,而这些大数据的属性,包括数量,速度,多样性等等都是呈现了大数据不断增长的复杂性,所以大数据的分析方法在大数据领域就显得尤为重要,可以说是决定最终信息是否有价值的决定性因素。基于如此的认识,大数据分析普遍存在的方法理论有哪些呢? 可视化分析 analytic visualization 大数据分析的使用者有大数据分析专家,同时还有普通用户,但是他们二者对于大数据分析最基本的要求就是可视化分析,因为可视化分析能够直观的呈现大数据特点,同时能够非常容易被读者所接受,就如同看图说话一样简单明了。 数据挖掘算法 data mining algorithms 大数据分析的理论核心就是数据挖掘算法,各种数据挖掘的算法基于不同的数据类型和格式才能更加科学的呈现出数据本身具备的特点,也正是因为这些被全世界统计学家所公认的各种统计方法(可以称之为真理)才能深入数据内部,挖掘出公认的价值。另外一个方面也是因为有这些数据挖掘的算法才能更快速的处理大数据,如果一个算法得花上好几年才能得出结论,那大数据的价值也就无从说起了。 预测性分析能力 predictive analytic capabilities     大数据分析最终要的应用领域之一就是预测性分析,从大数据中挖掘出特点,通过科学的建立模型,之后便可以通过模型带入新的数据,从而预测未来的数据。 语义引擎 semantic engines     大数据分析广泛应用于网络数据挖掘,可从用户的搜索关键词、标签关键词、或其他输入语义,分析,判断用户需求,从而实现更好的用户体验和广告匹配。 数据质量和数据管理 data qualities and master data management     大数据分析离不开数据质量和数据管理,高质量的数据和有效的数据管理,无论是在学术研究还是在商业应用领域,都能够保证分析结果的真实和有价值。 大数据分析的基础就是以上五个方面,当然更加深入大数据分析的话,还有很多很多更加有特点的、更加深入的、更加专业的大数据分析方法。 4 大数据应用 大数据的类型大致可分为三类:(1)传统企业数据(Traditional enterprise data):包括 CRM systems的消费者数据,传统的ERP数据,库存数据以及账目数据等。(2)机器和传感器数据(Machine-generated /sensor data):包括呼叫记录(Call Detail Records),智能仪表,工业设备传感器,设备日志(通常是Digital exhaust),交易数据等。(3)社交数据(Social data):包括用户行为记录,反馈数据等。如Twitter,Facebook这样的社交媒体平台。 大数据挖掘商业价值的方法主要分为四种:(1)客户群体细分,然后为每个群体量定制特别的服务。(2)模拟现实环境,发掘新的需求同时提高投资的回报率。(3)加强部门联系,提高整条管理链条和产业链条的效率。(4)降低服务成本,发现隐藏线索进行产品和服务的创新。     从三大产业的角度将大数据的核心商业价值分类讨论。大数据应用,是利用大数据分析的结果,为用户提供辅助决策,发掘潜在价值的过程。从理论上来看:所有产业都会从大数据的发展中受益。但由于数据缺乏以及从业人员本身的原因,第一、第二产业的发展速度相对于第三产业来说会迟缓一些。     各个行业利用大数据价值的难易度以及发展潜力以及Open Data时代里七大行业潜在的经济价值,自上而下分别是教育,运输,消费品、电力、石油与天然气、医疗护理、消费金融[3],如图一。 图1 大数据的经济价值 4.1企业内部大数据应用 目前,大数据的主要来源和应用都是来自于企业内部,商业智能(business intelligence,  BI)和OLAP可以说是大数据应用的前辈。企业内部大数据的应用,可以在多个方而提升企业的生产效率和竞争力。具体而言:市场方而,利用大数据关联分析,更准确地了解消费者的使用行为,挖掘新的商业模式;销售规划方而,通过大量数据的比较,优化商品价格;运营方而,提高运营效率和运营满意度,优化劳动力投入,准确预测人员配置要求,避免产能过剩,降低人员成本;供应链方而,利用大数据进行库存优化、物流优化、供应商协同等工作,可以缓和供需之间的矛盾、控制预算开支,提升服务。     在金融领域,企业内部大数据的应用得到了快速发展。例如,招商银行通过数据分析识别出招行信用卡价值客户经常出现在星巴克、DQ、麦当劳等场所后,通过“多倍积分累计、积分店而兑换”等活动吸引优质客户;通过构建客户流失预警模型,对流失率等级前20%的客户发售高收益理财产品予以挽留,使得金卡和金葵花卡客户流失率分别降低了15%和7%;通过对客户交易记录进行分析,有效识别出潜在的小微企业客户,并利用远程银行和云转介平台实施交叉销售,取得了良好成效。     当然最典型的应用还是在电子商务领域,每天有数以万计的交易在淘宝上进行,与此同时相应的交易时间、商品价格、购买数量会被记录,更重要的是,这些信息可以与买方和卖方的年龄、性别、地址、甚至兴趣爱好等个人特征信息相匹配。淘宝数据魔方是淘宝平台上的大数据应用方案,通过这一服务,商家可以了解淘宝平台上的行业宏观情况、自己品 牌的市场状况、消费者行为情况等,并可以据此进行生产、库存决策,而与此同时,更多的消费者也能以更优惠的价格买到更心仪的宝贝。而阿里信用贷款则是阿里巴巴通过掌握的企业交易数据,借助大数据技术自动分析判定是否给予企业贷款,全程不会出现人工干预。据透露,截至目前阿里巴巴己经放贷300多亿元,坏账率约0.3%左右,大大低于商业银行。 4.2物联网大数据应用 物联网不仅是大数据的重要来源,还是大数据应用的主要市场。在物联网中,现实世界中的每个物体都可以是数据的生产者和消费者,由于物体种类繁多,物联网的应用也层出不穷。 在物联网大数据的应用上,物流企业应该有深刻的体会。UPS快递为了使总部能在车辆出现晚点的时候跟踪到车辆的位置和预防引擎故障,它的货车上装有传感器、无线适配器和UPS。同时,这些设备也方便了公司监督管理员工并优化行车线路。UPS为货车定制的最佳行车路径是根据过去的行车经验总结而来的。2011年,UPS的驾驶员少跑了近4828万公里的路程。     智慧城市,是一个基于物联网大数据应用的热点研究项目,图2所示为基于物联网大数据的智能城市规划。迈阿密戴德县,就是一个智慧城市的样板。佛罗里达州迈阿密戴德县与IBM的智慧城市项目合作,将35种关键县政工作和迈阿密市紧密联系起来,帮助政府领导在治理水资源、减少交通拥堵和提升公共安全方而制定决策时获得更好的信息支撑。IBM使用云计算环境中的深度分析向戴德县提供智能仪表盘应用,帮助县政府各个部门实现协作 化和可视化管理。智慧城市应用为戴德县带来多方而的收益,例如戴德县的公园管理部门今年因及时发现和修复跑冒滴漏的水管而节省了100万美元的水费。 图2基于物联网的智能城市 4.3面向在线社交网络大数据的应用 在线社交网络,是一种在信息网络上由社会个体集合及个体之间的连接关系构成的社会性结构。在线社交网络大数据主要来自即时消息、在线社交、微博和共享空间4类应用。由于在线社交网络大数据代表了人的各类活动,因此对于此类数据的分析得到了更多关注。在线社交网络大数据分析是从网络结构、群体互动和信息传播3个维度,通过基于数学、信息学、社会学、管理学等多个学科的融合理论和方法,为理解人类社会中存在的各种关系提供的一种可计算的分析方法。目前,在线社交网络大数据的应用包括网络舆情分析、网络情报搜集与分析、社会化营销、政府决策支持、在线教育等。     圣克鲁斯警察局是美国警界最早应用大数据进行预测分析的试点,通过分析社交网络,可以发现犯罪趋势和犯罪模式,甚至可以对重点区域的犯罪概率进行预测。     2013年4月,美国计算搜索引擎Wolfram Alpha,通过对Facebook中100多万美国用户社交数据进行分析,试图研究用户的社会行为规律。根据分析发现,大部分Facebook用户在20岁出头时开始恋爱,27岁左右时订婚,30岁左右结婚,而 30 ~ 60岁之间,婚姻关系变化缓慢。这个研究结果与美国人口普查数据相比,几乎完全一致。     总得说来,在线社交网络大数据应用可以从以下3方而帮助我们了解人的行为,以及掌握社会和经济活动的变化规律:(1)前期警告,通过检测用户使用电子设备及服务中出现的异常,在出现危机时可以更快速地应对。(2)实时监控,通过对用户当前行为、情感和意愿等方而的监控,可以为政策和方案的制定提供准确的信息。(3)实时反馈,在实时监控的基础上,可以针对某些社会活动获得群体的反馈信息。 4.4医疗健康大数据应用 医疗健康数据是持续、高增长的复杂数据,蕴涵的信息价值也是丰富多样。对其进行有效的存储、处理、查询和分析,可以开发出其潜在价值。对于医疗大数据的应用,将会深远的影响人类的健康。     例如,安泰保险为了帮助改善代谢综合症的预测,从千名患者中选择102个完成实验。在一个独立的实验室工作内,通过患者的一系列代谢综合症的检测试验结果,在连续3年内,扫描600 000个化验结果和18万索赔事件。将最后的结果组成一个高度个性化的治疗方案,以评估患者的危险因素和重点治疗方案。这样,医生可以通过食用他汀类药物及减重5磅等建议而减少未来10年内50%的发病率。或者通过你目前体内高于20%的含糖量,而建议你 降低体内甘油三酯总量。     西奈山医疗中心(Mount Sinai Meddical Center)是美国最大最古老的教学医院,也是重要的医学教育和生物医药研究中心。该医疗中心使用来自大数据创业公司Ayasdi的技术分析大肠杆菌的全部基因序列,包括超过100万个DNA变体,来了解为什么菌株会对抗生素产生抗药性。Ayasdi的技术使用了一种全新的数学研究方法:拓扑数据分析(topological data analysis),来了解数据的特征。 微软的HealthVault,是一个出色的医学大数据的应用,它是2007年发布的,目标是希望管理个人及家庭的医疗设备中的个人健康信息。现在己经可以通过移动智能设备录入上传健康信息,而且还可以第三方的机构导入个人病历记录,此外通过提供SDK以及开放的接口,支持与第三方应用的集成。 4.5群智感知 随着技术的发展,智能手机和平板电脑等移动设备集成了越来越多的传感器,计算和感知能力也愈发强大。在移动设备被广泛使用的背景下,群智感知开始成为移动计算领域的应用热点。大量用户使用移动智能设备作为基本节点,通过蓝牙、无线网络和移动互联网等方式进行协作,分发感知任务分发,收集、利用感知数据,最终完成大规模的、复杂的社会感知任务。群智感知对参与者的要求很低,用户并不需要相关的专业知识或技能,只需拥有一台移动智能设备。     众包(crowdsourcing)是一种极具代表性的群智感知模式,是一种新型的解决问 快递公司问题件快递公司问题件货款处理关于圆的周长面积重点题型关于解方程组的题及答案关于南海问题 的方式。众包以用户为基础,以自由参与的方式分发任务。目前众包己经被运用于人力密集的应用,如语言 翻译 阿房宫赋翻译下载德汉翻译pdf阿房宫赋翻译下载阿房宫赋翻译下载翻译理论.doc 、语音识别、图像地理信息标记、定位与导航、城市道路交通感知、市场预测、意见挖掘等。众包的核心思想是将任务分而治之,通过参与者的协作来完成个体不可能或者说根本想不到要完成的任务。无需部署感知模块和雇佣专业人员,众包就可以将感知范围扩展至城市规模甚至更大。     其实,众包的应用早于大数据的兴起,宝洁、宝马、奥迪等许多公司都曾借助众包提升自身的研发和 设计 领导形象设计圆作业设计ao工艺污水处理厂设计附属工程施工组织设计清扫机器人结构设计 能力。而在大数据时代,空间众包服务(spatialcrowdsourcing)成为了大家关注的热点。空间众包服务的工作框架如下:服务请求方要求获取与特定地点相关的资源,而愿意接受任务请求的参与者将到达指定地点,利用移动设备获取相关数据(视频、音频或图片),最后将这些数据发送给服务请求方。随着移动设备使用的高速增长以及移动设备提供的功能越来越复杂,可以预见空间众包将会变得比传统形式的众包服务更加流行,如Amazon Turk[79]和Crowdflower[80]。 4.6智能电网 智能电网,是指将现代信息技术融入传统能源网络构成新的电网,通过用户的用电习惯等信息,优化电能的生产、供给和消耗,是大数据在电力系统上的应用。智能电网可以解决以下几方而的问题: (1)电网规划:通过对智能电网中的数据进行分析,可以知道哪些地区的用电负荷和停电频率过高,甚至可以预测哪些线路可能出现故障。这些分析结果,可以有助于电网的升级、改造、维护等工作。例如,美国加州大学洛杉矶分校的研究者就根据大数据理论设计了一款”电力地图”,将人口调查信息、电力企业提供的用户实时用电信息和地理、气象等信息全部集合在一起,制作了一款加州地图。该图以街区为单位,展示每个街区在当下时刻的用电量,甚至还可以将这个街区的用电量与该街区人的平均收入和建筑物类型等相比照,从而得出更为准确的社会各群体的用电习惯信息。这个地图为城市和电网规划提供了直观有效的负荷数预测依据,也可以按照图中显示的停电频率较高、过载较为严重的街区进行电网设施的优先改造。 (2)发电与用电的互动:理想的电网,应该是发电与用电的平衡。但是,传统电网的建设是基于发-输-变-配-用的单向思维,无法根据用电量的需求调整发电量,造成电能的冗余浪费。为了实现用电与发电的互动,提高供电效率,研究者开发出了智能的用电设备-智能电表。德克萨斯电力公司(TXU Energy)己经广泛使用智能电表,并取得了巨大的成效。供电公司能每隔15 min就读一次用电数据,而不是过去的一月一次。这不仅仅节省了抄表的人工费用,而且由于能高频率快速采集分析用电数据,供电公司能根据用电高峰和低谷时段制定不同的电价,利用这种价格杠杆来平抑用电高峰和低谷的波动幅度,智能电表和大数据应用让分时动态定价成为可能,而且这对于TXU Energy和用户来说是一个双赢变化。 (3)间歇式可再生能源的接入:目前许多新能源也被接入电网,但是风能和太阳能等新能源,其发电能力与气候条件密切相关,具有随机性和间歇性的特点,因此难以直接并入电网。如果通过对电网大数据的分析,则可对这些间歇式新能源进行有效调节,在其产生电能时,根据电网中的数据将其调配给电力紧缺地区,与传统的水火电能进行有效地互补。 5大数据的研究展望 大数据的出现,开启了一次重大的时代转型。在IT时代,以前技术(technology, T)才是大家关注的重点,是技术推动了数据的发展;如今数据的价值凸显,信息(information, I)的重要性日益提高,今后将是数据推动技术的进步。大数据不仅改变了社会经济生活,也在影响了每个人的生活和思维方式,而这样的改变才刚刚开始。 (1)规模更大、种类更多、结构更复杂的数据     虽然目前以 Hadoop为代表的技术取得了巨大的成功,但是随着大数据迅猛的发展速度,这些技术肯定也会落伍被淘汰。就如同Hadoop,它的理论基础早在2006年就己诞生。为了能更好地应对未来规模更大、种类更多、结构更复杂的数据,很多研究者己经开始关注此问题,其中最为著名的当属谷歌的全球级的分布式数据库Spanner[4],以及可容错可扩展的分布式关系型数据库Fl[5]。未来,大数据的存储技术将建立在分布式数据库的基础上,支持类似于关系型数据库的事务机制,可以通过类SQI二语法高效地操作数据。 (2)数据的资源化 既然大数据中蕴藏着巨大的价值,那么掌握大数据就掌握了资源。从大数据的价值链分析,其价值来自数据本身、技术和思维,而核心就是数据资源,离开了数据技术和思维是无法创造价值的。不同数据集的重组和整合,可以创造出更多的价值。今后,掌控大数据资源的企业,将数据使用权进行出租和转让就可以获得巨大的利益。 (3)大数据促进科技的交叉融合 大数据不仅促进了云计算、物联网、计算中心、移动网络等技术的充分融合,还催生了许多学科的交叉融合。大数据的发展,既需要立足于信息科学,探索大数据的获取、存储、处理、挖掘和信息安全等创新技术与方法,也需要从管理的角度探讨大数据对于现代企业生产管理和商务运营决策等方而带来的变革与冲击。而在特定领域的大数据应用,更需要跨学科人才的参与。 (4)大数据可视化     在许多人机交互场景中,都遵循所见即所得(what you see is what you get, WYSIWYU)的原则,例如文本和图像编辑器等。在大数据应用中,混杂的数据本身是难以辅助决策的,只有将分析后的结果以友好的形式展现,才会被用户接受并加以利用。报表、直方图、饼状图、回归曲线等经常被用于表现数据分析的结果,以后肯定会出现更多的新颖的表现形式,例如微软的”人立方”社交搜索引擎使用关系图来表现人际关系。 (5)面向数据     程序是数据结构和算法,而数据结构就是存储数据的。在程序设计的发展历程中,也可以看出数据的地位越来越重要。在逻辑比数据复杂的小规模数据时代,程序设计以而向过程为主;随着业务数据的复杂化,催生了面向对象的设计方法。如今,业务数据的复杂度己经远远超过业务逻辑,程序也逐渐从算法密集型转向数据密集型。可以预见,一定会出现而向数据的程序设计方法,如同面向对象一样,在软件工程、体系结构、模式设计等方而对IT技术的发展产生深远的影响。 (6)大数据引发思维变革 在大数据时代,数据的收集、获取和分析都更加J决捷,这些海量的数据将对我们的思考方式产生深远的影响。在文献中,对大数据引发的思维变革进行了总结:     ①分析数据时,要尽可能地利用所有数据,而不只是分析少量的样本数据。     ②相比于精确的数据,我们更乐于接受纷繁复杂的数据。     ③我们应该更为关注事物之间的相关关系,而不是探索因果关系。     ④大数据的简单算法比小数据的复杂算法更为有效。     ⑤大数据的分析结果将减少决策中的草率和主观因素,数据科学家将取代”专家”。 (7)以人为本的大数据 纵观人类社会的发展史,人的需求及意愿始终是推动科技进步的源动力。在大数据时代,通过挖掘和分析处理,大数据可以为人的决策带来参考答案,但是并不能取代人的思考。正是人的思维,才促使众多利用大数据的应用,而在大数据更像是人的大脑功能的延伸和扩展,而不是大脑的替代品。随着物联网的兴起,移动感知技术的发展,数据采集技术的进步,人不仅是大数据的使用者和消费者,还是生产者和参与者。基于大数据的社会关系感知、众包、社交网络大数据分析等与人的活动密切相关的应用,在未来会受到越来越多的关注,也必将引起社会活动的巨大变革。 参考文献 [1] Gantz J, Reinsel D. Extracting value from chaos[J]. IDC iview, 2011 (1142): 9-10. [2] Brown J S, Hagel J. The next frontier of innovation[J]. The McKinsey Quaterly, 2005 (3): 83-91. [3] Manyika J, Chui M, Brown B, et al. Big data: The next frontier for innovation, competition, and productivity[J]. 2011. [4] Corbett J C, Dean J, Epstein M, et al. Spanner: Google’s globally distributed database[J]. ACM Transactions on Computer Systems (TOCS), 2013, 31(3): 8. [5] Shute J, Oancea M, Ellner S, et al. F1: the fault-tolerant distributed RDBMS supporting google's ad business[C]//Proceedings of the 2012 ACM SIGMOD International Conference on Management of Data. ACM, 2012: 777-778.
本文档为【大数据的应用现状与展望】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: 免费 已有0 人下载
最新资料
资料动态
专题动态
is_594905
暂无简介~
格式:doc
大小:76KB
软件:Word
页数:11
分类:生活休闲
上传时间:2017-09-19
浏览量:171