加入收藏 | 设为首页 | 会员中心 | 我要投稿 河北网 (https://www.hebeiwang.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 大数据 > 正文

大数据的焦点是云技能和BI

发布时间:2018-07-22 12:33:23 所属栏目:大数据 来源:51CTO
导读:关于大数据和云计较的相关人们凡是会有误解。并且也会把它们混起来说,别离做一句话直白表明就是:云计较就是硬件资源的假造化;大数据就是海量数据的高效处理赏罚。假如做一个更形象的表明,云计较相等于我们的计较机和操纵体系,将大量的硬件资源假造化之后再

关于大数据和云计较的相关人们凡是会有误解。并且也会把它们混起来说,别离做一句话直白表明就是:云计较就是硬件资源的假造化;大数据就是海量数据的高效处理赏罚。假如做一个更形象的表明,云计较相等于我们的计较机和操纵体系,将大量的硬件资源假造化之后再举办分派行使;大数据则相等于海量数据的“数据库”。

整体来看,将来的趋势是,云计较作为计较资源的底层,支撑着上层的大数据处理赏罚,而大数据的成长趋势是,及时交互式的查询服从和说明手段,当前的大数据处理赏罚一向在向着近似于传统数据库体验的偏向成长。

大数据的4V特征,即范例伟大,海量,快速和代价,其总体架构包罗三层,数据存储,数据处理赏罚和数据说明。范例伟大和海量由数据存储层办理,快速和时效性要求由数据处理赏罚层办理,代价由数据说明层办理。数据先要通过存储层存储下来,然后按照数据需求和方针来成立响应的数据模子和数据说明指标系统对数据举办说明发生代价。而中间的时效性又通过中间数据处理赏罚层提供的强盛的并行计较和漫衍式计较手段来完成。三层彼此共同,让大数据最终发生代价。

数据存储层  

数据有许多分法,有布局化,半布局化,非布局化;也有元数据,主数据,营业数据;还可以分为GIS,视频,文件,语音,营业买卖营业类各类数据。传统的布局化数据库已经无法满意数据多样性的存储要求,因此在RDBMS基本上增进了两种范例,一种是hdfs可以直策应用于非布局化文件存储,一种是nosql类数据库,可以应用于布局化和半布局化数据存储。

从存储层的搭建来说,相关型数据库,NoSQL数据库和hdfs漫衍式文件体系三种存储方法都必要。营业应用按照现实的环境选择差异的存储模式,可是为了营业的存储和读取利便性,我们可以对存储层进一步的封装,形成一个同一的共享存储处事层,简化这种操纵。从用户来讲并不体谅底层存储细节,只体谅数据的存储和读取的利便性,通过共享数据存储层可以实此刻存储上的应用和存储基本配置的彻底解耦。

数据处理赏罚层 

数据处理赏罚层焦点办理题目在于数据存储呈现漫衍式后带来的数据处理赏罚上的伟大度,海量存储后带来了数据处理赏罚上的时效性要求,这些都是数据处理赏罚层要办理的题目。

在传统的云相干技能架构上,可以将hive,pig和hadoop-mapreduce框架相干的技能内容所有划入到数据处理赏罚层的手段。原本我思索的是将hive划入到数据说明层手段不吻合,由于hive重点照旧在真正处理赏罚下的伟大查询的拆分,查询功效的从头聚合,而mapreduce自己又实现真正的漫衍式处理赏罚手段。

mapreduce只是实现了一个漫衍式计较的框架和逻辑,而真正的说明需求的拆分,说明功效的汇总和归并照旧必要hive层的手段整合。最终的目标很简朴,即支持漫衍式架构下的时效性要求。

数据说明层

最后回到说明层,说明层重点是真正发掘大数据的代价地址,而代价的发掘焦点又在于数据说明和发掘。那么数据说明层焦点如故在于传统的BI说明的内容。包罗数据的维度说明,数据的切片,数据的上钻和下钻,cube等。

数据说明我只存眷两个内容,一个就是传统数据客栈下的数据建模,在该数据模子下必要支持上面各类说明要领和说明计策;其次是按照营业方针和营业需求成立的KPI指标系统,对应指标系统的说明模子和说明要领。办理这两个题目根基办理数据说明的题目。

传统的BI说明通过大量的ETL数据抽取和齐集化,形成一个完备的数据客栈,而基于大数据的BI说明,也许并没有一个齐集化的数据客栈,可能将数据客栈自己也是漫衍式的了,BI说明的根基要领和思绪并没有变革,可是落地到执行的数据存储和数据处理赏罚要领却产生了大变革。

谈了这么多,焦点照旧想声名大数据两大焦点为云技能和BI,分开云技能大数据没有根本和落地也许,分开BI和代价,大数据又变革为本末倒置,扬弃要害方针。简朴总结就是大数据方针驱动是BI,大数据实验落地式云技能。

(编辑:河北网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    热点阅读