加入收藏 | 设为首页 | 会员中心 | 我要投稿 河北网 (https://www.hebeiwang.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 移动互联 > 正文

一出上云大戏,一曲数据客栈的悲歌?

发布时间:2019-01-24 12:18:58 所属栏目:移动互联 来源:张飞逸编译
导读:对付一家自身组织运行汗青数十年的公司来说,数据客栈会是一种有用辅佐其陈诉和领略相干操纵的方法。 在数据客栈呈现之前,对来自差异体系的数据举办陈诉与网络是一项昂贵、耗时并且经常徒劳无功的实行,而数据客栈担保了来自单个存储库数据的干净与集成性
副问题[/!--empirenews.page--]

对付一家自身组织运行汗青数十年的公司来说,数据客栈会是一种有用辅佐其陈诉和领略相干操纵的方法。

在数据客栈呈现之前,对来自差异体系的数据举办陈诉与网络是一项昂贵、耗时并且经常徒劳无功的实行,而数据客栈担保了来自单个存储库数据的干净与集成性。

将多种报表器材毗连到单个数据模子的手段催生了一个我们今朝很数据的行业: 贸易智能(BI)。然而,因为伟大的要领和计划、不恰当的器材以及高的开拓、维护和基本办法本钱所拖累,传统数据客栈系统布局和要领的原始观念应用在本日也变得不再那么易于接管。

一出上云大戏,一曲数据客栈的悲歌?

可以说,不久前,计较依然是一个很是昂贵的资源,数据客栈还受到“稀缺性打点(managing from scarcity)”见识的限定。相反,种种方案数据计划也在只管镌汰数据库的局限,好比通过聚合数据、建设伟大的子数据库计划和亲近监测资源的行使等。

数据客栈,已凉?

跟着大数据,尤其是Hadoop的崛起,我们常常会听到供给商、说明师和大咖们说数据客栈已经死了。事实,它们昂贵、僵硬、迟钝。统统都如老鹰乐队(译者注:知名美国摇滚乐队,代表作加州旅店)主唱格列·弗雷(Glenn Frey)在一首歌中写到的歌词:“这是简朴资源的勾引,有很强的吸引力。”

人们常说,大数据是游戏法则改变者和数据客栈的担任者。但它着实不是,假如说有什么区此外话,那就是大数据为数据客栈提供了一个实现(可能至少是将其延长到更靠近其原始目地的处所)的机遇:成为有效的、可操纵的说明数据来历。

但数据客栈的思索者必需放弃对物理布局的执着才气做到这一点。相反,将来的数据客栈将不得不与很多差异的数据源相助。它将充当一种假造布局,运行一种“宁静的”汗青数据客栈,并举办极致化、不受束缚的说明数据库以提供及时更新和及时相应,另外它还将运行其他非相关型大数据集群(如Hadoop)的困绕计策。这样,大数据会迫使组织扩大其说明营业的局限,无论是在数目上照旧在投入的种类上,而同样重要的是,要扩展其关于如安在组织表里扩展和增强技能行使的愿景。

当地陈设?云?殽杂?

以下是今朝部门(但不完备)的数据客栈平台列表:

传统数据客栈“幸存者”,他们最初是当地陈设,此刻是殽杂模式:

  • IBM
  • Microsoft
  • Teradata
  • Pivotal/Greeenplum
  • Oracle

纯云:

  • Redshift
  • Snowflake
  • Incorta
  • Google

一样平常来说,相关型数据库(RDB)的数据客栈担任了上述这些模式的全部利益和弱点,出格是对付那些专为事宜处理赏罚而计划的RDB而言,可是后者的计划初志是为了数据客栈和它们用以支持说明的出格处理赏罚需求。

对付微软,IBM和Oracle来说都是云云。在数据客栈的早期阶段,这三种产物的机能很是差,这促使客户寻求了那些专为数据客栈运营而计划的产物,譬喻Teradata,Red Brick,Pivotal / Greemplum,Vertica以及Paraccel,后者的来历代码由亚马逊授权并从头定名为Redshift。

厂商们在改造他们数据客栈产物方面取得了必然的盼望。如微软授权Sybase为SQLServer提供代码,IBM和Oracle也不绝改造和改造他们的产物。

就今朝而言,全部五个“幸存者”都拥有完备的云,当地陈设和殽杂云办理方案。题目是,“纯云计较”产物和“幸存者”的云产物真的有什么差异吗?

每个产物都有一系列重叠的成果,但焦点题目是:

  • 基于云的数据客栈有哪些上风?
  • 与纯云产物对比,“幸存者”是否提供了足够的上风?

大数据处事公司Alooma 指出:

  • “每个云客栈都有本身的布局,而不是遵循特定的布局。譬喻,Amazon Redshift仿照传统数据客栈的布局,而谷歌BigQuery基础不行使处事器,它应承用户查询和共享数据,而无需配置和付出存储用度。”

那么,云数据客栈会带来些什么?

局限/扩展性: 凡是,计较资源是数据客栈中比数据存储更昂贵的组件。通过将计较资源从存储中疏散出来,数据客栈可以存储大量数据,并按要求处理赏罚信息。在当处所案中,全部这些数据都必要以高得多的本钱举办当地存储。

机动性:通过将数据从计较流程中疏散出来,用户可以建设所需的恣意数目的假造数据客栈。

机能: 这如故是一个一览无余的工作,在数据客栈/说明查询中,仅仅多运行几个处事器并不料味着机能的晋升。让Teradata这样专门的厂商云云乐成的缘故起因是,几十年的工程计划,大局限的并行处理赏罚优化和事变负载的打点技能,或者最重要的是,Teradata提供软件引擎与用户所运行的专有硬件之间的链接,而且机能还在不绝改进。

本钱: 每小我私人都在说云改变了订价模式,可是没人确定实验的本钱是几多。便宜存储的勾引也许会导致工作失控,由于它也许是相对自制的,但终归不是免费的。全部的传统厂商都转向了订阅订价方案,但每个条约都很是伟大。这里提议是礼聘一位条约和订价细节方面的专家(我们在ERP规模中常常看到这一点)。

安详性:这是一个棘手的题目,由于有太多的接入点,尤其是在殽杂办理方案中。大大都数据库产物会实验针对内部威胁的安详性,可是近些年来自外部威胁的激增。

一个数据客栈应具有哪些手段?

  • 支持任何数据局部性(当地磁盘、Hadoop、私有和公有云数据)。
  • 数据库内高级说明。
  • 可以或许处理赏罚当地种种型数据,如空间、时刻序列和/或文本。
  • 可以或许运行新的说明事变负载,包罗呆板进修、地理空间、图形和文天职析。
  • 机动陈设,包罗在当地、私有和公有云上。
  • 大数据查询优化。
  • 伟大的查询情势。
  • 基于模子的大局限并行处理赏罚,而不只仅是分片处理赏罚。
  • 事变负载打点。
  • 负载均衡。
  • 可扩展到数千个并发查询。
  • 完备的ANSI SQL及更多。

写在最后

(编辑:河北网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读