加入收藏 | 设为首页 | 会员中心 | 我要投稿 河北网 (https://www.hebeiwang.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 建站 > 正文

从概念到管理,一文读懂元数据

发布时间:2019-07-12 23:31:35 所属栏目:建站 来源:美创科技
导读:现在,各行各颐魅正在被猖獗的大数据所困绕,企业需网络,归档,研究的数据量也日益增添。面临浩如烟海的数据,企业打点者应以什么为抓手来打点数据,充实发掘数据的代价呢?谜底就是元数据。 Gartner 曾在研究陈诉里指出,元数据打点将是将来企业信息化的核

现在,各行各颐魅正在被“猖獗”的大数据所困绕,企业需网络,归档,研究的数据量也日益增添。面临浩如烟海的数据,企业打点者应以什么为抓手来打点数据,充实发掘数据的代价呢?谜底就是“元数据”。

Gartner 曾在研究陈诉里指出,“元数据打点将是将来企业信息化的焦点基本办法”,尤其在大数据情形中,假如企业不通过元数据打点把多种伟大的信息打点起来,很难做到信息的有用操作。

从观念到打点,一文读懂元数据

“那么,毕竟作甚元数据,作甚元数据打点?本文将为各人梳理元数据的观念,辅佐企业领略元数据打点的浸染。”

一、什么是元数据?

元数据被界说为:对数据及信息资源的描写性信息。简朴来说就是“关于数据的数据”。

好比:在上网选购衣服时,网店上展示的一件件衣服就是数据。而个中,衣服的品牌、技俩、尺寸、颜色、面料材质、合用年数等就是元数据,这些元数据具体描写了这件衣服的详细信息,为你的购物选择提供参考。

在糊口中,元数据的应用场景很是多,乃至可以说,从我们呱呱落地开始熟悉这个天下的时辰,我们就与元数据密不行分,好比图书馆的藏书信息卡、小我私人的信息挂号等都属于元数据的应用。

二、元数据有什么特点?

  • 元数据是关于数据的布局化的数据。
  • 元数据是与工具相干的数据,此数据使其隐藏的用户不必先具备对这些工具的存在和特性的完备熟悉。
  • 元数据是对信息包裹 (information package) 的编码的描写。
  • 元数据包括用于描写信息工具的内容和位置的数据元素集,促进了收集情形中信息工具的发明和检索。
  • 元数据不必然是数字情势。
  • 元数据不只对信息工具举办描写,还可以或许描写资源的行使情形、打点、加工、生涯和行使等方面的环境。
  • 元数据可来自差异的资源。
  • 在信息工具或体系的生命周期中天然增进元数据。
  • 元数据通例界说中的“数据”,是暗示事宜性子的标记,是举办各类统计、计较、科学研究、技能计划所依据的数值,或是说数字化、公式化、代码化、图表化的信息。

三、元数据的浸染

01、元数据是举办数据集成所必需的

我们知道,数据客栈最大的特点就是它的集成性。这一特点不只表此刻它所包括的数据上,还表此刻实验数据客栈项目标进程傍边:

一方面,从各个数据源中抽取的数据要凭证必然的模式存入数据客栈,这些数据源与数据客栈中数据的对应相关及转换法则都要存储在元数据常识库里。而另一方面,在数据客栈项目实验进程中,直接成立数据客栈每每费时、艰辛。

因此在实践傍边,人们也许会凭证同一的数据模子,起首建树数据集市,然后在各个数据集市的基本上再建树数据客栈。不外,当数据集市数目增多时很轻易形成“蜘蛛网”征象,而元数据打点是办理“蜘蛛网”的要害。

02、元数据可以辅佐用户领略数据客栈的数据

体系用户不行能像数据客栈体系打点员或开拓职员那样认识数据库技能,因此急切必要有一个“翻译”,可以或许使他们清楚地领略数据客栈中数据的含意。

元数据可以实现营业模子与数据模子之间的映射,因而可以把数据以用户必要的方法“翻译”出来,从而辅佐最终用户领略和行使数据。

03、元数据是担保数据质量的要害

企业数据集成完成之后,在行使的进程中,用户经常会对数据发生猜疑。这是因为底层的数据对付用户来说是不“透明”的,行使者很天然地对功效发生猜疑。

借助元数据打点体系,最终的行使者对各个数据的前因后果以及数据抽取和转换的法则城市很利便地获得,这样他们天然会对数据具有信念;虽然也可便捷地发明数据所存在的质量题目。

04、元数据可以支持需求变革

跟着信息技能的成长和企业职能的变革,企业的需求也在不绝地改变。传统的信息体系每每是通过文档来顺应需求变革,可是仅仅依赖文档远远不足。

元数据独立于平台,可以把整个营业的事变流、数据流和信息流有用地打点起来,使得体系不依靠特定的开拓职员,从而进步体系的可扩展性。

四、元数据打点成果

元数据打点为大数据平台绘制数据舆图、同一数据口径、标明数据方位、说明数据相关、打点模子改观及准确到字段级此外影响说明,买通上下流数据担任相关断层,为数据质量维护和营业逻辑可视化打下坚硬基本。

在这里我们首要对元数据打点中数据舆图、血缘说明、影响说明成果举办深入相识。

01、数据舆图

数据舆图以拓扑图的情势对企业运营进程中的技能元数据与营业元数据举办分条理的图形化揭示,并通过差异条理的图形揭示粒度节制,满意开拓、运维可能营业上差异应用场景的图形查询和帮助说明必要。

02、血缘说明

血缘说明(也称血统说明)是指从某一实体出发,往回追溯其处理赏罚进程,直到方针说明工具,凭证转化相关逐层扩展。

血缘说明直观的展示方针工具的发生进程,包罗从哪些表转换而来,经验了哪些转换,从而辅佐营业职员相识它在此进程中被赋予的寄义,以及会受到的影响。

03、影响说明

影响说明描写了信息之间依靠性的细节,说明一个数据源产生变革时带来的影响。

影响说明反应了当前工具在企业体系各平台中,参加了哪些元数据的形成。用户可以借助影响说明调查该工具的影响手段,即对付当前元数据修改,会对哪些儿女元数据造成影响。

五、竣事语

大数据期间下,无法发掘的数据将没有任何代价,换句话说,假如没有打点好元数据,网络和存储的数据城市失去意义,也就没有营业代价。

因此,企业信息化打点者只有从头拾起元数据,以元数据为抓手举办数据管理,慢慢梳理企业数据、相关,增强管控,才气更好地打点企业数据资产。

(编辑:河北网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    热点阅读