加入收藏 | 设为首页 | 会员中心 | 我要投稿 河北网 (https://www.hebeiwang.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 业界 > 正文

被瞻仰和忘记过的Cloudera是否能王者回来?

发布时间:2020-04-15 16:46:03 所属栏目:业界 来源:站长网
导读:副问题#e# 先想象这样一个场景 你家有个天台,上面什么都没有。 你一筐筐的把土背上去,铺了一小块地,然后又担水施肥,种了几垄黄瓜、几棵西红柿和一小簇青菜。 你照顾的很专心,他们长势也很不错,红红绿绿,晨曦中沾满露珠,披发出土壤的气味。 然后比及
副问题[/!--empirenews.page--]

先想象这样一个场景——

你家有个天台,上面什么都没有。

你一筐筐的把土背上去,铺了一小块地,然后又担水施肥,种了几垄黄瓜、几棵西红柿和一小簇青菜。

你照顾的很专心,他们长势也很不错,红红绿绿,晨曦中沾满露珠,披发出土壤的气味。

然后比及秋日,你兴冲冲跑上天台,功效门一开,噗的惊飞一片麻雀,噗噗啦啦之后只见黄瓜断了,西红柿也全是洞,他们绿的红的汁,滴在被爪子踩的不成样子的青菜里,一片散乱。

并且这照旧个温顺又妖冶的午后。

于是你闻着别处的稻香,在金黄的金风抽丰里,感想一阵苦楚。

——这时你再看Cloudera的故事,或许才气感同身受。

01 被瞻仰的

Cloudera的故事要从Hadoop开始说,而说Hadoop就离不开Doug Cutting。

Doug Cutting此刻是Apache基金会的主席,尺度的大神。在我心目中,他和谷歌AI认真人Jeff Dean、Linux之父Linus并称三大天王,高山仰止,令我自惭形秽,最终放弃编程。

2004年,Doug Cutting正在捣鼓Nutch,Nutch是一个开源搜刮引擎,关于它和Lucene的故事又是一个传奇,可以再开一篇单独讲。总之,Doug Cutting遇到了一些大局限索引和漫衍式计较的题目,刚好这时看到谷歌颁发的两篇论文里有相似场景及办理方案。细心研究之后,他认为很是有原理,于是很快就把论文里的技能实现了,包罗一个漫衍式计较框架MapReduce和一个漫衍式存储体系HDFS,然后放进了本身的Nutch里。

2006年,Doug Cutting预感想这种数据处理赏罚技能有着更大的潜力,便把MapReduce和HDFS从Nutch中独立出来,合成一个后开源了,取名为Hadoop。那会他儿子恰恰两岁,不大会谈话,总管本身的玩具象叫Hadopp,Doug Cutting灵机一动,便把这个名字拿了过来。

同年,为了进一步成长Hadoop,Doug Cutting抉择插手互联网公司里最大的雅虎。

或许他也没想到,大数据期间的序幕就这样被拉开了。

在雅虎,Hadoop的集群局限很快过千,Doug Cutting也熟悉了雅虎副总裁Amr Awadallah。

为了反抗日渐崛起的谷歌,Amr其时正在研究怎样让雅虎搜刮更智能,也遇到许多机能、本钱与弹性的题目。在Doug Cutting的提议下,他开始实行Hadoop。在随后的两年里,Amr基于Hadoop改革了之前的数据处理赏罚体系,功效可以说是惊人的好——完成沟通的事变,新体系本钱不外是之前的异常一,更重要的,他们还能做之前基础无法想象的工作,好比全量说明以PB记的数据。

这让Amr大为惊喜,他进一步想,这些题目应该不止雅虎会遇到,Hadoop这种革命性的数据处理赏罚手段里蕴含着庞大商机。于是他萌生了一种设法,创业。这并不是Amr的第一次创业,现实上他在很早之前就创建了一家叫做VivaSmart的公司,然后2000年公司被雅虎收购,他才随之插手雅虎。

Amr召集起几个志同志合的人,包罗两位别离来自谷歌和Facebook的工程师和一位来自Oracle的司理人Mike Olson,很快在硅谷创立了一家公司,本身接受CTO。

公司的名字叫Cloudera,CEO是Mike Olson。

Mike Olson何许人也?着实他和Amr一样,也是本身的公司被收购后插手大公司的。在Oracle之前,他曾是Sleepycat的CEO,而在Sleepycat之前,他又参加过IIIustra的创业。这两家都是在开源软件上创业的贸易公司,Sleepycat基于Berkeley DB,IIIustra基于PostgreSQL。这险些和他们要做的Cloudera千篇一律。

当时是2008年,Hadoop正以燎原之势伸张,不只囊括了硅谷,也燃烧到了大洋彼岸的淘宝和百度等,于是很快就成了Apache的顶级项目。

一年后,Doug Cutting插手Cloudera,地位是首席架构师,而作为Hadoop的首创人,他也很快被选为Apache基金会主席。

天时、地利、人和,独角兽的羽翼鼓涨满满,只等风来。

2009年,Cloudera拿到了500万美金的第一笔投资,2011年,拿到了4000万美金的第二笔,三年之后,它又拿到了高达9亿美金的第三笔。

假如当时你搜刮Hadoop is,输入栏会自动补齐 future。

我记适当时我大学快结业。有次看到班里一个同窗正坐在电脑前贱兮兮的笑,我问他在干啥,他说在改简历,我越发好奇便凑了已往,只见他正把一段网上复制的内容贴到“手艺“那一栏里去。我不解,他咔咔使劲按了几下Control+S后嘻嘻道,此刻风行云计较,只要描写里呈现Hadoop,必定能过简历关。

并且颠末实践,这是真的。Hadoop受接待的浮夸水平,可见一斑。

其它,预计那会各人都分不清什么是云计较哪个是大数据,不只我分不清,你看阿里云早期的飞天体系,着实也是一个大数据处理赏罚器材,并且也许Cloudera也分不清,否则怎么他一个搞Hadoop的公司,起名叫Cloudera呢?

这边Hadoop蛮横发展,何处Cloudera合纵连横,先是和Oracle告竣计谋相助,接着戴尔、Intel、埃森哲、德勤、MasterCard、SAP、TeraData、微软等也纷纷入局。

全部人都存眷着它,恐怕错过什么。

2013年的时辰,Mike Olson信念十足的写下了《The Cloudera Model》一文,暗示Cloudera已经找到了Hadoop上乐成的贸易模式。

当时的Cloudera,可以说是大数据规模最刺眼的星。2015岁月尔街日报做了一个独角兽排名,它是独一上榜的大数据公司,排名21,比公共点评还高。

2017年,Cloudera乐成上市。

02 被忘记的

跟着时刻成长,Hadoop的观念逐渐泛化。一开始只有HDFS和Mapreduce,然后是一个以HDFS和YARN为基本的平台,再之后是一个包括Spark、Hive、Hbase等几十个项目和子项目标生态,最后,乃至又带上了以Hadoop为基本的贸易公司,如Cloudera、Hortonworks、MapR等。

这种泛化有个弊端,那就是一旦呈现负面消息,各人每每分不清该怪谁。

好比作为一种技能,Hadoop必定有那时效性。就像Mapreduce,固然计较手段强盛,但统统都是先Map再Reduce的抽象水平其实太卤莽,以至于理念上很快就被Spark、Flink等这种更先辈的技能打败了。与之相似的,尚有HDFS和YARN,从技能上说,前者不如云存储利便,后者不如K8S机动,都有被代替的风险。

于是有人便开始宣称Hadoop已死,然后又说,由于Hadoop已死,Cloudera也不可了。典范的用狭义观念做总结,用广义观念做推导,就像无意看到汽车高出了一辆绿皮车,就立马得出铁路运输已死,公路运输是将来一样。

然而这种暴力论断却很是有市场。

(编辑:河北网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读