加入收藏 | 设为首页 | 会员中心 | 我要投稿 河北网 (https://www.hebeiwang.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 云计算 > 正文

聚焦技术发展及开源生态 腾讯全面揭秘大数据平台演进之路

发布时间:2019-11-17 00:08:28 所属栏目:云计算 来源:通信世界全媒体
导读:11月7日,腾讯Techo开拓者大会的腾讯大数据分论坛上,环绕大数据的新技能盼望及开源生态,腾讯大数据团队举办了具体解读,包罗由集群局限化与异构化挑衅所激发的漂移计较等新技能创新,越来越广泛的及时计较需求以及新架构的实践,可以或许无穷弹性扩展的、面

11月7日,腾讯Techo开拓者大会的“腾讯大数据”分论坛上,环绕大数据的新技能盼望及开源生态,腾讯大数据团队举办了具体解读,包罗由集群局限化与异构化挑衅所激发的漂移计较等新技能创新,越来越广泛的及时计较需求以及新架构的实践,可以或许无穷弹性扩展的、面向将来的数据湖系统布局,大数据技能成长的新趋势与新挑衅等。

1573202350313014313.png

腾讯也通过开源和宽大开拓者共享技能成就,并但愿敦促业界配合插手构建开源正生态。在前一天的大会主论坛上,腾讯云副总裁、腾讯数据平台部总司理蒋杰博士公布资源打点平台焦点TKE和漫衍式数据库TBase正式对外开源,腾讯正在走向大数据规模全面开源之路。

十年技能演进 从引进到自研

蒋杰指出,自2009年起,腾讯大数据平台已完成三次迭代,从以Hadoop为焦点的离线计较期间到以Storm、Spark、Flink为焦点的及时计较期间,再到现在的呆板进修和深度进修期间。颠末10年的蕴蓄,腾讯大数据平台的算力资源池今朝已有高出20万台的局限,天天及时数据计较劲高出30万亿条,腾讯已经成为中国及时数据计较劲最大的公司。

从开始的技能引进、局部优化到现在的自主创新,腾讯的大数据技能在实践中不绝优化、不绝完美。跟着体系演进和数据增添,异构集群、异构数据源题目凸显,为了低落数据行使壁垒,漂移计较平台研发认真人张韶全博士暗示:“腾讯大数据客岁自研了漂移计较引擎SuperSQL,满意跨地域、跨集群、跨数据源的联邦数据需求,通过办理数据孤岛、优化资源行使,可以或许极大地低落数据连系说明的行使门槛,晋升数据行使服从,最大化数据行使的代价。”

1573202378799052238.png

(腾讯漂移计较平台研发认真人张韶全博士)

2015年起,腾讯就开始对大数据举办及时化的改革,到此刻腾讯内部全部产物都已经普及开始行使及时计较的模式。据及时计较平台研发认真人施晓罡博士先容,Oceanus是腾讯基于Flink打造的集开拓、测试、陈设和运维于一体的一站式可视化及时计较平台。今朝Oceanus在内部支持了包罗微信、QQ、腾讯游戏、腾讯视频、微信付出、财付通和CDN在内的多个重要产物,并在腾讯云上为公有云和私有云用户提供靠得住的及时计较处事。环绕着内部海量营业,oceanus团队同时将现网面对的种种题目以及办理本领反馈给社区,今朝已经孝顺了高出300多个的patch,为flink不变性、扩展性、易用性以及高机能做出重要孝顺。

1573202407988045672.png

(腾讯及时计较平台研发认真人施晓罡博士)

而跟着数据应用越来越深入,腾讯对数据发掘的需求也越来越多。2015年头,腾讯开始自研高机能的漫衍式呆板进修平台Angel,回收PS架构,能支持10亿维度,今朝Angel成长到3.0版本,能支持万亿维度,也可以兼容Spark、PyTorch、TensorFlow等生态。从1.0到3.0,Angel从一个单一的模子实习平台成长到涵盖呆板进修各个流程的全栈呆板进修平台,而且已应用于微信付出、QQ、腾讯视频、腾讯交际告白及用户画像发掘等营业。

今朝,腾讯正在试探以批流融合、ABC融合、以及数据湖和联邦进修为偏向的下一代大数据平台的研究,该平台将具备殽杂陈设、跨域数据共享和边沿计较等手段。

大数据平台全面开源 助力构建开源生态

本年,在内部开源协同的计谋敦促下,腾讯在大数据开源规模的开源慢慢加快。此次在Techo大会现场,腾讯重磅公布正式开源资源打点平台焦点TKE和漫衍式数据库TBase,至此完成了腾讯大数据焦点手段全开源,并祈望敦促业界一路构建繁荣的开源生态。

个中,TKE是基于 Kubernetes 的开源容器平台,在大数据,深度进修,通用处事等现网营业的实践和打磨下,可以同时处事公有云和私有云,而且在易用性,靠得住性,安详性,通用性等方面领先业界。今朝TKE已应用于腾讯表里部游戏、银行、汽车等多项营业。

TBase则是在开源的PostgreSQL基本上自主研发的企业级漫衍式HTAP数据库打点体系,具备高扩展性、SQL高兼容度、提供漫衍式全局事宜同等性成果支持、多级容灾手段以及多维度资源断绝手段的高安详性等特性,同时支持相关模子下的在线买卖营业+说明型营业。自2015年上线以来,TBase已在腾讯表里部包罗政务、银行、保险、证券、微信付出等多个行业提供底层数据库支撑。

在大数据规模,从2014开始,腾讯将第一代大数据平台的焦点,腾讯版的Hive举办了开源,2017年,更是把第三代平台的焦点Angel开源并捐募给Linux基金会。2个月前,在ApacheCon 2019上,腾讯面向环球开拓者正式公布开源及时数据收罗平台TubeMQ,并捐募给Apache社区。

在蒋杰看来,构建开源生态,一方面可以吸引更多的优越开拓者插手腾讯,一路敦促技能研发越发前进;另一方面,整个开源生态的繁荣,可以或许闪开源软件的成果越发完美,也可以或许更好的支撑腾讯的营业成长。如腾讯不绝在云端演进和富厚大数据产物矩阵,今朝已稀有百万活泼开拓者在云端进修、接头、建树,其连系行业相助搭档配合打造了包围19个行业的100多个行业办理方案,配合处事的客户数到达了20多万家,小我私人客户60多万家。

“开源是但愿更好的回馈社区,但愿开源生态能有更大的繁荣,腾讯的大数据将全面开源。”蒋杰暗示。

【凡本网注明来历非中国IDC圈的作品,均转载自其余媒体,目标在于转达更多信息,并不代表本网拥护其概念和对其真实性认真。】

(编辑:河北网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    热点阅读