加入收藏 | 设为首页 | 会员中心 | 我要投稿 河北网 (https://www.hebeiwang.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 站长百科 > 正文

京东云李道兵:工具存储的新挑衅

发布时间:2018-03-29 10:55:30 所属栏目:站长百科 来源:站长网
导读:2018年3月21-22日,由中国信息通讯研究院主办、中国通讯尺度化协会支持的"OSCAR云计较开源财富大会"在国度集会会议中心进行。 跟着云计较技能的日益成长,并开始进入深水区,开源技能与云计较融合的水平进一步加深,并开始成为财富成长的重要支撑。"OSCAR云计
副问题[/!--empirenews.page--]

2018年3月21-22日,由中国信息通讯研究院主办、中国通讯尺度化协会支持的"OSCAR云计较开源财富大会"在国度集会会议中心进行。

跟着云计较技能的日益成长,并开始进入“深水区”,开源技能与云计较融合的水平进一步加深,并开始成为财富成长的重要支撑。"OSCAR云计较开源财富大会"将约请行业内多位大咖与权重人物配合切磋、交换云计较开源技能、研发、管理、财富化方面的履历,试探开源与云计较的创新成长新路径。

京东云高级总监李道兵出席了集会会议并颁发主题演讲,他的演讲主题是《工具存储的新挑衅》。

李道兵


以下为演讲实录:

李道兵:各人好,我是京东云的李道兵。本日我想与各人分享的是工具存储迩来的趋势,以及将来几年时刻我们或许能看到的较量新的对象。

起首,我们看一下已往几年工具存储的数据量趋势。从2013年起,工具存储的总量已经高出布局化数据,在接下来几年,布局化数据的量没有大的增添,或许是很安稳的迟钝增添的趋势,而工具存储则是一个发作性增添趋势。发作性增添毕竟来自于哪?大量增添来自于UGC的内容,而这些UGC内容为什么大局限发作式增添呢?有以下几点可以声名。

第一个点,环球性带宽容量增添和带宽价值降落。中国在五年之前移动照旧2G期间,联通、电信3G期间,此刻4G期间,早年每月流量包200兆程度,此刻险些每小我私人都是几G程度,家庭带宽从2兆、5兆到百兆,这是中国的环境。而天下的环境,好比印度和非洲,大量移动装备的引入,这些都造成了大量带宽的大幅度增添。带广大幅增添带来的就是UGC内容的增添。

第二个点,大量新的交换前言的降生,最早的是笔墨、短信、QQ、微信笔墨版,接下来通过微信平台开始发图片,逐步从图片再到视频,视频再到直播。我们也看到,此刻大量的像快手、陌陌、美拍视频直播平台降生,这里隐含的是斲丧进级是不行逆的。你此刻再回到之前的期间,不应承发图片,不应承在伴侣圈夸耀这个小孩何等可爱,你会受不了,你不会接管谁人功效。

第三个点,我们看到大量的企业,富媒体企业,已经从中乐成试探获利模式,好比美图已经乐成在香港上海,陌陌在美国上市,快手差不多此刻成为中国流量最大企业之一,尽量没有上市,整个估值长短常高的。这些都可以看到,在富媒体驱动下大局限的增添。

其它一个好动静,本年我们可以或许看到,家庭宽带、企业宽带还要继承往降落,这就意味着,这个方面的增添趋势还能继承连续一波。这方面我们能看到一些新的点,AI的引入,在之前,最早我们只是对数据库举办处理赏罚,接下来在我们能对笔墨举办处理赏罚之后,就降生了像Google、百度这样的基于搜刮引擎的巨无霸企业,接下来通过AI的引入,我们慢慢得到通过图片、视频的说明手段,将来可以或许带来什么我们还不大看得清,但至少我认为在将来我们能看到很大的企业基于图片和视频,通过内里的资源发掘手段,从而酿成一个超等巨无霸的公司。AI是一个强有力的器材,能让许多公司的富媒体数据,从本钱酿成资产,许多银行之前有许多传统单据,这些单据他们做大量的照相,藏着。跟着AI加强的OCR技能的引入,这些单据可以所稀有字化。法院早年大量讯断书也是靠图片存着,此刻酿成大量的司法文本语料。我们可以看到,富媒体数据的代价在慢慢增进。

以是说,在工具存储方面,富媒体的增量将来如故很是乐观。

在将来,毕竟尚有什么趋势呢?对付我来讲,看到更多的是两个点。第一个点,半布局化数据大量流入。第二个点,SSD慢慢代替HDD.半布局化是什么?通例放在数据库的称为布局化数据,放在以图片、音频、视频存储的对象我们称为非布局化数据,而中间的一些类日记的海量数据则是半布局化数据,半布局化数据量为什么会急速增进呢?起首是IoT,家庭里各类百般的传感器,穿在身上的传感器,这些传感器城市发生大量数据,这些数据怎样发生代价?必定要生涯起来,做大量的说明,从这内里发生有代价的数据。这样的话就会导致你必要生涯的数据量大局限增进。第二个是自动驾驶,自动驾驶行业是一个巨无霸行业,它发生的代价是什么,它能帮整个天下节减数万万人年。这样有代价的行业它依靠的更多是我们从大量驾驶数据,从内里提取我们将来可以或许做决定的依据,这些对象是半布局化数据的量。第三个是风雅化运营,几年前的互联网市场,容量很大,各人都能敏捷扩张的时辰,不必要风雅化运营。可是此刻进入了互联网下半场,互联网下半场每个企业都面对你赚的钱和你的获客本钱毕竟谁大的题目,要赚钱,就必要你做大量风雅化运营事变。不管是低落你的获客本钱。照旧从单个客户发掘出更大的利润代价,更多照旧从对用户举动举办说明来得到这方面代价。这就带来了大量生涯用户举动数据,说明举动数据的需求。

我们可以看到,此刻生涯半布局化数据存储方法还很是原始,而这些原始方法也许不会满意在将来的一些需求。好比说,此刻大量数据还放在HDFS、elastic search,TSDB可能InfluxDB等时序数据库,容量很是有限,老数据必需迁居到存储,查询老数据的时辰又不得不搬返来,这个题目也很难办理。那么可否思量,我们能不能把大量计较往存储上引呢,对付存储来讲它必要做的是什么?回到适才的题目,我们大部门环境下要做的计较着实不只仅是MapReduce,更准确的是FilterMapReduce,从海量数据内里先举办过滤,然后在做MapReduce计较。那么就可以简朴的做些优化,这个优化就是指我们用工具存储作为半布局化数据的存储池,然后我们在存储内里完成filter操纵,把filter功效拿到计较引擎去做。这样的话可以办理适才许多题目,你的计较引擎支撑不了这么大量的数据,这个时辰通过filter存储包袱大量数据的操纵。从这个角度上讲,对工具存储有一些挑衅,但挑衅并不大,之前我们只提供简朴的PUT, GET., DELETE接口,此刻我们只必要在原始接口上插手filter相干接口就可以了。AWS S3已经提供了S3 select这类的处事,可以或许辅佐我们实现我们想要的成果。

SSD将来对HDD的攻击,此刻工具存储大部门是基于传统的磁盘,在2U空间放下12块硬盘,一块盘8TB可能10TB,这个图是SSD的价值变革曲线图,下面的红线是HDD传统硬盘价值变革曲线,蓝色线和紫色线都是两种SSD价值变革趋势。从这里可以看到,在不远的将来,我们可以看到SSD价值也许低于HDD,虽然,此刻嗣魅这个话机缘有点不太吻合,由于最近SSD和内存正在冒死涨价,各人也许不觉得然,但将来三到五年这个对象也许酿成实际。其它一个陈诉猜测企业市场SSD空间占据率,好比2020年阁下,或容许以或许占到15%. SSD毕竟可以或许给我们带来什么甜头呢?第一个,单元机架容量。传统HDD期间,均匀每U或许能放90TB,SSD期间每U可以简朴放下1000TB,我的存储容量单元晋升10倍,我在一个机柜空间,可能一个机房里存储容量直接上升一个数目级。第二个是功耗。传统HDD功耗每TB必要1.5瓦的程度,SDD可以或许降到0.2瓦的程度,从环保和节减机架用度的角度,我们可以或许降一个数目级。第三个是IOPS.不说了,折合单元容量差了快要30倍阁下,传输速度是5阁下,独一不同就是价值。假如价值不再成为题目的环境下,SSD可以或许给我们带来越发海量的存储,并且只必要更小的体积。

(编辑:河北网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读