加入收藏 | 设为首页 | 会员中心 | 我要投稿 河北网 (https://www.hebeiwang.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 创业 > 正文

基于大数据的舆情分析系统架构(架构篇)

发布时间:2019-06-15 19:37:49 所属栏目:创业 来源:InfoQ
导读:副问题#e# 互联网的飞速成长促进了许多新媒体的成长,岂论是知名的大 V,明星照旧围观群众都可以通过手机在微博,伴侣圈可能点评网站上颁发状态,分享本身的所见所想,使得大家都有了麦克风。岂论是热门消息照旧娱乐八卦,撒播速率远超我们的想象。可以在短

这套架构在存储层面,所有基于 Tablestore,一个数据库办理差异存储需求,按照之前舆情体系的先容,网页爬虫数据在辖档枉动中会有四个阶段别离是原始网页内容,网页布局化数据,说明法则元数据和舆情功效,舆情功效索引。我们操作 Tablestore 宽行和 schema free 的特征,归并原始网页和网页布局化数据成一张网页数据。网页数据表和计较体系通过 Tablestore 新成果通道处事举办对接。通道处事基于数据库日记,数据的组织布局凭证数据的写入次序举办存储,正是这一特征,赋能数据库具备了行列流式斲丧手段。使得存储引擎既可以具备数据库的随机遇见,也可以具备行列的凭证写入次序会见,这也就满意我们上面提到整合 Lambda 和 kappa 架构的需求。说明法则元数据表由说明法则,情绪词库组层,对应及时计较中的维表。

(编辑:河北网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读