加入收藏 | 设为首页 | 会员中心 | 我要投稿 河北网 (https://www.hebeiwang.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 建站 > 正文

粉丝相关链,10亿数据,怎样计划?

发布时间:2019-08-21 20:00:27 所属栏目:建站 来源:58沈剑
导读:继承答星球水友提问,大数据量,高并发量,挚友相关链、粉丝相关链要怎样计划? 什么是相关链营业? 相关链首要分为两类,弱挚友相关与强挚友相关,两类都有典范的互联网产物应用。 弱挚友相关的成立,不必要两边互雷赞成: 用户A存眷用户B,不必要用户B赞成

要领一:处事同步冗余

粉丝相关链,10亿数据,怎样计划?

顾名思义,由挚友中心处事同步写冗余数据,如上图1-4流程:

  • 营业方挪用处事,新增数据
  • 处事先插入T1数据
  • 处事再插入T2数据
  • 处事返回营业方新增数据乐成

利益:

  • 不伟大,处事层由单次写,变两次写
  • 数据同等性相对较高(由于双写乐成才返回)

弱点:

  • 哀求的处理赏罚时刻增进(要插入次,时刻更加)
  • 数据仍也许纷歧致,譬喻第二步写入T1完成后处事重启,则数据不会写入T2

假如体系对处理赏罚时刻较量敏感,引出常用的第二种方案。

要领二:处事异步冗余

粉丝相关链,10亿数据,怎样计划?

数据的双写并不再由挚友中心处事来完成,处事层异步发出一个动静,通过动静总线发送给一个专门的数据复制处事来写入冗余数据,如上图1-6流程:

  • 营业方挪用处事,新增数据
  • 处事先插入T1数据
  • 处事向动静总线发送一个异步动静(发出即可,不消等返回,凡是很快就能完成)
  • 处事返回营业方新增数据乐成
  • 动静总线将动静投递给数据同步中心
  • 数据同步中心插入T2数据

利益:

  • 哀求处理赏罚时刻短(只插入1次)

弱点:

  • 体系的伟大性增进了,多引入了一个组件(动静总线)和一个处事(专用的数据复制处事)
  • 由于返回营业线数据插入乐成时,数据还不必然插入到T2中,因此数据有一个纷歧致时刻窗口(这个窗口很短,最终是同等的)
  • 在动静总线丢失动静时,冗余表数据会纷歧致

假如想扫除“数据冗余”对体系的耦合,引出常用的第三种方案。

要领三:线下异步冗余

粉丝相关链,10亿数据,怎样计划?

数据的双写不再由挚友中心处事来完成,而是由线下的一个处事可能使命来完成,如上图1-6流程:

  • 营业方挪用处事,新增数据
  • 处事先插入T1数据
  • 处事返回营业方新增数据乐成
  • 数据会被写入到数据库的log中
  • 线下处事可能使命读取数据库的log
  • 线下处事可能使命插入T2数据

利益:

  • 数据双写与营业完全解耦
  • 哀求处理赏罚时刻短(只插入1次)

弱点:

  • 返回营业线数据插入乐成时,数据还不必然插入到T2中,因此数据有一个纷歧致时刻窗口(这个窗口很短,最终是同等的)
  • 数据的同等性依靠于线下处事可能使命的靠得住性

上述三种方案各有优弱点,可以团结现实环境选取。 数据冗余当然可以或许办理多对多相关的数据库程度切分题目,但又带来了新的题目,怎样担保正表T1与反表T2的数据同等性呢?

从上面的接头可以看到,不管哪种方案,由于两步操纵不能担保原子性,总有呈现数据纷歧致的也许,高吞吐漫衍式事宜是业内尚未办理的困难,此时的架构优化偏向:最终同等性。并不是完全担保数据的及时同等,而是尽早的发明纷歧致,并修复纷歧致。 最终同等性,是高吞吐互联网营业同等性的常用实践。更详细的,担保数据最终同等性的常见方案有三种。

要领一:线下扫面正反冗余表所稀有据

粉丝相关链,10亿数据,怎样计划?

如上图所示,线下启动一个离线的扫描器材,不断的比对正表T1和反表T2,假如发明数据纷歧致,就举办赔偿修复。

利益:

  • 较量简朴,开拓价钱小
  • 线上处事无需修改,修复器材与线上处事解耦

弱点:

  • 扫描服从低,会扫描大量的“已经可以或许担保同等”的数据
  • 因为扫描的数据量大,扫描一轮的时刻较量长,即数据假如纷歧致,纷歧致的时刻窗口较量长

有没有只扫描“也许存在纷歧致也许性”的数据,而不是每次扫描所稀有据,以进步服从的优化要领呢?

要领二:线下扫描增量数据

粉丝相关链,10亿数据,怎样计划?

每次只扫描增量的日记数据,就可以或许极大进步服从,收缩数据纷歧致的时刻窗口,如上图1-4流程所示:

  • 写入正表T1
  • 第一步乐成后,写入日记log1
  • 写入反表T2
  • 第二步乐成后,写入日记log2

虽然,我们照旧必要一个离线的扫描器材,不断的比对日记log1和日记log2,假如发明数据纷歧致,就举办赔偿修复

利益:

  • 虽比要领一伟大,但如故是较量简朴的
  • 数据扫描服从高,只扫描增量数据

弱点:

  • 线上处事略有修改(价钱不高,多写了2条日记)
  • 固然比要领一更及时,但时效性照旧不高,纷歧致窗口取决于扫描的周期

有没有及时检测同等性并举办修复的要领呢?

(编辑:河北网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读