粉丝相关链,10亿数据,怎样计划?
要领一:处事同步冗余 顾名思义,由挚友中心处事同步写冗余数据,如上图1-4流程:
利益:
弱点:
假如体系对处理赏罚时刻较量敏感,引出常用的第二种方案。 要领二:处事异步冗余 数据的双写并不再由挚友中心处事来完成,处事层异步发出一个动静,通过动静总线发送给一个专门的数据复制处事来写入冗余数据,如上图1-6流程:
利益:
弱点:
假如想扫除“数据冗余”对体系的耦合,引出常用的第三种方案。 要领三:线下异步冗余 数据的双写不再由挚友中心处事来完成,而是由线下的一个处事可能使命来完成,如上图1-6流程:
利益:
弱点:
上述三种方案各有优弱点,可以团结现实环境选取。 数据冗余当然可以或许办理多对多相关的数据库程度切分题目,但又带来了新的题目,怎样担保正表T1与反表T2的数据同等性呢? 从上面的接头可以看到,不管哪种方案,由于两步操纵不能担保原子性,总有呈现数据纷歧致的也许,高吞吐漫衍式事宜是业内尚未办理的困难,此时的架构优化偏向:最终同等性。并不是完全担保数据的及时同等,而是尽早的发明纷歧致,并修复纷歧致。 最终同等性,是高吞吐互联网营业同等性的常用实践。更详细的,担保数据最终同等性的常见方案有三种。 要领一:线下扫面正反冗余表所稀有据 如上图所示,线下启动一个离线的扫描器材,不断的比对正表T1和反表T2,假如发明数据纷歧致,就举办赔偿修复。 利益:
弱点:
有没有只扫描“也许存在纷歧致也许性”的数据,而不是每次扫描所稀有据,以进步服从的优化要领呢? 要领二:线下扫描增量数据 每次只扫描增量的日记数据,就可以或许极大进步服从,收缩数据纷歧致的时刻窗口,如上图1-4流程所示:
虽然,我们照旧必要一个离线的扫描器材,不断的比对日记log1和日记log2,假如发明数据纷歧致,就举办赔偿修复 利益:
弱点:
有没有及时检测同等性并举办修复的要领呢? (编辑:河北网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |