加入收藏 | 设为首页 | 会员中心 | 我要投稿 河北网 (https://www.hebeiwang.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 云计算 > 正文

谷歌云办事情障缘故起因说明和调停法子

发布时间:2018-07-31 00:32:03 所属栏目:云计算 来源:InfoQ
导读:谷歌发布了近期的一个变乱的基础缘故起因说明功效,该变乱影响了谷歌的部门云处事,并在约莫32分钟的时刻内将错误率进步了33%至87%,后续他们将采纳法子改进平台机能和可用性。 该变乱影响了许多依靠Google HTTP(S)负载平衡器的谷歌处事的客户,包罗Google K

谷歌发布了近期的一个变乱的基础缘故起因说明功效,该变乱影响了谷歌的部门云处事,并在约莫32分钟的时刻内将错误率进步了33%至87%,后续他们将采纳法子改进平台机能和可用性。

该变乱影响了许多依靠 Google HTTP(S)负载平衡器 的谷歌处事的客户,包罗Google Kubernetes Engine、Google App Engine、Google Cloud Functions、Stackdriver Web UI、Dialogflow和Cloud Support Portal/API。客户在约莫32分钟的时刻内随机收到502错误码或毗连被重置的错误,这是从谷歌工程师吸取到监控体系发出妨碍率警报的那一刻开始到陈设修复措施的时刻。

Google HTTP(S)负载平衡旨在平衡多个后端实例和多个地区的HTTP和HTTPS流量。它的一个甜头是云应用措施可以行使单个全局IP地点,极大地简化了DNS配置。为了在毗连配置时代实现最佳机能,该处事操作第一层谷歌前端(GFE)就近吸取用户哀求,并将哀求转发到第二层GFE。第二层GFE构玉成局处事器收集,将哀求发送到响应的后端,而不管它们位于哪个地区。

变乱的基础缘故起因是,为了进步第二个GFE层的安详性和机能而添加的新成果中包括未检测到的错误。该错误是由出产情形中的一个设置改观激发的,它会导致GFE随机重启,而在重启进程中,处事容量丢失。

所幸的是,包括该错误的成果尚未投入行使,因此谷歌工程师通过规复设置改观来陈设修复措施,处事在几分钟后规复其正常举动,在缓存热死后妨碍率也规复正常。

为了提防变乱再次产生,除了改造GFE测试栈并添加更多安详法子以防备未在行使中的成果被错误投入行使外,Google Cloud团队还打算改进GFE池差异分片之间的断绝,以缩小妨碍范畴,并为GFE池的设置改观建设仪表盘,让工程师更轻易辨认有题目的体系改观。

(编辑:河北网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    热点阅读