Linux 系统服务器异常流量分析
在事变中常常遇随处事器流量非常,时不时的流量很高。碰着这种流量非常和网站打开迟钝的环境,最后根基上可以归结为三种缘故起因:一种是网站正在蒙受DD或CC进攻;一种是处事器内存可能CPU耗尽;最后一种就是处事器被“挂马”了。 那么Linux/Centos处事器带宽非常跑满的环境怎么排查呢?下面是基于一次运维变乱的排查进程描写,接待各人点评进修~ 题目描写: 在8月1号9点阁下接到用户反馈企业 Web 处事无法正常赏识,通过监控平台或阿里云监控,查察处事器非常状态,凡是会呈现 CPU 100%和流量激增的环境。通过SSH长途毗连,查察其时的环境,监控信息表现如下: 可以看出,处事器此时的出流量到达5G,和正常运行时的流量对比,差别明明。 处理赏罚进程: 此时已无法正常长途打点,只能通过阿里云VNC节制台毗连进入体系。 1)安装流量查察器材iftop;
2)查察经典收集ECS外网卡流量;
确认行使高出5G的出流量。 3)通过以下呼吁确认导致非常流量的历程;
此时抓取到导致非常流量的历程 通过netstat或ps呼吁,获取memcache历程号,并竣事该历程。
将该历程竣事后,web处事和ssh长途打点规复正常,后续调查流量非常环境消散。memcache 为遗留废弃措施,出产情形中已没有再行使,打消开启自启动。
总结 题目的办理并没有耗费几多时刻,可是因为是用户最先发明反馈,肯定被批的长短常惨,没有即时发明营业非常。 许多运维同窗在将营业陈设上云后多会呈现这种环境,因为运维事变变得越发轻松便捷每每忽略许多重要的告警信息,好比:处事器到期提示、处事器CPU行使率过高、安详组产生变革等告警提示...由此激发许多初级的运维事情。 为了停止上述的环境,对付今朝在做云运维的同窗,小编保举一个运维利器——王传授,对付我们一般运维事变辅佐确实很是大,可以实时提示我云资源的变革环境,譬喻:处事器 CPU 行使率偏高、处事器安详组配置不安详、云数据库存在慢SQL等... 处事器 CPU 行使率偏高 云数据库存在慢SQL (编辑:河北网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |