加入收藏 | 设为首页 | 会员中心 | 我要投稿 河北网 (https://www.hebeiwang.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 业界 > 正文

运维必知必会的监控知识体系全梳理

发布时间:2019-01-25 13:20:01 所属栏目:业界 来源:运维猿
导读:监控是整个运维以致整个产物生命周期中最重要的一环,事前实时预警发明妨碍,过后提供详确的数据用于追查定位题目。 今朝业界有许多不错的开源产物可供选择。选择一款开源的监控体系,是一个省时省力、服从最高的方案。虽然,对监控不是很大白的伴侣们,看
副问题[/!--empirenews.page--]

监控是整个运维以致整个产物生命周期中最重要的一环,事前实时预警发明妨碍,过后提供详确的数据用于追查定位题目。

今朝业界有许多不错的开源产物可供选择。选择一款开源的监控体系,是一个省时省力、服从最高的方案。虽然,对监控不是很大白的伴侣们,看了以下文章也许会对监控整个别系有较量深刻的熟悉。

运维必知必会的监控常识系统全梳理

一、监控方针

每小我私人因为地址的行业、公司、营业、岗亭差异,对监控的领略也不尽沟通,可是我们必要留意,监控是必要站在公司的营业角度去思量,而不是针对某个监控技能的行使。

运维必知必会的监控常识系统全梳理

对体系不中断的及时监控:现实上是对体系不中断的及时监控(这就是监控);

及时反馈体系当前状态:我们监控某个硬件、可能某个体系,都是必要能及时看到当前体系的状态,是正常、非常、可能妨碍。

担保处事靠得住性安详性:我们监控的目标就是要担保体系、处事、营业正常运行

担保营业一连不变运行:假如我们的监控做得很完美,纵然呈现妨碍,能第一时刻吸取到妨碍报警,在第一时刻处理赏罚办理,从而担保营业一连性的不变运行。

二、监控要领

1.相识监控工具:我们要监控的工具你是否相识呢?好比CPU到底是怎样事变的?

2.机能基准指标:我们要监控这个对象的什么属性?好比CPU的行使率、负载、用户态、内核态、上下文切换。

3.报警阈值界说:怎么样才算是妨碍,要报警呢?好比CPU的负载到底几多算高,用户态、内核态别离跑几多算高?

4.妨碍处理赏罚流程:收到了妨碍报警,我们怎么处理赏罚呢?有什么更高效的处理赏罚流程吗?

三、监控焦点

运维必知必会的监控常识系统全梳理

  • 发明题目:当体系产生妨碍报警,我们会收到妨碍报警的信息。
  • 定位题目:妨碍邮件一样平常城市写某某主机妨碍、详细妨碍的内容,我们必要对报警内容举办说明。好比一台处事器连不上,我们就必要思量是收集题目、照旧负载太高导致长时刻无法毗连,又可能某开拓触发了防火墙榨取的相干计策等,我们就必要去说明妨碍详细缘故起因。
  • 办理题目:虽然我们相识到妨碍的缘故起因后,就必要通过妨碍办理的优先级去办理该妨碍。
  • 总结题目:当我们办理完重大妨碍后,必要对妨碍缘故起因以及防御举办总结归纳,停止往后一再呈现。

四、监控器材

下面我们必要选择一款得当公司营业的监控器材举办监控,。这里我对监控器材举办了简朴的分类。

运维必知必会的监控常识系统全梳理

1、老牌监控

  • MRTG(Multi Route Trffic Grapher)是一套可用来绘制收集流量图的软件,由瑞士奥尔滕的Tobias Oetiker与Dave Rand所开拓,以GPL授权。
  • MRTG最好的版本是1995年推出的,用Perl说话写成,可跨平台行使,数据收罗用SNMP协议,MRTG将手机到的数据通过Web页面以GIF可能PNG名目绘制出图像。
  • Ganglia是一个跨平台的、可扩展的、高机能的漫衍式监控体系,如集群和网格。它基于分层计划,行使普及的技能,用RRDtool存储数据。具有可视化界面,得当对集群体系的自动化监控。其全心计划的数据布局和算法使得监控端到被监控端的毗连开销很是低。今朝已有成千上万的集群正在行使这个监控体系,可以轻松地处理赏罚2000个节点的集群情形。
  • Cacti(英文寄义为神仙掌)是一套基于PHP、MySQL、SNMP和RRDtool开拓的收集流量监测图形说明器材,它通过snmpget来获取数据行使RRDtool画图,但行使者无须相识RRDtool伟大的参数。提供了很是强盛的数据和用户打点成果,可以指定每一个用户能查察树状布局、主机装备以及任何一张图,还可以与LDAP团结举办用户认证,同时也能自界说模板。在汗青数据展示监控方面,其成果相等不错。
  • Cacti通过添加模板,使差异装备的监控添加具有可复用性,而且具备可自界说画图的成果,具有强盛的运算手段(数据的叠加成果)
  • Nagios是一个企业级监控体系,可监控处事的运行状态和收集信息等,并能监督所指定的当地或长途主机状态以及处事,同时提供非常告警关照成果等。
  • Nagios可运行在Linux和UNIX平台上。同时提供Web界面,以利便体系打点职员查察收集状态、各类体系题目、以及体系相干日记等。
  • Nagios的成果偏重于监控处事的可用性,能按照监控指标状态触发告警。

今朝Nagios也霸占了必然的市场份额,不外Nagios并没有与时俱进,已经不能满意于多变的监控需求,架构的扩展性和行使的便捷性有待加强,其高级成果集成在贸易版Nagios XI中。

Smokeping首要用于监督收集机能,包罗通例的ping、www处事器机能、DNS查询机能、SSH机能等。底层也是用RRDtool做支持,特点是绘制图很是大度,收集丢包和耽误用颜色和阴影来标示,支持将多张图叠放在一路,其作者还开拓了MRTG和RRDtll等器材。 Smokeping的站点为:http://tobi.oetiker.cn/hp。

开源监控体系OpenTSDB用HBase存储全部时序(无须采样)的数据,来构建一个漫衍式、可伸缩的时刻序列数据库。它支持秒级数据收罗,支持永世存储,可以做容量筹划,并很轻易地接入到现有的告警体系里。OpenTSDB可以从大局限的集群(包罗集群中的收集装备、操纵体系、应用措施)中获取响应的收罗指标,并举办存储、索引和处事,从而使这些数据更轻易让人领略,如Web化、图形化等。

2、王牌监控

  • Zabbix是一个漫衍式监控体系,支持多种收罗方法和收罗客户端,有专用的Agent署理,也支持SNMP、IPMI、JMX、Telnet、SSH等多种协议,它将收罗到的数据存放到数据库,然后对其举办说明清算,到达前提触发告警。其机动的扩展性和富厚的成果是其他监控体系所不能比的。相对来说,它的总体成果做得很是优越。

(编辑:河北网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读