博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
Zabbix分布式监控系统使用总结
阅读量:6227 次
发布时间:2019-06-21

本文共 1168 字,大约阅读时间需要 3 分钟。

    从接触和使用Zabbix已经有2年多的时间,刚开始接触也就是从Zabbix安装,使用和简单的维护开始学习。到后来涉及到如何添加监控主机?如何自定义监控项?如何设置报警阀值?等开始学习。

    有幸在2013年底从零开始研究和选型整个公司IDC监控系统。由于Zabbix简单易用和强大功能,决定用Zabbix做为公司的监控系统。整个公司有多个IDC机房,监控节点有700左右,采用Zabbix分布式来监控。
    现在Zabbix上线已经接近一年的时间,运行非常稳定,打开页面速率流畅。在这一年的多的时间里面,也发表了一系列文章,主要包括Zabbix监控和分布式部署和实施方案、Zabbix如何监控网络设备、Zabbix 后台数据操作和API等。希望对广大朋友所有帮助。
    1)Zabbix监控和分布式部署实施方案
   
    2)Zabbix分布式部署proxy实战
   
    3)Zabbix如何监控网络设备
   
    4)Zabbix如何监控Windows机器
   
    5)Zabbix通过Shell脚本监控HP服务器硬件信息
   
    6)Zabbix通过SNMP监控HP服务器硬件信息
   
    7)通过Zabbix全面监控NetScaler负载均衡设备
   
    8)Zabbix监控mysql数据库性能
   
    9)如何从Zabbix数据库中获取监控数据
   
    10)Zabbix Python API 应用实战
   

    做好监控系统,最重要的其实就是两点,首先是监控项目的设置。根据系统、业务设置最能代表监控项目的性能指标。其次是报警阈值的设置。根据业务指标设置精准的报警阈值。比如说监控Apache的httpd进程数监控,如果MaxClients设置200,那么当httpd进程在180的时候必须报警,如果在200的时候报警,此时由于httpd进程爆满已经打不开页面了或者打开网站的速度非常慢。

    下面是平时工作中总结的Zabbix报警阈值的设置,主要包括Linux系统、Windows系统、服务器硬件监控、网络设备和线路的监控的报警阈值的设置。

    1)Linux系统的报警阈值,这里增加了Linux僵尸进程的监控。

    2)Windows系统的报警阈值,perf_counter是通过windows的性能计数器获取的数据。

    3)SQLServer和IIS的报警阈值,其中perf_counter是通过windows的性能计数器获取的数据,Check_IIS_perf.sh是通过脚本以External check方式监控的。

    4)HP硬件的监控,主要是通过SNMP协议和Zabbix discovery方式来监控。

    5)其它方面的监控,主要是应用程序的监控。

    最后,发表此文章的主要目的是和广大朋友相互交流和相互学习,在一些自定义监控项目上面提供更多一点自己的想法和使用经验,如果在系统和应用的监控方面有更多好的想法,欢迎相互交流。

   

转载地址:http://icjna.baihongyu.com/

你可能感兴趣的文章
java中this的N种使用方法
查看>>
Windows IIS安装php
查看>>
mingw 设置python 设置git环境变量
查看>>
linux 系统下如何进行用户之间的切换
查看>>
设计一个算法移除字符串中的重复字符,并写出测试用例。
查看>>
goole机器学习视频链接【学习笔记】
查看>>
查看django版本的方法
查看>>
kafka channle的应用案例
查看>>
WPF 圆角textbox
查看>>
熊彼特的创新理论:非连续性模型
查看>>
Windows10内置ubuntu子系统安装后中文环境设置
查看>>
Spring Security教程(八):用户认证流程源码详解
查看>>
由浅入深:CNN中卷积层与转置卷积层的关系
查看>>
Solve Error: "errcode": 40016, "errmsg": "invalid button size hint"
查看>>
EF Core Fluent API
查看>>
MAC 设置环境变量path的几种方法
查看>>
JVM垃圾收集器(2)
查看>>
SpringBoot之hello world!
查看>>
Socket拆包和解包
查看>>
工作之忠、智、勇
查看>>