服务器监控、数据库监控、业务监控、网络质量监控

 1 了解监控的对象我们要监控的对象你是否了解呢?比如CPU到底是如何工作的?
 2 性能基准指标我们要监控这个东西的什么属性?比如CPU的使用率、负载、用户态、内核态、上下文切换。
监控的方法3 报警阀值定义怎么样才算是故障,要报警呢?比如CPU的负载到底多少算高,用户态、内核态分别跑多少算高?
 4 故障处理流程收到了故障报警,我们怎么处理呢?有什么更高效的处理流程吗?
   
 1 发现问题当系统发生故障报警,我们会收到故障报警的信息。
监控的核心2 定位问题故障邮件一般都会写某某主机故障、具体故障的内容,我们需要对报警内容进行分析
 3 解决问题当然我们了解到故障的原因后,就需要通过故障解决的优先级去解决该故障
 4 总结问题当我们解决完重大故障后,需要对故障原因以及防范进行总结归纳,避免以后重复出现。
点击查看隐藏内容🎁

在it运维中监控的对象有很多主要有:

实现对负载均衡设备、网络设备、服务器、存储设备、安全设备、数据库、中间件及应用软件等IT资源的全面监控管理 。

具体的监控可以参考如下文章

服务器监控主要监控服务器如:CPU 负载、内存使用率、磁盘使用率、登陆用户数、进程 状态、网卡状态等 。

网络质量监控主要监控当前的网络状况,网络流量等 。

业务监控主要是应用程序监控,主要监控该应用程序的服务状态,吞吐量和响应时间

数据库监控主要是数据库表或者表空间的使用情况,是否有死锁,错误日志,性能信息等。

内容监控主要监控 HTTP状态。

https://wd-jishu.oss-cn-hangzhou.aliyuncs.com/wd/2019/11/服务器监控图.jpg@!full

参考 运维监控中的监控策略

随机文章