今天碰到个负载高引起的问题
但是查看zabbix监控并没有报警,检查后发现监控取值与实际服务器内负载不一致。

使用zabbix_get命令在服务器内测试

zabbix默认模板键值 取值内容
[root@nfsnobody ~]# zabbix_get -s 10.99.10.11 -k system.cpu.load[percpu,avg1]
0.228333

正确的取值
[root@nfsnobody ~]# zabbix_get -s 10.99.10.11 -k system.cpu.load[all,avg1]
2.760000

SRE实战 互联网时代守护先锋,助力企业售后服务体系运筹帷幄!一键直达领取阿里云限量特价优惠。

解决方法

修改zabbix模板Template OS Linux
找到 Processor load (1 min average per core)
修改key
把 system.cpu.load[percpu,avg1]  改为  system.cpu.load[all,avg1]
同理修改avg5和avg10即可
 zabbix默认监控负载取值不准确 Linux

扫码关注我们
微信号:SRE实战
拒绝背锅 运筹帷幄