正常逻辑
如果按照正常部署方式,一般是创建zabbix-agent模板,通过net.tcp.listen[port] 或 自定义key,触发器≠1就告警,最后将模板应用到所有agent主机。
实际情况
如果你细心点就会发现,当某台机器的zabbix-agent 服务stop后,监控数据就取不到了,紧接着就是zabbix断图,此时,触发器≠1由于没有获取到任何值而不会触发告警,所以也就监控不到某个机器的zabbix agent服务何时异常退出或机器宕机,这看起来是很严重的问题。
解决思路
在zabbix server端的模板中,通过配置 net.tcp.listen[ip,port] 简单检查,来获取不同agent的运行状态。
缺点:由于每台机器的IP地址都不相同,故每台机器都需要添加一个监控项+触发器,对于上百台机器来说,这是很繁琐的工作。至于用什么方法简化自己繁琐的工作,这是一个脑力活儿
- 本文作者: GaryWu
- 本文链接: https://garywu520.github.io/2019/10/29/zabbix-server监控zabbix-agent存活/
- 版权声明: 本博客所有文章除特别声明外,均采用 MIT 许可协议。转载请注明出处!