Building the Coming Soon

关于

HFLS aka the Akademia 12′, then NUST 16′, HKU 18′, now a Blue.

Zabbix

Zabbix报告无交换内存主机“Lack of free swap space”问题解决

11/13/2014

Zabbix初始设计是大型公司用于监控服务器集群的,但日常中也用于监控VPS或云主机。后者情况下Zabbix的很多配置和属性就没有经过优化,取决于监控的对象和用途,经常需要对一些Zabbix配置进行调整。Kaijia主要使用Zabbix监控一些云主机和VPS,也会经常遇到一些问题,比如之前遇到的“Lack of free swap space”问题,今天写下来和大家分享。

Kaijia使用的部分云主机(例如DigitalOcean)和VPS(一代OpenVZ)都没有设置交换分区/虚拟内存,使用free -m命令将会显示SWAP三项都为0。

free -m命令显示系统无交换空间

free -m命令显示系统无交换空间

这种情况下,如果开启Zabbix监控,Zabbix将会报告系统缺少交换分区空间(“Lack of free swap space”)。这完全可以理解,因为按照正常的逻辑,一台物理服务器不可能不设置交换分区。显然,这样的设计没有考虑到云主机用户,但需要适当调整监控文件配置即可解决问题。

阅读更多

DNS可能造成Zabbix Server无法连接到Zabbix Agent终端问题

11/12/2014

好久没有更新了,最近Kaijia做科研项目计算又租用了一台支持IPv6的服务器。按照往常Kaijia会在架设完服务器之后设置好Zabbix Agent,后期就使用Zabbix服务监控服务器的稳定性,一般情况下设置完成后服务器就能稳定运行了,Kaijia也很少收到服务器宕机的通知。

但是这次Kaijia遇到了一个奇怪的情况,Zabbix监控间断发出“Zabbix agent on * is unreachable for 5 minutes”提醒,基本上一小时内能有四五次。一开始Kaijia认为此问题是网络连接不稳定造成的(毕竟新的服务器与Zabbix所在的监控服务器物理距离挺远的),于是观察了网络,也没有发现异常。保险起见Kaijia还利用附近一台Zabbix监控一直非常稳定的节点架设了Zabbix Proxy,但仍然没有有效问题。

阅读更多

使用Zabbix监控MySQL服务器方法

01/27/2014

从Zabbix 2.2开始,Zabbix官方已经支持了MySQL监控,但是MySQL监控默认是不可用的,需要经过额外的设置才可以使用。Kaijia将Zabbix换到了新的服务器时候性能绰绰有余,于是决定充分发挥剩余的内存和SSD性能,把MySQL、Apache、PHP-FPM等的监控也开起来。

Google了一下后找到了一篇《How to Monitor MySQL using the new Zabbix Template App MySQL》,大部分内容都可用,可惜这位老兄最后的步骤写错了。。。于是参照此篇文章Kaijia整理了一下使用Zabbix监控MySQL服务器的方法。

阅读更多

“Zabbix poller processes more than 75% busy”警报问题解决

01/25/2014

虽然Zabbix的监控警报各种有,但Kaijia使用碰到最多的几个莫过于内存耗尽,网络不通,IO太慢还有这个“Zabbix poller processes more than 75% busy”了。一开始的时候因为这个即不影响使用也持续一会儿就自行解决就没有多在意。然后随着数据库的增大,Zabbix消耗的内存可是越来越多,Poller processes(轮询)开始天天Busy了,最终Kaijia不得不把Zabbix挪到了另外一台服务器上。

但这并没有彻底解决问题,警报仍然三天两头来几个。之后Kaijia开启了Zabbix警报的邮件功能,于是开始频繁收到这类邮件,于是Kaijia决定解决这个问题。Google了一下资料,没有找到很权威的答案,造成轮询忙的问题有很多中,支撑Zabbix的MySQL卡住了,Zabbix服务器的IO卡住了都有可能,Zabbix进程分配到内存不足都有可能。一个简单的方法是增加Zabbix Server启动时初始化的进程数量,这样直接增加了轮询的负载量,从比例上来讲忙的情况就少了。

阅读更多

Zabbix Agent出现ZBX_TCP_READ() failed: [4] Interrupted system call问题解决

10/21/2013

Kaijia这几天开始使用Zabbix来监控服务器的性能。一开始监控的是几台主要的机子,一直用的很不错,于是将几台不重要的服务器也托进来。这时在有一台服务器上遇到了问题,按照之前相同的配置完成之后,Zabbix Server一直提示无法访问这台服务器上的Zabbix Agent(版本是为Ubuntu 12.04源中自带的1.8.11)。Kaijia查看了一下Zabbix Server的日志,找到了错误提示:

Get value from agent failed: ZBX_TCP_READ() failed: [4] Interrupted system call

Kaijia于是Google了一下,发现也有很多人遇到了这个错误,错误提示是连接被中断,但是网上的提问好像基本没有得到解决的。

阅读更多

... 载入更多文章 ...

- 已经载入全部文章 -