Впервые с таким столкнулся, почему-то ни в какую не хотел стартовать агент zabbix сразу на нескольких серверах. Произошло это из-за скачков электричества, APC не выдержал и помер, сервера ребутнулись. После восстановления всё включилось, а вот агент zabbix_agentd не включается.
ошибки в логах zabbix_agentd:
Starting Zabbix Agent [server-adres]. Zabbix 4.0.17 (revision a528a0a4bc). listener failed: zbx_tcp_listen() fatal error: unable to serve on any address [[-]:10050] Zabbix Agent stopped. Zabbix 4.0.17 (revision a528a0a4bc).
Понятно что порт кем-то или чем-то занят. Смотрим кто там сидит.
netstat -ltn tcp 0 0 0.0.0.0:10050 0.0.0.0:* LISTENtcp 0 0 0.0.0.0:10051 0.0.0.0:* LISTEN
Согласно выхлопу мы видим, что уже существуют процессы zabbix на этих портах, но они не работают. Может агент успел подняться быстрее чем сеть?
На стандартную комманду перезапуска, никакой реакции.
systemctl zabbix_agentd restart
Поэтому находим эти процессы вручную и убиваем.
killall -TERM zabbix_agentd
А после уже запускаем агента в нормальном режиме.
systemctl zabbix_agentd start
Профит!
Полезная инфа