ZABBIX Установка и настройка. Использование Zabbix для мониторинга: основные возможности. Практическое применение

  • Перевод

Тех, кто использует или собирается использовать Zabbix в промышленных масштабах, всегда волновал вопрос: сколько реально данных сможет Заббикс «переварить» перед тем как окончательно поперхнется и подавится? Часть моей недавней работы как раз касалось этого вопроса. Дело в том, что у меня есть огромная сеть, насчитывающая более 32000 узлов, и которая потенциально может полностью мониториться Заббиксом в будущем. На форуме давно идут обсуждения о том, как оптимизировать Zabbix для работы в больших масштабах, но, к сожалению, мне так и не удалось найти законченное решение.

В этой статье я хочу показать, как я настраивал свою систему, способную обрабатывать реально много данных. Чтобы вы понимали, о чем речь, вот просто картинка со статистикой системы:

Для начала хочется обговорить, что реально означает пункт «Required server performance, new values per second (далее NVPS) (Требуемое быстродействие в секунду)». Так вот, он не соответствует тому, сколько реально данных попадает в систему в секунду, а является простым математических подсчетом всех активных элементов данных с учетом интервалов опроса. И тогда получается, что Zabbix-trapper в расчете не участвует. В нашей сети trapper использовался достаточно активно, так что давайте посмотрим, сколько реально NVPS в рассматриваемом окружении:

Как показано на графике, в среднем Zabbix обрабатывает около 9260 запросов в секунду. Кроме того, в сети бывали и короткие всплески до 15000 NVPS , с которыми сервер без проблем справился. Честно говоря, это здорово!

Архитектура

Первое, в чем стоит разобраться это архитектура системы мониторинга. Должен ли Zabbix быть отказоустойчивым? Будут ли иметь значение один-два часа простоя? Какие последствия ждут, если упадет база данных? Какие потребуются диски для базы, и какой настраивать RAID? Какая нужна пропускная способность между Zabbix-сервером и Zabbix-proxy? Какая максимальная задержка? Как собирать данные? Опрашивать сеть (пассивный мониторинг) или слушать сеть (активный мониторинг)?

Давайте рассмотрим каждый вопрос детально. Если быть честным, то вопрос сети я не рассматривал при разворачивании системы, что привело к проблемам, которые в дальнейшем было трудно продиагностировать. Итак, вот общая схема архитектуры системы мониторинга:

Железо

Точно подобрать правильное железо процесс не из легких. Главное что я здесь сделал, это использовал SAN для хранения данных, так как база Заббикса требует много I/O дисковой системы. Проще говоря, чем быстрее диски у сервера БД, тем больше данных сможет обработать Заббикс.

Конечно, ЦПУ и память тоже очень важны для MySQL. Большое количество ОЗУ позволяет Заббиксу хранить часто читаемые данные в памяти, что естественно способствует быстродействию системы. Изначально я планировал для сервера БД 64ГБ памяти, однако все замечательно работает и на 32ГБ до сих пор.

Сервера, на которых стоит сам zabbix_server, тоже должен иметь достаточно быстрые ЦПУ, так как необходимо, чтобы он спокойно обрабатывал сотни тысяч триггеров. Памяти же хватило бы и 12ГБ - так как на самом Заббикс сервере не так много процессов (практически весь мониторинг идет через прокси).

В отличии от СУБД и zabbix_server, Zabbix-прокси не требуют серьезного железа, поэтому я использовал «виртуалки». В основном собираются активные элементы данных, так что прокси служат как точки сбора данных, сами же практически ничего не опрашивают.

Вот сводная таблица, что я использовал в своей системе:

Zabbix server Zabbix БД Zabbix proxies SAN
HP ProLiant BL460c Gen8
12x Intel Xeon E5-2630
16GB memory
128GB disk
CentOS 6.2 x64
Zabbix 2.0.6
HP ProLiant BL460c Gen8
12x Intel Xeon E5-2630
32GB memory
2TB SAN-backed storage (4Gbps FC)
CentOS 6.2 x64
MySQL 5.6.12
VMware Virtual Machine
4x vCPU
8GB memory
50GB disk
CentOS 6.2 x64
Zabbix 2.0.6
MySQL 5.5.18
Hitachi Unified Storage VM
2x 2TB LUN
Tiered storage (with 2TB SSD)

Отказоустойчивость Zabbix server

Вернемся к архитектурным вопросам, что я озвучивал выше. В больших сетях по понятным причинам не работающий мониторинг является настоящей катастрофой. Однако, архитектура Заббикса не позволяет запускать больше одного экземпляра процесса zabbix server.

Поэтому я решил воспользоваться Linux HA с Pacemaker и CMAN. Для базовой настройки прошу глянуть мануал RedHat 6.4 . К сожалению, инструкция была изменена с момента, как я ее использовал, однако конечный результат должен получиться таким же. После базовой настройки дополнительно я настроил:

    1. Так как общий IP-адрес всегда используется активным Zabbix-сервером, то отсюда следует три преимущества:
      • Всегда легко найти какой сервер активен
      • Все соединения от Zabbix сервера всегда с одного и того же IP (После установки параметра SourceIP= в zabbix_server.conf)
      • Всем Zabbix-прокси и Zabbix-агентам в качестве сервера просто указывается общий IP
  1. Процесс zabbix_server
    • в случае фейловера zabbix_server будет остановлен на старом сервере и запущен на новом
  2. Symlink для заданий cron
    1. Симлинк указывает на директорию, в которой лежат задания, которые должны выполняться только на активном Zabbix-сервере. Crontab должен иметь доступ ко всем задания через этот симлинк
    2. В случае фейловера симлинк удаляется на старом сервере и создается на новом
  3. crond
    • В случае фейловера crond останавливается на старом сервере и запускается на новом активном сервере
Пример конфигурационного файла, а также LSB init-скрипт для zabbix-сервера можно скачать . Не забудьте отредактировать параметры, заключенные в "< >". Кроме того, init-скрипт написан с учетом того, что все файлы Zabbix"а находятся в одной папке (/usr/local/zabbix). Так что поправьте пути в скрипте, если нужно.

Отказоустойчивость СУБД

Очевидно, что никакой пользы от отказоустойчивости серверов с Zabbix-серверами, если база данных может упасть в любой момент. Для MySQL есть огромное количество путей создать кластер, я расскажу о способе, что я использовал.

Я также использовал Linux HA с Pacemaker и CMAN и для базы данных. Как оказалось, в нем есть пару отличный возможностей для управления репликацией MySQL. Я использую (использовал, смотри раздел «открытые проблемы») репликацию для синхронизации данных между активным(master) и резервным(slave) MySQL. Для начала, точно также как и для серверов Zabbix-сервера, мы делаем базовую настройку кластера. Затем в дополнении я настроил:

  1. Общий IP-адрес (shared IP address)
    1. В случае фейловера, IP-адрес переходит на сервер, который становится активным
    2. Так как общий IP-адрес всегда используется активным Zabbix-сервером, то отсюда следует два преимущества:
      • Всегда легко найти, какой сервер активен
      • В случае фейловера, на самом Zabbix-сервере не требуется никаких действий, чтобы указать адрес нового активного сервера MySQL
  2. Общий дополнительный (slave) IP-адрес
    1. Этот IP-адрес может использоваться, когда к происходит запрос на чтение к базе. Таким образом, запрос может обработать slave-сервер MySQL, если он доступен
    2. дополнительный адрес может быть у любого из серверов, это зависит от следующего:
      • если slave-сервер доступен, и часы не отстают на более чем 60 секунд, то адрес будет у него
      • В обратном случае адрес будет у master-сервера MySQL
  3. mysqld
    • В случае фейловера новый сервер MySQL станет активным. Если после этого старый сервер вернется в строй, то он останется slave для уже новоиспечённого master.
Пример конфигурационного файла можно взять . Не забудьте отредактировать параметры pacemaker, заключенные в "< >". Также, возможно, потребуется скачать другого MySQL resource agent для использования с pacemaker. Ссылку можно найти в документации по установке MySQL кластера с pacemaker в Percona репозитории github. Также на всякий «пожарный случай» копия лежит .

Zabbix-прокси

Если по какой-то причине вы не слышали о Zabbix-прокси, то, пожалуйста, срочно посмотрите в документации . Прокси позволяют Заббиксу распределить нагрузку мониторинга на несколько машин. После этого уже каждый Заббикс прокси отсылает все собранные данные на Заббикс сервер.

Работая с Заббикс прокси важно помнить:

  1. Заббикс прокси способны обрабатывать очень серьезные объемы данных, если их настроить как следует. Так, например, во время тестов, прокси (назовем ее Proxy А) обрабатывала 1500-1750 NVPS без каких либо проблем. И это виртуалка с двумя виртуальными ЦПУ, 4ГБ ОЗУ и БД SQLite3. При этом прокси находилась на одной площадки с самим сервером, так что задержки на сети можно было просто не учитывать. Также почти все, что собиралась, было активными элементами данных Заббикс агента
  2. Ранее я уже упоминал, как важна задержка на сети при мониторинге. Так вот, это действительно так, когда речь идет о крупных системах. Фактически, количество данных, которое может отослать прокси, не отставая, напрямую зависит от сети.

    На графике ниже хорошо видно как накапливаются проблемы, когда задержка сети не учитывается. Прокси, который не успевает:


Пожалуй, достаточно очевидно, что очередь из данных для передачи не должна увеличиваться. График относится к другому Заббикс-прокси (Proxy B), которая ничем по железу не отличается от Proxy A, но может передавать без проблем только 500NVPS а не 1500NVPS, как Proxy A. Отличие как раз в том, что B находится в Сингапуре а сам сервер в Северной Америке, и задержка между площадками порядка 230мс. Данная задержка имеет серьезный эффект, учитывая способ пересылки данных. В нашем случае, Proxy B может отправить только по 1000 собранных элементов Заббикс серверу каждые 2-3 секунды. По моим наблюдениям, вот что происходит:

  • Прокси устанавливает соединение до сервера
  • Прокси максимум отправляет за раз 1000 собранных значений элементов данных
  • Прокси закрывает соединение
Данная процедура повторяет столько раз, сколько требуется. В случае большой задержки, такой метод имеет несколько серьезных проблем:
  • Первичное подключение очень медленное. В моем случае оно происходит за 0,25 секунды. Уф!
  • Так как соединение закрывается после отправки 1000 элементов данных, то TCP-соединение никогда не длится достаточно долго, чтобы успеть использовать всю доступную пропускную способность канала.

Производительность базы данных

Высокая производительность базы данных является ключевой для системы мониторинга, так как абсолютно вся собранная информация попадает туда. При этом, с учетом большого количества операций записи в базу, производительность дисков - это первое бутылочное горлышко с которым сталкиваешься. Мне повезло и у меня в распоряжении оказались SSD-диски, однако все равно это не является гарантией быстрой работы базы. Вот пример:
  • Изначально в системе я использовал MySQL 5.5.18. Сначала никаких видимых проблем с производительностью не наблюдалось, однако, после 700-750 NVPS MySQL стал загружать процессор на 100% и система буквально «замерла». Дальнейшие мои попытки исправить ситуацию, подкручивая параметры в конфигурационном файле, активируя large pages или partitioning ни к чему не привели. Более хорошее решение предложила моя жена: сначала обновиться MySQL до 5.6 и потом разбираться. На мое удивление, простой апдейт решил все проблемы с производительностью, который я никак победить в 5.5.18. На всякий случай, вот копия my.cnf .
На графике показано количество запросов в секунду в базе:

Обратите внимание, что больше всего запросов «Com_update». Причина кроется в том, что каждое полученное значение влечет Update в таблицу «items». Также в базе данных в основном операции на запись, так что MySQL query cache никак не поможет. По сути, он может быть даже вредным для производительности, учитывая, что постоянно придется маркировать запросы как неверные.

Другой проблемой для производительности может стать Zabbix Housekeeper. В больших сетях его настоятельно рекомендую отключать. Для этого в конфиг-файле выставите DisableHousekeeping=1. Понятно, что без Housekeeping старые данные(элементы данных, события, действия) не будут удаляться из базы. Тогда удаление можно организовать через partitioning.

Однако, одно из ограничений MySQL 5.6.12 в том, что partitioning не может быть использован в таблицах с foreign keys и как раз они присутствуют почти повсеместно в базе Заббикс. Но кроме таблиц history, которые нам и нужны. Partitioning дает нам два преимущества:

  1. Все исторические данные таблицы разбитые по днем/неделям/месяцам/и т.д. могут находиться в отдельных файлах, что позволяет в дальнейшем удалять данные без каких либо последствий для базы. Также очень просто понимать сколько данных собирается за определенный период времени.
  2. После очистки таблиц InnoDB не возвращает место диску, оставляя его себе для новых данных. В итоге с InnoDB невозможно очистить место на диске. В случае с partitioning это не проблема, место может быть освобождено, простым удалением старых партиций.
О partitioning в Заббикс уже писалось на Хабре.

Собирать или слушать

В Заббиксе существует два метода сбора данных: активный и пассивный: В случае пассивного мониторинга Заббикс сервер сам опрашивает Заббикс агентов, а в случае активного - ждет когда Zabbix-агенты сами подключаться к серверу. Под активный мониторинг также попадает Zabbix trapper , так как инициация отсылки остается на стороне узла сети.

Разница в производительности может быть серьезной при выборе одного или другого способа как основного. Пассивный мониторинг требует запущенных процессов на Заббикс сервере, которые будут регулярно посылать запрос к Заббикс агенту и ждать ответа, в некоторых случаях ожидание может затянуться даже до нескольких секунд. Теперь умножьте это время хотя бы на тысячу серверов, и становится ясно, что «поллинг» может занять время.

В случае активного мониторинга процессов опроса нет, сервер находится в состоянии ожидания, когда агенты сами начнут подключаться к Zabbix-серверу, чтобы получить список элементов данных, которые требуется мониторить.

Далее, агент начнет сам собирать элементы данных с учетом полученного с сервера интервала и отправлять их, при этом соединение будет открыто только тогда, когда агенту есть что отправить. Таким образом, отпадает необходимость в проверке до получения данных, которая присутствует при пассивном мониторинге. Вывод: активный мониторинг увеличивает скорость сбора данных, что и требуется в нашей большой сети.

Мониторинг самого Заббикса

Без мониторинга самого Zabbix эффективная работа большой системы просто не представляется возможной - критически важно понимать в каком месте произойдет «затык», когда система откажется принимать новые данные. Существующие элементы данных для мониторинга Заббикса могут быть найдены . В версиях 2.х Заббикса они были любезно собраны в шаблон для мониторинга Zabbix server, предоставляемый «из коробки». Пользуйтесь!

Одной полезной метрикой является свободное место в History Write Cache (HistoryCacheSize в в конфиг-файле сервера). Данный параметр должен всегда быть близок к 100%. Если же кэш переполняется - это означает, что Zabbix не успевает добавлять в базу поступающие данные.

К сожалению, подобный параметр не поддерживается Zabbix-прокси. Кроме того, в Zabbix, отсутствует элемент данных, указывающий, сколько данных ожидает отправки на Zabbix-сервер. Впрочем, этот элемент данных легко сделать самому через SQL-запрос к базе прокси:

SELECT ((SELECT MAX(proxy_history.id) FROM proxy_history)-nextid) FROM ids WHERE field_name="history_lastid"

Запрос вернет необходимо число. Если у вас стоит SQLite3 в качестве БД для Zabbix-прокси, то просто добавьте следующую команду как UserParameter в конфиг-файле Zabbix-агента, установленного на машине, где крутится Zabbix-прокси.

UserParameter=zabbix.proxy.items.sync.remaining,/usr/bin/sqlite3 /path/to/the/sqlite/database "SELECT ((SELECT MAX(proxy_history.id) FROM proxy_history)-nextid) FROM ids WHERE field_name="history_lastid"" 2>&1

{Hostname:zabbix.proxy.items.sync.remaining.min(10m)}>100000

Итого статистика

Напоследок предлагаю графики загрузки системы. Сразу говорю, что не знаю, что произошло 16 июля - мне пришлось пересоздать все базы прокси (SQLite на тот момент), чтобы решить проблему. С тех пор я перевел все прокси на MySQL и проблема не повторялась. Остальные «неровности» графиков совпадают со временем проведения нагрузочного тестирования. В целом, из графиков видно, что у используемого железа большой запас прочности.











А вот графики с сервера базы данных. Приросты трафика каждый день соответствуют времени снятия дампа(mysqldump). Также провал 16 июля на графике запросов(qps) относится к той же проблеме, что я описывал выше.









Управление

Итого в системе используется 2 сервера под Zabbix-сервера, 2 сервера под MySQL, 16 виртуальных серверов под Zabbix-прокси и тысячи наблюдаемых серверов с Zabbix-агентами. При таком количестве хостов о внесении изменений руками не могло быть и речи. И решением стал Git-репозиторий, к которому имеют доступ все сервера, и где я расположил все конфигурационные файлы, скрипты, и все остальное, что нужно распространять. Далее, я написал скрипт, который вызывается через UserParameter в агенте. После запуска скрипта сервер подключается к Git-репозиторию, скачивает все необходимые файлы и обновления и затем перезагружает Zabbix-агента/прокси/сервера, если конфиг-файлы имели изменения. Обновление стало не сложнее, чем запустить zabbix_get!

Открытые проблемы

Несмотря на все усилия, которые я приложил, осталась одна существенная проблема, которую мне только предстоит решить. Речь о том, что когда система достигает 8000-9000NVPS, то резервная база MySQL больше не успевает за основной, таким образом никакой отказоустойчивости на самом деле и нет.

У меня есть идеи, как данную проблему можно решить, но еще не было времени это имплементировать:

  • Использовать Linux-HA с DRBD для partitioning БД.
  • LUN-репликация на SAN с репликацией на другой LUN
  • Percona XtraDB cluster. В версии 5.6 еще недоступен, так что с этим придется подождать(как я писал, были проблемы с производительностью в MySQL 5.5)

2 Требования

Аппаратное обеспечение

Память

Zabbix требуется и оперативная память, и физическая память на жестком диске. Отправной точкой могут быть 128 МБ оперативной памяти и 256 МБ свободного места на жестком диске. Впрочем, очевидно, что объем необходимой дисковой памяти зависит от количества наблюдаемых узлов сети и наблюдаемых параметров. Если вы планируете достаточно долго хранить историю наблюдаемых параметров, то потребуется по крайней мере несколько гигабайт для хранения данных истории в базе данных. Каждый процесс демона Zabbix требует несколько подключений к базе данных. Объем памяти требуемый каждым подключением к базе данных зависит от настроек базы данных.

Чем больше оперативной памяти у вас имеется, тем быстрее работает база данных (а следовательно, и Zabbix)!

CPU

Zabbix и особенно база данных может потребовать значительных процессорных ресурсов в зависимости от количества наблюдаемых параметров и выбранной базы данных.

Другое оборудование

Для использования SMS уведомлений встроенных в Zabbix потребуется последовательный порт передачи данных и GSM модем. Конвертер USB-to-serial также будет работать.

Примеры конфигураций оборудования

В таблице приводятся несколько вариантов аппаратных конфигураций:

Название Платформа CPU/Память База данных Наблюдаемые узлы сети
Маленькая CentOS Виртуальная машина MySQL InnoDB 20
Средняя CentOS 2 ядра CPU / 2ГБ MySQL InnoDB 500
Большая RedHat Enterprise Linux 4 ядра CPU / 8ГБ RAID10 MySQL InnoDB или PostgreSQL >1000
Очень большая RedHat Enterprise Linux 8 ядер CPU / 16ГБ Быстрый RAID10 MySQL InnoDB или PostgreSQL >10000

Поддерживаемые платформы

В связи с требованиями безопасности и критически важным характером работы системы мониторинга, единственной операционной системой, которая может обеспечить необходимую производительность, отказоустойчивость и гибкость является операционная система UNIX. Zabbix работает на всех ведущих версиях ОС.

Zabbix протестирован на следующих платформах:

    Windows: все версии для рабочих станций и серверов начиная с 2000 (только Zabbix агент)

Также Zabbix может работать и на других Unix-подобных операционных системах.

Zabbix отключает дампы памяти на UNIX платформах, если он скомпилирован с шифрованием и не запускается в случае, если система (например по причине политики SELinux) не дает возможности отключения дампов памяти.

Программное обеспечение

Zabbix построен на современном веб-сервере Apache, ведущих СУБД, и языке сценариев PHP.

Системы управления базами данных
Программа Версия Комментарии
MySQL 5.0.3 - 5.7.x Требуется, если MySQL используется как основная база данных Zabbix"а. Требуется InnoDB engine.
MariaDB также работает с Zabbix.
Обратите внимание , что MySQL 8.0 не поддерживается в Zabbix pre-4.0 версиях.
Oracle 10g или более новая Требуется, если Oracle используется как основная база данных Zabbix"а.
PostgreSQL 8.1 или более новая Требуется, если PostgreSQL используется как основная база данных Zabbix"а.
Предлагаем использовать PostgreSQL по крайней мере версии 8.3, который показывает очень хорошую производительность VACUUM .
SQLite 3.3.5 или более новая Требуется, если SQLite используется как основная база данных Zabbix"а.
IBM DB2 9.7 или более новая Требуется, если IBM DB2 используется как основная база данных Zabbix"а.

Поддержка IBM DB2 является экспериментальной!

SQLite3 может использоваться с Zabbix прокси без каких либо проблем, однако использование SQLite3 с Zabbix сервером не рекомендуется. Начиная с версии Zabbix 2.4.0, одновременный доступ сервера и веб-интерфейса к базе данных SQLite3 может привести к ее порче.

Веб-интерфейс

Следующее программное обеспечение потребуется для работы веб-интерфейса Zabbix:

Приложение Версия Комментарии
Apache 1.3.12 или более поздняя
PHP 5.4.0 или более поздняя PHP v7 еще не поддерживается.
Расширения PHP:
gd 2.0 или более поздняя Расширение PHP GD должен поддерживать формат PNG (--with-png-dir ), JPEG (--with-jpeg-dir ) изображения и FreeType 2 (--with-freetype-dir ).
bcmath php-bcmath (--enable-bcmath )
ctype php-ctype (--enable-ctype )
libXML 2.6.15 или более поздняя php-xml или php5-dom, если поставляется как отдельный пакет от поставщика.
xmlreader php-xmlreader, если поставляется как отдельный пакет от поставщика.
xmlwriter php-xmlwriter, если поставляется как отдельный пакет от поставщика.
session php-session, если поставляется как отдельный пакет от поставщика.
sockets php-net-socket (--enable-sockets ). Требуется для поддержки пользовательских скриптов.
mbstring php-mbstring (--enable-mbstring )
gettext php-gettext (--with-gettext ). Требуется для работы переводов.
ldap php-ldap. Требуется только, если в веб-интерфейсе используется LDAP аутентификация.
ibm_db2 Требуется, если используется IBM DB2 в качестве базы для Zabbix.
mysqli Требуется, если используется MySQL в качестве базы для Zabbix.
oci8 Требуется, если используется Oracle в качестве базы для Zabbix.
pgsql Требуется, если используется PostgresSQL в качестве базы для Zabbix.
sqlite3 Требуется, если используется SQLite в качестве базы для Zabbix.

Также Zabbix может работать и с предыдущими версиями Apache, MySQL, Oracle, и PostgreSQL.

Для шрифтов, кроме DejaVu, который установлен по умолчанию, нужна функция PHP imagerotate . Если функция не установлена, то эти шрифты могут неправильно отображаться на графиках. Эта функция доступна только если PHP скомпилирован вместе с GD, которого нет для Debian и для некоторых других дистрибутивов.

Веб-браузер на стороне клиента

Cookies и Java Script должны быть включены.

Поддерживаются последние версии Google Chrome, Mozilla Firefox, Microsoft Internet Explorer и Opera. Также и другие браузеры (Apple Safari, Konqueror) могут работать с Zabbix.

Начиная с Zabbix 3.0.13, реализована одна и та же политика источника для IFrames, что означает, что Zabbix веб-интерфейс нельзя поместить во фреймы на другом домене.

Всё еще, страницы помещенные в Zabbix фреймы будут иметь доступ к веб-интерфейсу Zabbix (посредством JavaScript), если страница, которая помещена во фрейм и веб-интерфейс Zabbix располагаются на одном домене..html , если помещена в комплексные экраны на http://secure-сайт/zabbix/ , будет иметь полный доступ к Zabbix посредством JS.

Сервер
Требование Описание
OpenIPMI Требуется для поддержки IPMI
libssh2 Требуется для поддержки SSH. Версия 1.0 или более новая.
fping Требуется для элементов данных ICMP пинг .
libcurl Требуется для веб-мониторинга, мониторинга VMware и для SMTP аутентификации. Для SMTP аутентификации, требуется версия 7.20.0 или выше.
libiksemel Требуется для поддержки Jabber.
​libxml2 Требуется для мониторинга VMware. ​
net-snmp Требуется для поддержки SNMP.
Java gateway

Если вы получили Zabbix из репозитория исходных кодов или скачали архив, то необходимые зависимости уже включены в дерево исходного кода.

Если вы получили Zabbix как пакет вашего дистрибутива, то необходимые зависимости обеспечиваются системой управления пакетами.

В обоих вышеупомянутых случаях, программное обеспечение готово к использованию и скачивать какие-либо дополнительные файлы не нужно.

Однако, если вы хотите использовать другие версии этих зависимостей (например, если вы готовите пакет для определенного дистрибутива Linux), ниже приведен список версий библиотек, для которых подтверждена работоспособность Java gateway. Zabbix может также работать с другими версиями этих библиотек.

Следующая таблица содержит список JAR файлов, которые поставляются вместе в Java gateway в оригинальном коде:

Библиотека Лицензия Веб сайт Комментарии
logback-core-0.9.27.jar EPL 1.0, LGPL 2.1 http://logback.qos.ch/
logback-classic-0.9.27.jar EPL 1.0, LGPL 2.1 http://logback.qos.ch/ Протестировано с версиями 0.9.27, 1.0.13, и 1.1.1.
slf4j-api-1.6.1.jar MIT License http://www.slf4j.org/ Протестировано с версиями 1.6.1, 1.6.6, и 1.7.6.
android-json-4.3_r3.1.jar Apache License 2.0 Протестировано с версиями 2.3.3_r1.1 и 4.3_r3.1. Обратитесь к файлу src/zabbix_java/lib/README для получения инструкций по созданию JAR файла.

Java gateway компилируется и запускается при наличии Java версии 1.6 или выше. Если вы готовите прекомпилированную версию Zabbix gateway для использования ее другими, то рекомендуется использовать для компиляции Java 1.6, в этом случае Zabbix gateway будет работать на всех версиях Java вплоть до самой последней.

Размер базы данных

Данные конфигурации Zabbix требуют фиксированное количество дискового пространства и сильно не увеличиваются.

Размер базы данных Zabbix в основном зависит от следующих переменных, которые определяют объем хранимых данных истории:

    Количество обрабатываемых запросов в секунду

Это среднее количество новых значений, которые Zabbix сервер получает каждую секунду. Например: Если имеется 3000 элементов данных с интервалом проверки 60 секунд, то количество обрабатываемых запросов за секунду рассчитывается 3000/60 = 50 .

Это означает, что каждую секунду в базу данных Zabbix добавляется 50 новых записей.

    Настройки очистки истории в базе данных

Zabbix хранит значения определенный период времени, обычно несколько недель или месяцев. Каждое новое значение требует определенный объем дискового пространства для данных и индексов.

Таким образом, если требуется сохранение 30 дней истории и каждую секунду в базу данных добавляется 50 новых записей, общее количество значений будет равно примерно (30 *24*3600)* 50 = 129.600.000 или около 130М значений.

В зависимости от типа базы данных, типа полученных значений (с плавающей точкой, целочисленный, строки, файлы журналов и т.д.) может потребоваться от 40 байт до сотен байт дискового пространства для хранения значения. Обычно одно значение занимает около 90 байт по числовым элементам данных. В нашем случае это означает, что 130M значений потребуют 130M * 90 байт = 10.9ГБ дискового пространства.

Размер значений текстовых/журнальных элементов данных невозможно предугадать, но вы можете ожидать около 500 байт на значение.

    Настройки очистки динамики изменений в базе данных

Zabbix хранит ежечасную статистику значений max/min/avg/count для каждого элемента данных в таблице trends . Эти данные используются для отслеживания динамики изменений и для графиков при отображении большого периода времени. Период в 1 час не является настраиваемым.

Базе данных Zabbix, в зависимости от типа базы данных, требуется около 90 байт на один элемент. Предположим, что если требуется хранить динамику изменений в течении 5 лет. Значения 3000 элементов данных потребуют 3000*24*365* 90 = 2.2ГБ за год, или 11ГБ за 5 лет.

    Настройки очистки событий в базе данных

Каждое событие требует около 170 байт дискового пространства. Сложно точно оценить количество событий, ежедневно генерируемых Zabbix сервером. В самом худшем случае, мы можем предположить, что Zabbix генерирует одно событие в секунду.

Это означает, что для того, чтобы хранить события 3 года, потребуется 3 *365*24*3600* 170 = 15ГБ дискового пространства.

Представленная ниже таблица содержит формулы для расчета требуемого пространства жесткого диска для системы мониторинга Zabbix:

Параметр Формула для расчета занимаемого места(в байтах)
Конфигурация Zabbix Фиксированный размер. Ориентировочно 10МБ или меньше.
История дней*(элементов/частота обновления)*24*3600*байт
элементы: количество элементов данных
дней: количество дней хранения истории
частота обновления: среднее значение периода проверки элементов данных
байт: количество байт, требуемых для одного значения, зависит от типа базы данных, около 90 байт
Динамика изменений дней*(элементов/3600)*24*3600*байт
элементов: количество элементов данных
дней: количество дней хранения динамики изменений
байт: количество байт, требуемых для одного значения, зависит от типа базы данных, около 90 байт.
События дней*событий*24*3600*байт
событий: количество событий в секунду. Одно (1) событие в худшем случае.
дней: количество дней хранения событий
байт: количество байт, требуемых для одного значения, зависит от типа базы данных, около 170 байт.

Средние значения, такие как ~90 байт по числовым элементам данных, ~170 байт по событиям собраны по статистике из реальной жизни при использовании базы данных MySQL.

Общее количество требуемого места на жестком диске рассчитывается:
Конфигурация + История + Динамика изменений + События
После установки Zabbix такое дисковое пространство более НЕ будет использовано сразу. Размер базы данных будет постепенно увеличиваться и остановится по достижении определенного момента, зависящего от настроек очистки базы данных.

Необходимое свободное место на жестком диске, при использовании распределенного мониторинга, рассчитывается аналогичным образом, но оно так же будет зависеть от количества подчиненных нод, связанных с нодой рассчитываемого узла.

Синхронизация времени

Очень важно иметь точную дату и время системы на сервере с запущенным Zabbix. ntpd один из наиболее популярных демонов синхронизации времени хоста с временем на остальных серверах. Настоятельно рекомендуется поддерживать синхронизированное время на всех системах, где работают Zabbix компоненты.

Если время не синхронизировано, Zabbix будет конвертировать штампы времени собранных данных на время Zabbix сервера путем получения штампов времени клиента/сервера после установки соединения для передачи данных и корректировки штампов времени у полученных значений элементов данных при помощи разницы между клиент-сервер временем. Чтобы не усложнять работу и избежать возможные сложности, задержка в соединении игнорируется. По этой причине задержка в соединении добавляется к штампам времени полученных данных с активных подключений (активный агент, активный прокси, sender) и вычитается из штампов времени полученных данных с пассивных подключений (пассивный прокси). Все остальные проверки выполняются по времени сервера и их штампы времени не корректируются.

Обновлено: 12.03.2017 - 11:06

Приложение промышленного класса для мониторинга и отслеживания производительности и доступности сетевых серверов, устройств и других ИТ-ресурсов. Поддерживает распределенный и WEB мониторинг, автоматическое обнаружение и многое другое.

Что такое Zabbix

Zabbix - полнофункциональное open source решение мониторинга производительности. Zabbix предлагает средства мониторинга, оповещения и сигнализации, которые сегодня отсутствуют в других системах мониторинга и даже в некоторых коммерческих системах. Ниже приведен краткий список функций, доступных в Zabbix:
  • Автоматическое обнаружение серверов и сетевых устройств.
  • Низкоуровневое обнаружение.
  • Децинтрализованный мониторинг с централизованным веб-администрированием.
  • Централизованный мониторинг лог-файлов.
  • Серверное программное обеспечение для GNU/Linux, Solaris, HP-UX, AIX, Free BSD, Open BSD, OS X.
  • Родные высокопроизводительные агенты (клиентское программное обеспечение для GNU/Linux, Solaris, HP-UX, AIX, Free BSD, Open BSD, OS X, Tru64/OSF1, Windows NT4.0, Windows 2000, Windows 2003, Windows XP, Windows Vista).
  • Безагентный мониторинг.
  • Безопасная авторизация пользователей.
  • Веб-интерфейс.
  • Уведомления о предопределенных событиях.

Почему стоит выбрать Zabbix

Лучший способ убедиться, что это выбор № 1 для вашей организации - попробовать его. Но если у вас мало времени, почитайте некоторые аргументы:
  • Открытость исходного кода обеспечивает свободу и безопасность. Это касается не только Zabbix но и необходимых компонентов (GNU/Linux, Apache, MySQL/PostgreSQL, PHP).
  • Очень простая установка и процесс настройки гарантируют недорогое обучение и, следовательно, низкую стоимость владения.
  • Высокоэффективные средства для UNIX и Windows (x32, x64, Itanium) обеспечивают более широкие возможности мониторинга с большей скоростью.
  • Централизованная система мониторинга позволяет хранить всю информацию (конфигурацию и данные) в реляционной базе данных для дальнейшего упрощения обработки и повторного использования.
  • Встроенные широкие возможности визуализации позволяют работать с данными быстрее и эффективнее.
  • Встроенные процедуры позволяют хорошо организовать хранение данных.

Системные требования

Платформа ZABBIX-сервер ZABBIX-агент
AIX Поддерживается Поддерживается
FreeBSD Поддерживается Поддерживается
HP-UX Поддерживается Поддерживается
GNU/Linux Поддерживается Поддерживается
Mac OS X Поддерживается Поддерживается
Novell Netware - Поддерживается
Open BSD Поддерживается Поддерживается
SCO Open Server Поддерживается Поддерживается
Solaris Поддерживается Поддерживается
Tru64/OSF Поддерживается Поддерживается
Windows NT 4.0, Windows 2000, Windows Server 2003, Windows XP, Windows Vista, Windows Server 2008, Windows 7, Windows Server 2012, Windows 8 - Поддерживается

Для мониторинга внешних сетевых приложений таких, как FTP, SSH, HTTP, DNS, LDAP и т.д., установка ZABBIX-агента не требуется.

Перевод Zabbix на русский язык

Сбор данных

SNMP и IPMI агенты

Обнаружение проблем

Визуализация

Уведомления

Шаблоны, импорт и экспорт

Автоматическое обнаружение

Распределенный мониторинг

Безопасность и аутентификация

Управление системой

Zabbix API

Сбор данных

Zabbix Agent

Родной Zabbix agent разработан на СИ, работает на разных платформах, включая GNU/Linux, UNIX и Windows. Он собирает такие данные как CPU, память, диск и сетевые устройства.

Компактность и нетребовательность к ресурсам

Благодаря своим небольшим габаритам, агент может работать на устройствах с ограниченными ресурсами. Настройки мониторинга на Zabbix Server централизованы, что упрощает управление Zabbix агентом, который может использовать один файл конфигурации на всех серверах.

Zabbix агент под управлением Microsoft Windows:

Поддержка опроса и захвата

Zabbix агент поддерживает пассивные (опросы) и активные проверки (захваты).

В пассивной проверке, Zabbix сервер (или прокси-сервер) запрашивает значение от агента Zabbix, например, загрузка процессора, агент обрабатывает запрос и возвращает значение в Zabbix сервер (или прокси-сервер).

В активной проверке агент Zabbix запрашивает от сервера Zabbix (или прокси) список активных проверок и отправляет результаты периодически.

Функций агента

Следующий список проверок поддерживается агентом Zabbix из коробки. Следует отметить, однако, что встроенные в агент функции можно расширить с помощью следующих методов: , .

Сеть Передача пакетов/байт
Ошибки/потерянные пакеты
коллизии кадров
CPU Средняя загрузка (англ. Load average)
простой/использование процессора
Память Свободная/используемая память
использование свопа/файла подкачки
Диск Свободное и занятое пространство
Чтение и запись I/O
Серверы Состояние процесса
Память процесса
Состояние службы (ssh, ntp, ldap, smtp, ftp, http, pop, nntp, imap)
Состояние службы Windows
DNS разрешения
подключения TCP
время отклика TCP
Файл Размер файла/время
Существование файла
Контрольная сумма
MD5 хеш
Поиск регулярного выражения (англ. RegExp search)
Журнал Текстовый журнал
Журнал событий Windows (англ. Windows event log)
Другое Время работы системы
Системное время
Подключенные пользователи
Счетчик производительности (Windows)
Полный список поддерживаемых проверок доступен .

Мониторинг журнала

Поддержка мониторинга текстовых журналов и Windows Event Log является родной функцией агента Zabbix, включая поддержку ротации.
Журналы постоянно анализируются агентом Zabbix и когда определенный элемент поиска найден, Zabbix сервер получает уведомление и может даже выполнить некоторое действие или отправить пользователю или группе.

Поддержка IPv6

Zabbix агент поддерживает IPv4 и IPv6.

SNMP и IPMI агенты

Поддержка SNMP

Zabbix Server может собирать данные из устройств с SNMP agent v1, v2 or v3. SNMP есть не только у сетевых устройств, но и у принтеров, NAS, UPS. В принципе, любое оборудование, которое присутствует в сети можно контролировать через агенты SNMP.
Для упрощения конфигурации Zabbix поддерживает стандарт SNMP MIB-2, а также конкретную информацию о Enterprise MIB.
Вы можете собирать данные с помощью SNMP режима опроса или получения ловушки SNMP (англ. SNMP traps) через утилиты и .

Кроме этого, вы можете получить данные SNMP с использованием предлагающих гибкий мониторинг без потери производительности, поскольку разрешенные запросы кэшируются.

Агент IPMI

Чтобы получать важные данные о аппаратуре, Zabbix сервер поддерживает IPMI агенты, которые присутствуют по умолчанию на серверной архитектуре Intel, такой как HP iLO и Dell DRAC.
Элементы, доступные через агентов IPMI бывают разными, но эти наиболее распространенные:

  • Температура процессора и корпуса.
  • Скорость вращения вентилятора.
  • Напряжение системы.
  • Состояние физических дисков.
  • Состояние светодиодов.

Безагентный мониторинг

В то время как агент Zabbix предлагает большие возможности для большинства платформ, в некоторых случаях его невозможно установить. Для этих случаев сервер Zabbix предоставляет несколько безагентных методов мониторинга.

Безагентные функции

Сетевые сервисы

Zabbix сервер может проверить как служба прослушивает порт и каким образом она отвечает. Этот метод в настоящее время поддерживается для следующих служб: FTP, IMAP, LDAP, NNTP, POP3, SSH и Telnet.

Проверка TCP-порта

В случаях противных предыдущему пункту, Zabbix сервер может проверить что прослушивает TCP-порт, сообщив доступна служба или нет.

ICMP ping

Хоть и просто, но важно, Zabbix может проверить, отвечает сервер на ICMP Ping пакеты или нет. Таким образом, можно контролировать доступность сервера, время реакции и потери пакетов.
Проверки можно настроить установив размер и количество пакетов, тайм-аут и задержку между каждым пакетом.

SSH и Telnet

Если настроить Zabbix-агент не предоставляется возможным, но есть доступ через SSH или Telnet, Zabix может запустить любую пользовательскую команду и использовать ее вывод в качестве собранного значения. Это значение можно использовать, например, для генерации графиков и сигнализации.

Пользовательский мониторинг

Добавление пользовательских скриптов

В дополнение к встроенным проверкам, можно создать собственные агенты проверок используя функций.

Проверка TCP-порта

Кроме этого, мощной функцией агента Zabbix является выполнение пользовательских скриптов. Любой человек может расширить функциональность Zabbix агента путем создания сценариев на Perl, Python, Ruby или любом другом языке, который можно запустить. Результат выполненного сценария отправляется на Zabbix сервер, который хранит и обрабатывает его как любую другую проверку.

Внешняя проверка

Во внешней проверке Zabbix сервер может запускать скрипты пользователей из их собственного сервера.

Мониторинг виртуальных машин

Мониторинг VMware среды

Поддержка мониторинга VMware в Zabbix включает в себя возможность автоматического обнаружения гипервизоров и виртуальных машин, а также мониторинга установок VMware VCENTER и VSPHERE для различных гипервизоров, свойств виртуальных машин и статистики.

Zabbix может использовать правила низкоуровневого сканирования для автоматического обнаружения VMware гипервизоров и виртуальных машин. Для полной автоматизации процесса, прототипы узлов необходимо создать по правилам низкоуровневого сканирования. При обнаружении виртуальной машины, полученная информация используется для включения этих прототипов в реальные узлы. Обнаруженные узлы принадлежат существующему узлу и принимают его IP.

Стандартный набор данных Zabbix предлагает несколько готовых к использованию шаблонов для мониторинга VMware VCENTER и VSPHERE. Эти шаблоны содержат предварительно настроенные правила LLD, а также ряд встроенных проверок для мониторинга виртуальных объектов.

Веб-сценарии

Встраивание в сайт

Zabbix обеспечивает эффективные и гибкие функции веб-мониторинга, где веб-модуль регулярно выполняет предопределенные сценарии и сохраняет полученные результаты.
Функция веб-мониторинга позволяет легко проверить производительность и доступность веб-ресурсов и на основе собранных данных создавать графики, сигнализации и отправлять уведомления о сбоях.

Для каждого шага сценария хранятся следующие величины:

  • Время ответа.
  • Код ответа.
  • Скорость загрузки.
  • Вхождение результата в строку (англ. Occurrence of a string in result).

Веб сценарий состоит из одного или нескольких HTTP запросов (шагов), которые в совокупности могут проверить функциональность веб-приложений, обеспечивая пользователю полезный опыт.

Во время выполнения шагов, cookies обеспечивают эффективный мониторинг.

Дополнительные возможности

  • Пользовательские переменные.
  • Редиректы.
  • GET и POST методы.
  • HTTP и HTTPS протоколы.
  • Базовая авторизация.
  • NTLM авторизация.

Java Applications

Мониторинг приложений Java

Zabbix 2.0 вводит новый компонент под названием Zabbix Java gateway (написанный на Java), который может контролировать Java-приложения технологией .
Таким образом, сервер Zabbix запрашивает у Zabbix Java gateway специальный JMX-счетчик, который удаленно, через JMX API может предоставить информацию о приложении Java, без необходимости использования дополнительного программного обеспечения.
Популярные приложения, такие как ActiveMQ, GlassFish, JBoss, Tomcat и WebSphere легко контролируется через JMX.

JMX технология

Технология JMX присутствует в платформе Java SE начиная с версии J2SE 5.0 и предоставляет способы мониторинга любого приложения или устройства с JVM.
Для получения дополнительной информации об этой технологии смотрите документацию:

Мониторинг баз данных

Мониторинг любых запросов

С помощью специальной технологии ODBC и драйверов, Zabbix сервер может собирать любые данные в базах данных СУБД, таких как MySQL, PostgreSQL, Oracle и Microsoft SQL Server.
После выполнения запроса, его результат сохраняется что позволяет создавать графики, сигнализации и уведомления в случае сбоев в работе или недоступности.
Эта возможность делает контроль более эффективным, поскольку она собирает информацию непосредственно из базы данных, во избежание ложных срабатываний.

Расчет и накопление информации

Вычисляемые элементы

С помощью арифметического выражений, рассчитанные элементы позволяют создавать виртуальные источники данных, где значения периодически пересчитывается. Результат сохраняется, что позволяет генерировать графики, сигнализации или отправки уведомлений.
Примером вычисляемого элемента было бы вычислить сумму трафика между двумя портами на сетевом коммутаторе.

Накопление информации

Организуя по группам, можно создавать элементы с функциями накопления, такие как максимум, минимум и средние элементы, которые являются общими для всех хостов в группе.
Примером совокупных элементов может быть расчет среднего использования памяти по всем узлам входящим в определенную группу.

Производительность Zabbix Server

Внутренние проверки предлагают важные значения о состоянии сервера Zabbix, позволяя администратору Zabbix решать проблемы быстро и отслеживать растущее использование инструмента.

В средних и крупных средах, мониторинг этих значений является критически важным чтобы убедиться что сервер Zabbix работает с ресурсами, которые совместимы с требованиями.

Обнаружение проблем

Как только Zabbix Server соберет данные, начнется процесс оценивания собранных данных. Правила оценивания данных или триггеры выражений обеспечивают логическое определение проблемы состояния данных, полученных от наблюдаемых постов. Когда пороговое значение высокое, триггер меняет свое состояние на PROBLEM и наоборот, когда данные ниже порогового уровня.

Исключительная гибкость определения порога

Zabbix предоставляет своим пользователям очень гибкие и интеллектуальные варианты определения порога. Когда порог для триггера "больше X", можно использовать все логические выражения, такие как деление, умножение, не равно, логические И и ИЛИ.

Более того, Zabbix позволяет использовать много различных деталей, полученных из разных хостов для построения выражений триггеров. Это позволяет строить очень сложные, интеллектуальные пороги, которые сводят к минимуму ложные срабатывания и, следовательно, позволяют администраторам сосредоточиться на реальных проблемах.

Сдвиг во времени

Функциональность Zabbix предоставляет возможность сверить текущее состояние данных с полученным некоторое время назад. Так что можно сравнивать подобные периоды времени, скажем, это понедельник с предыдущим понедельником или вторую половину дня с двумя неделями назад. Это очень полезно, когда нагрузка на окружающую среду не является равномерной и простое сравнение утра понедельника во вторник не дает ценной информации.

Гистерезис

Гистерезис это великолепная функция, которая позволяет избежать колебаний, которые могут возникнуть при колебании входящих данных вокруг порогового значения. Гистерезис имеет верхний и нижний пределы, которые помещают триггер в состояние проблемы когда верхний предел достигнут и возвращаю триггер в нормальное состояние, когда полученные данные ниже порогового значения.

Зависимости

В любой ИТ-среде есть много зависимостей, когда отказ одного узла ведет за собой провал операции во многих других частях. Зависимости могут вырасти до многоуровневых, когда нехватка дискового пространства приводит к отказу ОС, на которой работает база данных. На данный момент пользователи CRM, CMS, BPMS, и многих других бизнес-приложений не смогут выполнять свои задачи. Система мониторинга, настроенная без зависимостей будет производить десятки или сотни уведомлений и отправлять сотни или тысячи электронных писем о всех этих системах. В качестве альтернативы, разумно используют функцию зависимости, что даст только одно уведомление информирующее о недостатке места на диске, в то же время скрывая все другие уведомления.

Различные уровни серьёзности

Поскольку не все триггеры обладают одним уровнем серьёзности, триггеру можно назначить один из шести уровней серьёзности. Степень серьезности затем наносят на визуальное представление триггеров и можно использовать для регулирования реакции на проблемное событие.

Визуализация

Люди легче отличаю визуальные данные чем голые цифры, особенно когда есть огромное количество данных. Ниже представлены различные функции визуализации.

Веб-интерфейс Zabbix является особенностью, которая отличает его от других решений. Мощный, но простой в использовании графический интерфейс официально поставляется вместе с установочным пакетом.

Графический

Можно отображать много графиков на одном экране, автоматически обновлять их, изменять период и так далее.

Нет необходимости в скрытых текстовых файлах.

Все настройки мониторинга можно менять в веб-интерфейсе. Не нужно знать как пользоваться консолью и текстовыми редакторами UNIX.

Контролируйте все в одном месте

Веб-интерфейс предлагает как настройку мониторинга так и просмотр собранных данных. Администратор сети может видеть и контролировать все в одном интерфейсе.

Веб-интерфейс Zabbix обеспечивает централизованную настройку всех аспектов мониторинга. Изменения конфигурации сразу становятся активными.

Zabbix полностью поддерживает Unicode/UTF-8 для настоящей локализации и многоязычности.

Аудит

Все пользовательские операции записываются.

Кросс-браузерная поддержка

Поддерживаются последние версии Google Chrome, Mozilla Firefox, Microsoft Internet Explorer и Опера. Другие браузеры (Konqueror, Apple Safari) тоже могут работать с Zabbix.

Глобальный поиск

Глобальный поиск содержит предложения, основанные на введенной строке.
Результаты поиска содержат соответствующие узлы, группы узлов и шаблоны.

Глобальные уведомления

Глобальные уведомления отображают информацию требующую немедленного внимания пользователя, независимо от экрана, на который он смотрит. В глобальные уведомления входят сообщения и воспроизведении звука.
Глобальные уведомления можно включить в настройках профиля пользователя. Если они включены, можно изменить время ожидания реакции на уведомление. По умолчанию, сообщения будет оставаться на экране в течение 90 секунд.
Сообщения можно фильтровать на основе триггера важности. Для каждого триггера важности и сообщения о восстановлении можно настроить воспроизведение звука.
Поступающие сообщения отображаются в плавающем разделе на правой стороне. Этот раздел можно перемещать по вертикали.

Локализация

Веб-интерфейс переведен на 22 языка. Процесс перевода продолжается.

Темы оформления

По умолчанию, веб-интерфейс Zabbix предоставляет несколько предустановленных тем. Пользователи могут создавать свои собственные темы.

Глобальная панель инструментов

Zabbix Dashboard представляет собой центральное место в веб-интерфейсе и обеспечивает детальную информацию о контролируемой среде. Доступна следующая информация на одном экране:
  • Состояние Zabbix Server.
  • Состояние системы.
  • Состояние хоста.
  • Последние 20 проблем.
  • Веб-мониторинг.
  • Графики.
  • Экраны.
  • Карты.
Пользователи могут настраивать приборную панель, перетаскивать виджеты, добавлять и удалять избранное.

Графики

Zabbix может легко генирировать графики из собранных данных.

Автоматические графики.

Стандартные графики для различных элементов доступны без каких-либо настроек - эти графики создаются на время выполнения. Для просмотра такого графика нажмите на "Graph next" любого элемента в "Latest data".
Управление графиком позволяет изменять отображаемый в данный момент период времени.

Перетаскивание с увеличением (зумом)

Рассматриваемый период времени изменяется путем перетаскивания или изменения размера полосы прокрутки времени.

Кроме этого, ссылки слева (выше полосы прокрутки) дают возможность выбора предустановленных, часто используемых периодов времени и перемещения отображаемых периодов вперед/назад по временной шкале (ниже полосы прокрутки). Даты с правой стороны работают как ссылки, всплывающий календарь позволяет установить время начала и окончания.

Пользовательские графики

Пользовательские графики мощнее стандартных. В пользовательских графиках данные из нескольких пунков можно сравнить и вы можете задать стиль графика или способ отображения строчек. Пользовательские графики можно создавать для хоста, нескольких узлов или шаблона.
Пользовательские графики наряду с парой основных отчетов позволяют смотреть данные в контексте.

Гистограмма отчетов

Гистограмма отчетов позволяет посмотреть на данные с разных точек зрения. Хотите посмотреть на еженедельные значения температуры в серверной комнате за последние два месяца? Нужно сравнить загрузку веб-сервера за первый месяц каждого квартала этого года? Все это и многое другое можно с этой функцией.

Карты сетей

Каждый элемент на карте может представлять собой хост, группу хостов, один триггер, изображение или другую карту. Редактирование карт современем было улучшено добавлением drag-and-drop, выделением областью и выбором отображаемых деталей элемента в всплывающем окне.

Посмотрите что происходит

Так как элементы карты могут быть связаны, карта может стать "живой", начиная отображать то что происходит в наблюдаемых узлах.
Если что-то случится, значок состояния и цвет устройства на карте автоматически измениться.

Пропускная способность в деталях. Значок и описание устройства могут содержать пользовательские макросы. Например, пропускная способность в реальном времени и средняя нагрузка процессора могут отображаться в описании хоста.

Состояние зависимостей

Если вы нажмете на узел то получите доступ к некоторым скриптам и ссылкам на страницы состояния триггера, который предоставит список активных триггеров узла и страницу экрана узла.

Экраны и презентация

Экраны

Независимые визуальные элементы (графики, карты, данные обзоров и т.д.) могут быть сгруппированы вместе для отображения на одном экране обзора.
Экраны Zabbix в основном табличные и могут содержать в каждой ячейке:

  • график;
  • определенный пользователем график;
  • карту;
  • другой экран;
  • текстовую информацию;
  • информацию о сервере (обзор);
  • информацию о триггере (обзор);
  • обзор данных;
  • часы;
  • историю событий;
  • историю действий;
  • URL (данные взяты из другого места).

Строитель экрана делает создание экрана простым и интуитивно понятным. Количество элементов на экране не ограничено.

Презентация.

Презентация может показывать несколько экранов один за другим, в соответствии с заданным интервалом.

Доступ к необработанным данным

Все собранные данные, независимо от типа, храняться в таблицах журнала как необработанные данные.

События и детали уведомлений

Список событий

Zabbix хранит все события в базе данных. Вы можете просмотреть все события в списке. Можно использовать параметры фильтрации для поиска специфического для триггера события.

Кроме этого, вы можете написать сообщение подтверждения каждого события.

События и детали уведомлений
Если вы нажмете на событие то увидите подробности событий и уведомлений. На этом экране источник событий, детали подтверждения и связанных событий тоже отображаются.

Безопасность и аутентификация

Права пользователя

Типы пользователей

Тип пользователя Описание
Пользователь Zabbix
Администратор Zabbix Права группы узлов должны быть указаны явно.
Суперадминистратор Zabbix

  • чтение и запись;
  • только чтение;
  • доступ запрещен.
Скриншот ниже дает общее представление о том, как легко можно назначить права пользователей узлу или группе узлов.

Методы аутентификации

  • внутренняя база данных;
  • базовая авторизация по HTTP;
  • LDAP аутентификация.

Приятные мелочи

Нанесение значений на карту .

Нанесение значений полезно для просмотра данных. Вы можете нанести текстовое пояснение на полученное значение. Таким образом, вместо голого значения "1", отображается что-то более понятное, например «доступно».

Рабочее время

Рабочее время отображается белым фоном, а не рабочее - серым.

Просмотр нескольких лог-файлов вместе

В просмотре истории журнала можно объединить несколько журналов данных на одном экране. А также фильтровать и выделять данные журнала в текстовом режиме. Это нужно чтобы находить и легко исследовать конкретные данные журнала.

Уведомления

Zabbix позволяет не только собирать, хранить и анализировать информацию о контролируемой среде, но информировать ответственный персонал о возникновении событий используя различные каналы и опции. Zabbix обеспечивает полный рабочий процесс: отправка уведомлений, разрешение подтверждения полученой информации, разглашение информации другим людям и способность принимать меры.

Ниже описаны различные стадии процесса уведомления:

  • получить сообщение;
  • выполнить команду;
  • эскалация (разглашение) ответов на проблемы.

Получение сообщений

Выбор метода

Zabbix имеет несколько предопределенных способов доставки уведомлений. Администраторы могут получать уведомления несколькими способами:

  • по электронной почте;
  • по SMS;
  • на Jabber;
  • с помощью пользовательских alertsript.
Кроме этого, для уведомлений можно использовать скрипты. Содержание уведомлений полностью настраивается в зависимости от контекста. Каждый контакт может получить уведомление указанными способами с использованием указанных средств массовой информации в указанный день и время.

Включение важных деталей

Выполнение и инвентаризация информации, настройка информации и последние данные можно включить в сообщение. Сообщение может иметь такие поля как:

  • дата и время;
  • имя узла;
  • предмет и описание триггера;
  • последние данные;
  • профиль узла.
Настройки в зависимости от получателя

При отправке сообщения пользователю или группе пользователей, сообщение о этой же проблеме можно настроить на другой набор информации в зависимости от роли получателей в организации.

Выполнение команд

На удаленной системе можно запустить команды оболочки чтобы исправить ситуацию, когда система перегружена или когда сервисы не работают должным образом. Типичным примером использования таких программ есть перезапуск сервера или сервисов.
Команды можно выполнить:
  • на Zabbix сервере;
  • на Zabbix agent;
  • используя IPMI;
  • используя Telnet и SSH.
Более подробная информация о удаленном выполнении команд в руководстве.

Эскалация (разглашение) ответов на проблемы.

Эскалация содержит сценарий, который представляет собой график отправки уведомлений. Если проблема не устранена или не было подтвержения, уведомление отправляется другим получателям и даже по необходимости выполняются команды.

Zabbix обеспечивает эффективные и чрезвычайно гибкие правила эскалации заданий. В зависимости от настроек, Zabbix автоматически эскалирует (переходит к следующему шагу распространения) нерешенные проблемы и выполняет действия назначенные каждому шагу эскалации.

Поддерживаемые параметры

  • Немедленное информирование о новых проблемах.
  • Pro-активный мониторинг: Zabbix выполняет предопределенные скрипты (удаленные команды).
  • Повторение уведомлений пока проблема не решена.
  • Отложенные уведомления и удаленные команды.
  • Эскалация проблем для других групп пользователей.
  • Различные пути эскалации для признанных и непризнанных проблем.
  • Восстановление сообщения для всех заинтересованных сторон.
  • Zabbix поддерживает неограниченное количество шагов эскалации.
Истоии эскалаций могут быть включены в уведомлениях, так что получатель видит то, что происходит и почему он получил это сообщение.

Шаблоны, импорт и экспорт

Шаблоны

Шаблоны - отличный способ упростить управление Zabbix. Набор объектов (элементов данных, триггеров, графиков, приложений, экранов и правил обнаружения) можно связать с шаблоном чтобы эффективнее управлять тысячами устройств.
Шаблоны можно привязывать к узлам. Все элементы, триггеры и графики шаблона будут автоматически добавлены к связанному узлу. Изменяйте определенные элементы шаблона (устройства, триггер, графики и т.д.) и изменения автоматически применяться ко всем узлам.

Настройка импорта и экспорта

Zabbix позволяет обмениваться настройками импорта и экспорта между системами.
Данные экспортируются в XML-формат, который легко читать и редактировать. Данные импорта и экспорта:

  • Обмен шаблонами или сетевыми картами между пользователями, системами или организациями.
  • Параметры конфигураций.
  • Интеграция со сторонними инструментами.
Использование XML-формата позволяет встраивать Zabbix в сторонные приложения и проводить импорт/экспорт.
Эта функция относится к трем основным категориям конфигурации: узлы и связанные с ними данные, сетевые карты и экраны.
  1. Импорт и экспорт узлов.
  • Узлы и связанные с ними шаблоны.
  • Приложения.
  • Товары.
  • Триггеры.
  • Пользовательские графики.
  • Пользовательские макросы.
  • Правила исследования.
  • Импорт и экспорт карт.
    • Настройка карты.
    • Все элементы карты, включая изображения, триггеры, узлы сети, группы узлов и карты.
    • Все разъемы с соответствующими данными, включая метки и индикаторы состояния.
  • Экран импорта/экспорта
    • Экран импорта/экспорта поддержкивает все элементы экрана.

    Автоматическое обнаружение

    Мониторинг крупных окружений без автоматизации может стать кошмаром. Zabbix предоставляет несколько способов автоматизации управления такими средами. Устройства и элементы устройств, такие как файловые системы и сетевые интерфейсы, могут быть добавлены и удалены автоматически по мере их поступления и выхода из организации.

    Есть три основных подхода автоматического обнаружения и управления элементами среды в пределах Zabbix, каждый из которых обслуживает свое поле деятельности: сетевое обнаружение, низкоуровневое обнаружение и агент авторегистрации.

    Сетевое обнаружение

    Эта функция позволяет периодически сканировать сеть на предмет внешних сервисов и Zabbix агентов (пассивно) и принять заранее определенные действия при обнаружении их. Процесс исследования начинаестя с загрузки , которые опираются на следующую информацию:

    • IP диапазон сканирования;
    • внешние сервисы для поиска (FTP, SSH, WEB, POP3, IMAP, TCP и т.д.);
    • информацию, полученную от агента Zabbix;
    • информацию, полученную от SNMP агента.
    Функции сканирования генерируют события сканирования, которые могут стать основой для соответствующих предопределенных действий, таких как:
    • отправка уведомлений пользователю;
    • добавить или удалить узел;
    • включить и отключить узел;
    • добавить или удалить узел в группу;
    • привязать или отвязать узел от шаблона;
    • выполнить удаленный сценарий.
    Дествия могут быть настроены с учетом типа устройства, IP, статуса, uptime/downtime и других параметров.

    Низкоуровневое сканирование

    Низкоуровневое обнаружение предоставляет возможность автоматического создания элементов, триггеров и графиков на различных элементах на устройстве. Например, Zabbix может автоматически начать мониторинг файловых систем или сетевых интерфейсов на машине, без необходимости создания элементов для каждой файловой системы или сетевого интерфейса вручную.
    Zabbix поддерживает три типа низкоуровневого сканирования:

    • сканнирование файловых ситсем;
    • сканирование сетевых интерфейсов;
    • сканирование SNMP OIDs.
    Автоматическая регистрация активного агента

    Эта функция позволяет серверу Zabbix автоматически начать мониторинг нового оборудования, если на данном оборудовании установлен агент Zabbix. Это позволяет добавлять новые узлы сети для мониторинга без ручной настройки сервера Zabbix для каждого отдельного узла. При добавлении нового оборудования в контролируемую среду, необходимо лишь установить агент Zabbix (активный) и направить его к серверу Zabbix.
    Функция автоматической регистрации очень удобна для автоматического мониторинга новых облачных узлов. Как только у вас появился новый узел в облаке, Zabbix автоматически начнет сбор данных о производительности и доступности этого узла.

    Распределенный мониторинг

    Распределенный мониторинг через Zabbix прокси

    Zabbix прокси собирает информацию о контролируемой среде и отправляет ее на Zabbix сервер. Использование Zabbix прокси может значительно упростить обслуживание контролируемой среды и значительно повысить производительность центрального сервера Zabbix.

    Использование Zabbix прокси является самым простым способом сбора локальной информации и отчетности на центральный сервер Zabbix.

    Безопасность и аутентификация

    Права пользователя

    Zabbix умеет эффективно управлять правами пользователя на одном сервере или распределенной среде.

    Типы пользователей

    Zabbix поддерживает несколько типов пользователей. Типы пользователей используются для определения доступа к административным функциям и назначения разрешений по умолчанию.

    Тип пользователя Описание
    Пользователь Zabbix Пользователь имеет доступ к меню мониторинга. Пользователь не имеет доступа к любым ресурсам по умолчанию. Права группы узлов должны быть указаны явно.
    Администратор Zabbix Пользователь имеет доступ к мониторингу и настройке. Пользователь не имеет доступа к любым группам узлов по умолчанию. Права группы узлов должны быть указаны явно.
    Суперадминистратор Zabbix Пользователь имеет доступ ко всему: Мониторинг, Настройка и администрирование. У него есть доступ к чтению и записи на все группы узлов. Permissions cannot be revoked by denying access to specific host groups.

    Предоставление доступа к узлам

    Права выдаются группам пользователей на уровне групп узлов. Таким образом, доступ к целому ряду узлов зависит от того какие права групп пользователей принадлежат группе узлов.

    Есть три вида прав доступа к узлам или группе узлов:

    • чтение и запись;
    • только чтение;
    • доступ запрещен.
    Предоставление прав на добавление групп узлов соответствующего уровня доступа.

    Методы аутентификации
    Веб-интерфейс Zabbix поддерживает несколько методов аутентификации:

    • внутренняя база данных;
    • базовая авторизация по HTTP;
    • LDAP аутентификация.
    Если LDAP используется в качестве метода проверки подлинности и по каким то причинам он стал недоступен, группы пользователей по прежнему могут использовать внутреннюю авторизацию для доступа к веб-интерфейсу Zabbix.

    Управление системой

    Периоды обслуживания

    Функции обслуживания могут быть использованы для планового технического обслуживания узлов сети и групп узлов. Администратор может заранее установить срок обслуживания в веб-интерфейсе. Можно указывать ежедневные, еженедельные и ежемесячные периоды обслуживания.

    Поддерживаются два режима управления техническим обслуживанием, сообщая администратору, следует ли прекратить сбор всех данных или подавить только оповещений о сбоях.

    Инвентарь

    Zabbix поддерживает такую информацию о узле как серийный номер, MAC-адрес, ОС и программное обеспечение. Эта информация может быть включена в уведомление о проблемах с устройством, что упрощает системному администратору понимание причины проблемы и помогает найти решение.

    Поле "Host inventory" может быть заполнено автоматически. Специальные элементы могут собирать информацию о узлах и заполнять поле инвентаризации в определении узла.

    Пользовательские скрипты для управления узлами

    В пользовательском веб-интерфейсе Zabbix можно использовать скрипты. На приборной панели, в экранах карт и событий, администратор может запускать сценарии нажав на значок имени узла или карты и выбрав сценарий из выпадающего списка.

    Эта функция полезна для первой реакции на проблему в системе. Ping и traceroute доступны по умолчанию.

    Zabbix API

    API Zabbix обеспечивает доступ почти ко всем функциям. Наличие API Zabbix открывает много возможностей для еще большей эффективности в области мониторинга. Некоторые из них описаны ниже.

    Простая двусторонняя интеграция

    Zabbix API позволяет легкую интеграцию с любым программным обеспечением, которое в состоянии сделать или принять внешние вызовы. Интеграцию с системой тиккетов можно рассматривать как один из наиболее частых применений Zabbix API. Интеграция с популярными системами тиккетов, такими как JIRA и Bugzilla, займет всего несколько дней.

    Программное обеспечение третьих сторон

    Кроме того, можно использовать Zabbix API для интеграции функций Zabbix в программное обеспечение, разработанное другой стороной.

    Управление конфигурацией

    При работе в автоматизированных средах, управляемых с помощью таких систем управления конфигурацией как Puppet, Chef, интеграция Zabbix с такими системами может сэкономить много времени при добавлении, удалении или обновлении оборудования или программного обеспечения.

    Еще одна интересное использование Zabbix API: вы можете добавить сотни или тысячи устройств, что с помощью веб-интерфейса не возможно.

    Получение данных

    Zabbix имеет большой объем информации о среде организации хранящейся в базе данных. Эта информация заслуживает повторного использования в программах по статистике, безопасности и инвентаризации чтобы дать больше возможностей организации. И это расширяет горизонты использования Zabbix для сбора информации не только о доступности и производительности ИТ-среды, но и о бизнес-метриках, KPI, расположении товарно-материальных ценностей, различных датчиков (влажность, температура, движение, бесконтактные датчики) и многих других битов информации, которые окружают нас в повседневной деятельности.

    Мобильные приложения

    Мониторинг ИТ-среды требует постоянного внимания независимо от ответственности персонала, выходных или даже отпусков. С помощью мобильных телефонов и смартфонов можно получить доступ к визуализации, конфигурации, подтверждении событий и многим другим возможностям Zabbix. Любой человек может развивать свое собственное приложение по управлению Zabbix или пользоваться уже готовым приложением.

    Начало работы с API

    Статья в блоге Zabbix описывает как пользоваться API на примерах проверки подлинности, получении списка узлов и описании потока данных.

    Смотрите полный список в оффициальной документации Zabbix.


    © 2013 сайт. Копирование материала разрешается только с указанием прямой и индексируемой ссылки .

    2 Сервер

    Обзор

    Zabbix сервер - центральный процесс программного обеспечения Zabbix.

    Сервер выполняет опрос и отлов данных, вычисляет триггеры, отправляет оповещения пользователям. Он является центральным компонентом, которому Zabbix агенты и прокси сообщают данные о доступности и целостности систем. Сервер может самостоятельно удаленно проверять сетевые службы (такие как веб-сервера и почтовые сервера), используя простые проверки сервисов.

    Сервер является главным хранилищем, в котором хранятся все конфигурационные, статистические и оперативные данные, так же он рассылает уведомления администраторам в случае возникновения проблем с любой из наблюдаемых систем.

    Функционал базового Zabbix сервера разделен на три отдельных компонента; это: Zabbix сервер, веб-интерфейс и хранилище в базе данных.

    Все данные о конфигурации Zabbix хранятся в базе данных, с которой взаимодействует и сервер и веб-интерфейс. Например, когда вы создаете новый элемент данных используя веб-интерфейс (или API), запись об этом добавляется в таблицу элементов данных в базе данных. Затем, раз в минуту Zabbix сервер опрашивает таблицу элементов данных для получения списка активных элементов данных, и сохраняет этот список в кэш Zabbix сервера. Именно поэтому любые изменения в веб-интерфейсе Zabbix будут отображены в разделе последних данных с задержкой до двух минут.

    Процесс сервера

    Если установлен из пакета

    Zabbix сервер работает как демон. Для запуска сервера выполните:

    Shell> service zabbix-server start

    Эта команда будет работать на большинстве GNU/Linux системах. На других системах вам, возможно, потребуется выполнить:

    Shell> /etc/init.d/zabbix-server start

    Аналогично, для остановки/перезапуска/просмотра состояния, используйте следующие команды:

    Shell> service zabbix-server stop shell> service zabbix-server restart shell> service zabbix-server status

    Запуск вручную

    Если выше приведенные команды не работают, вам необходимо запустить сервер вручную. Найдите путь к бинарному файлу zabbix_server и выполните:

    Shell> zabbix_server

    Можно использовать следующие параметры командной строки с Zabbix сервером:

    C --config <файл> абсолютный путь к файлу конфигурации (по умолчанию /usr/local/etc/zabbix_server.conf) -R --runtime-control <опция> выполнение административных функций -h --help вывод этого сообщения помощи -V --version вывод номера версии

    Выполнение административных функций не поддерживается в OpenBSD и NetBSD.

    Примеры запуска Zabbix сервера с параметрами командой строки:

    Shell> zabbix_server -c /usr/local/etc/zabbix_server.conf shell> zabbix_server --help shell> zabbix_server -V

    Управление работой

    Опции управления работой:

    Опция Описание Цель
    config_cache_reload Перезагрузка кэша конфигурации. Игнорируется, если кэш уже загружается в текущий момент времени.
    housekeeper_execute Запуск процедуры очистки базы данных. Игнорируется, если процедура очистки выполняется в данный момент.
    log_level_increase[=<цель >] Увеличение уровня журналирования, действует на все процессы, если цель не указана. pid - Идентификатор процесса (1 до 65535)
    тип процесса - Все процессы указанного типа (например, poller)
    тип процесса,N - Тип процесса и номер (например, poller,3)
    log_level_decrease[=<цель >] Уменьшение уровня журналирования, действует на все процессы, если цель не указана.

    Допустимый диапазон PID изменения уровня журналирования одного процесса с 1 до 65535. На системах с PID > 65535 как вариант решения для изменения уровня журналирования отдельных процессов (например, "history syncer,6") можно использовать опцию <тип процесса,N>.

    Пример использования административных функций для перезагрузки кэша конфигурации сервера:

    Shell> zabbix_server -c /usr/local/etc/zabbix_server.conf -R config_cache_reload

    Пример использования административных функций для вызова выполнения очистки базы данных:

    Shell> zabbix_server -c /usr/local/etc/zabbix_server.conf -R housekeeper_execute

    Примеры использования административных функций по изменению уровня журналирования:

    Увеличение уровня журналирования по всем процессам: shell> zabbix_server -c /usr/local/etc/zabbix_server.conf -R log_level_increase Увеличение уровня журналирования у второго процесса поллера: shell> zabbix_server -c /usr/local/etc/zabbix_server.conf -R log_level_increase=poller,2 Увеличение уровня журналирования у процесса с PID 1234: shell> zabbix_server -c /usr/local/etc/zabbix_server.conf -R log_level_increase=1234 Уменьшение уровня журналирования по всем http поллер процессам: shell> zabbix_server -c /usr/local/etc/zabbix_server.conf -R log_level_decrease="http poller"

    Пользователь процесса

    Zabbix сервер спроектирован для запуска от непривилегированного пользователя (non-root). Он будет работать от любого непривилегированного пользователя от которого был запущен. Таким образом, вы можете запускать сервер от имени любого непривилегированного пользователя, без каких либо последствий.

    Если вы попытаетесь запустить сервер от "root", сервер сразу переключится на пользователя "zabbix", который должен присутствовать в вашей системе. Единственный способ запустить сервер от пользователя "root" - соответствующим образом отредактировать параметр "AllowRoot" в файле конфигурации сервера.

    Если Zabbix сервер и агент работают на одном сервере, то рекомендуется использовать разных пользователей для запуска сервера и для запуска агента. В противном случае, если сервер и агент запущены под одним пользователем, агент будет иметь доступ к файлу конфигурации сервера и любой пользователь с правами Администратора в Zabbix может с легкостью получить, например, пароль от базы данных.

    Файл конфигурации
    Скрипты запуска

    Скрипты используются для автоматического запуска/остановки процессов Zabbix при включении/выключении системы. Скрипты находятся в директории misc/init.d.

    Поддерживаемые платформы

    В связи с требованиями безопасности и критически важного характера работы сервера, UNIX является единственной операционной системой, которая может обеспечить необходимую производительность, отказоустойчивость и гибкость. Zabbix работает с ведущими на рынке версиями операционных систем.

    Zabbix сервер протестирован на следующих платформах:

    Также Zabbix может работать и на других Unix-подобных операционных системах.

    Региональные настройки (локаль)

    Обратите внимание, что сервер требует UTF-8 локаль, чтобы некоторые текстовые элементы данных интерпретировались корректно. Большинство современных Unix-подобных систем уже имеют локаль UTF-8 по умолчанию, тем не менее, есть некоторые системы где это необходимо указывать вручную.

    1-го октября 2018 года вышла новая версия бесплатной системы мониторинга, которую я постоянно использую. Я подробно расскажу об установке и начальной настройке Zabbix 4.0 на примере систем CentOS, Debian, Ubuntu со скриншотами и пояснениями. В этой версии много интересных и полезных нововведений, так что посмотреть на неё однозначно стоит.

    На сегодняшний день, по моему мнению, из бесплатных систем мониторинга именно Zabbix самая популярная и функциональная. Упоминания о ней я постоянно встречаю в технических статьях специалистов различного масштаба и организаций. К примеру, СберТех использует Zabbix как единую платформу мониторинга. ИТ отдел сети магазинов Магнит так же использует zabbix как основную систему мониторинга. Пару лет назад я смотрел выступление представителя ИТ отдела Магнита, где он подробно описывал структуру системы. На тот момент это была самая крупная инсталляция заббикса с тысячами прокси серверов для сбора данных из магазинов по всей стране. Упоминания о мониторинге заббикс я встречал у специалистов компаний 1С, Крок, Яндекс.Деньги и других. Перечислил только то, что запомнилось.

    Нужно понимать, что Zabbix — система мониторинга общего назначения. У нее нет специализации в микросервисы, сеть, железо и т.д. В связи с этим, всегда может найтись инструмент, который сможет выполнять ту или иную задачу удобнее и эффективнее, чем zabbix. Но это не умоляет остальных достоинств системы. Я их вижу в первую очередь в том, что в ней можно настроить мониторинг всего, что угодно. Главное научиться подавать значения в систему. А для этого есть масса инструментов — как самих агентов, так и скриптов, которые можно подключать к сбору данных.

    Система мониторинга Zabbix позволяет так или иначе завести на нее все обслуживаемые сервисы. Где-то это может быть не очень просто, но в любом случае, один универсальный инструмент удобнее, чем несколько. Мне всегда удавалось настроить желаемый мониторинг с помощью заббикса. Если не было готовых шаблонов или подходящих агентов для сбора, писал скрипты и передавал ими данные агенту. С моими (и не только) решениями по мониторингу можете познакомиться в отдельном разделе .

    Чем меня еще подкупает zabbix — хорошая документация и большое комьюнити. Много выступлений от различных специалистов с описанием внедрений. Все это облегчает работу с системой. Проще принять решение как поступить в той или иной ситуации. Сами разработчики постоянно проводят встречи, приглашают выступающих, потом выкладывают видео. В общем, система со всех сторон оставляет благоприятное впечатление.

    Я буду устанавливать и настраивать работу сервера zabbix на nginx, что несколько отличается от дефолтной установки, которая включает в себя веб сервер apache. В связи с этим, нам необходимо будет подготовиться.

    Подготовка сервера CentOS к установке

    Первым делом вам необходимо и сервер CentOS 7. Перед установкой сервера Zabbix нам также нужно подготовить Web сервер. У меня есть отдельная статья по . Там все подробно описано. Сейчас же я кратко и без лишних комментариев выполню минимум необходимых действий для работы заббикса. Так же я не буду останавливаться на . Эта отдельная тема и мне не хочется ее касаться в этой статье. Либо настройте сами по моим инструкциям, либо просто отключите firewall:

    # systemctl stop firewalld # systemctl disable firewalld

    Подключаем репозиторий nginx и устанавливаем его:

    # rpm -Uvh http://nginx.org/packages/centos/7/noarch/RPMS/nginx-release-centos-7-0.el7.ngx.noarch.rpm # yum install nginx

    Запускаем nginx и добавляем в автозагрузку.

    Проверяем, работает ли он. Для этого открываем в браузере ссылку http://192.168.13.117/, где 192.168.13.117 — ip адрес настраиваемого сервера.

    Если у вас не работает nginx, разберитесь с ним, прежде чем двигаться дальше. В первую очередь проверьте настройки фаервола.

    # yum install epel-release # rpm -Uhv http://rpms.remirepo.net/enterprise/remi-release-7.rpm

    Активируем репу remi-php71, для этого выполняем команды:

    # yum install yum-utils # yum-config-manager --enable remi-php71

    Устанавливаем php 7.1 и модули к нему.

    # yum install php71 php-fpm php-cli php-mysql php-gd php-ldap php-odbc php-pdo php-pecl-memcache php-pear php-xml php-xmlrpc php-mbstring php-snmp php-soap php-bcmath

    Запускаем php-fpm и добавляем в автозагрузку.

    # systemctl start php-fpm # systemctl enable php-fpm

    Проверяем, запустился ли он.

    # netstat -tulpn | grep php-fpm tcp 0 0 127.0.0.1:9000 0.0.0.0:* LISTEN 13261/php-fpm: mast

    Все в порядке, запустился на порту 9000. Запустим его через unix сокет. Для этого открываем конфиг /etc/php-fpm.d/www.conf и комментируем строку:

    # mcedit /etc/php-fpm.d/www.conf ;listen = 127.0.0.1:9000

    Вместо нее добавляем несколько других:

    Listen = /var/run/php-fpm/php-fpm.sock listen.mode = 0660 listen.owner = nginx listen.group = nginx

    Заодно измените пользователя, от которого будет работать php-fpm. Вместо apache укажите nginx, отредактировав соответствующие параметры.

    User = nginx group = nginx

    Перезапускаем php-fpm.

    # systemctl restart php-fpm

    Проверяем, стартовал ли указанный сокет.

    # ll /var/run/php-fpm/php-fpm.sock srw-rw----. 1 nginx nginx 0 Oct 4 15:08 /var/run/php-fpm/php-fpm.sock

    На текущий момент с настройкой php-fpm закончили. Продолжаем подготовку сервера к установке zabbix.

    Устанавливаем свежую версию MariaDB. Подключаем репозиторий. Для этого создаем файл /etc/yum.repos.d/mariadb.repo следующего содержания.

    # mcedit /etc/yum.repos.d/mariadb.repo # MariaDB 10.3 CentOS repository list - created 2018-10-04 12:10 UTC # http://downloads.mariadb.org/mariadb/repositories/ name = MariaDB baseurl = http://yum.mariadb.org/10.3/centos7-amd64 gpgkey=https://yum.mariadb.org/RPM-GPG-KEY-MariaDB gpgcheck=1

    Устанавливаем последнюю версию mariadb на centos.

    # yum install MariaDB-server MariaDB-client

    Запускаем mariadb и добавляем в автозагрузку.

    # systemctl start mariadb # systemctl enable mariadb

    Внесем некоторые изменения в стандартный конфиг mariadb, чтобы потом не заниматься . Для этого открываем конфиг mysql /etc/my.cnf.d/server.cnf и приводим его к следующему виду.

    # mcedit /etc/my.cnf.d/server.cnf port = 3306 socket = /var/lib/mysql/mysql.sock default-character-set=utf8 character_set_server=utf8 collation-server=utf8_bin init_connect="SET NAMES utf8 collate utf8_bin" port = 3306 socket = /var/lib/mysql/mysql.sock innodb_file_per_table=1 innodb_buffer_pool_size = 768M # внимание на параметр! установить примерно в 2 раза меньше объема оперативной памяти сервера innodb_buffer_pool_instances=1 # увеличивать на 1 каждый GB innodb_buffer_pool_size innodb_flush_log_at_trx_commit = 0 innodb_log_file_size = 512M innodb_log_files_in_group = 3

    Я добавил минимум настроек, отличных от дефолта. В статье про оптимизацию mysql их приведено гораздо больше, но со временем я понял, что зря это сделал. Реально у меня нет большого опыта в тонкой настройке mysql. Никаких тестов и проверок я не делал, а данные брал на основе других статей в интернете. Не факт, что там не было ошибок. В итоге сейчас тут только заданы некоторые важные параметры по innodb, в частности указание хранить каждую таблицу в отдельном файле, задан размер и количество бинарных логов и еще пару настроек, которые явно будут к месту (innodb_buffer_pool_size, innodb_buffer_pool_instances и innodb_flush_log_at_trx_commit). При желании, вы можете сами заняться тюнингом mysql. В общем случае, достаточно будет текущих настроек.

    # systemctl restart mariadb # systemctl status mariadb.service

    Сервер баз данных mysql для нашего zabbix сервера готов. На этом предварительные настройки сервера закончены. Приступаем к установке.

    Установка сервера Zabbix 4.0 в CentOS

    Для того, чтобы установить Zabbix Server 4.0 нужно подключить репозиторий актуальной версии.

    # rpm -Uvh https://repo.zabbix.com/zabbix/4.0/rhel/7/x86_64/zabbix-release-4.0-1.el7.noarch.rpm Retrieving https://repo.zabbix.com/zabbix/4.0/rhel/7/x86_64/zabbix-release-4.0-1.el7.noarch.rpm warning: /var/tmp/rpm-tmp.fCWryx: Header V4 RSA/SHA512 Signature, key ID a14fe591: NOKEY Preparing... ################################# Updating / installing... 1:zabbix-release-4.0-1.el7 #################################

    Устанавливаем сам сервер заббикса.

    # yum install zabbix-server-mysql zabbix-web-mysql

    В зависимостях пакетов будет httpd, который нам не нужен, так как у нас будет nginx и php7.1, но я не разбирался, как поставить без него. После установки пакетов, создадим базу данных, пользователя zabbix и заполним базу.

    # mysql -uroot -p Enter password: > create database zabbix character set utf8 collate utf8_bin; > grant all privileges on zabbix.* to zabbix@localhost identified by "zabpassword"; exit # zcat /usr/share/doc/zabbix-server-mysql*/create.sql.gz | mysql -uzabbix -p zabbix

    Этих минимальных настроек достаточно, для работы сервера. Я рекомендую увеличивать параметр Timeout , так как он отвечает за время ожидания ответа от агента, snmp устройства или внешней проверки. Иногда стандартного значения в 4 секунды бывает недостаточно. В частности, когда используется какой-то скрипт, который долго выполняется для получения метрики. Поставьте секунд 10.

    Проверяем лог файл на наличие ошибок.

    # cat /var/log/zabbix/zabbix_server.log

    Настройка SELinux с zabbix

    Если у вас включен SELinux, получите ошибку.

    Cannot start preprocessing service: Cannot bind socket to "/var/run/zabbix/zabbix_server_preprocessing.sock": Permission denied.

    Это нормально, сейчас настроим SELinux для нормальной работы Zabbix. Для этого устанавливаем пакет policycoreutils-python, скачиваем готовый модуль для SELinux и применяем его.

    # yum install policycoreutils-python # cd ~ # curl https://support.zabbix.com/secure/attachment/53320/zabbix_server_add.te > zabbix_server_add.te # checkmodule -M -m -o zabbix_server_add.mod zabbix_server_add.te # semodule_package -m zabbix_server_add.mod -o zabbix_server_add.pp # semodule -i zabbix_server_add.pp

    Теперь нам надо перезапустить zabbix-server.

    # systemctl restart zabbix-server

    Если у вас это не получится сделать через systemctl, значит служба зависла. Завершаем ее принудительно и запускаем снова.

    # kill -9 `pidof zabbix_server` # systemctl start zabbix-server

    Снова проверяйте log файл. Теперь ошибок быть не должно. Как я уже сказал, если у вас отключен SELinux, то делать описанные выше манипуляции с модулем не надо.

    С серверной частью закончили. Нам нужно сделать конфиг nginx для работы web интерфейса zabbix. Если у вас nginx работает на том же сервере, где сам zabbix, и других виртуальных хостов нет и не будет, то правьте сразу дефолтный — /etc/nginx/conf.d/default.conf

    # mcedit /etc/nginx/conf.d/default.conf server { listen 80; server_name localhost; root /usr/share/zabbix; location / { index index.php index.html index.htm; } location ~ \.php$ { fastcgi_pass unix:/var/run/php-fpm/php-fpm.sock; fastcgi_index index.php; fastcgi_param SCRIPT_FILENAME $document_root$fastcgi_script_name; include fastcgi_params; fastcgi_param PHP_VALUE " max_execution_time = 300 memory_limit = 128M post_max_size = 16M upload_max_filesize = 2M max_input_time = 300 date.timezone = Europe/Moscow always_populate_raw_post_data = -1 "; fastcgi_buffers 8 256k; fastcgi_buffer_size 128k; fastcgi_intercept_errors on; fastcgi_busy_buffers_size 256k; fastcgi_temp_file_write_size 256k; } }

    Маленький, но важный нюанс. Нам надо изменить права доступа на некоторые папки. Назначить владельца nginx.

    # chown -R nginx:nginx /var/lib/php/session # chown -R nginx:nginx /etc/zabbix/web

    Этот шаг нужно будет проделывать после каждого обновления php или zabbix. Связано с тем, что по-умолчанию zabbix идет в комплекте с apache и рассчитан на работу с ним. Поэтому после установки или обновления, он делает его владельцем директории /etc/zabbix/web .

    Даем разрешения SELinux для работы заббикса с web сервером и базой данных.

    # setsebool -P httpd_can_connect_zabbix on # setsebool -P httpd_can_network_connect_db on

    Я не знаю, насколько последняя настройка актуальна, если подключение к БД локальное. У разработчиков в инструкции сказано, что в случае с postgresql даже если подключаетесь через 127.0.0.1, разрешение выдавать нужно. Насчет mysql нет комментариев.

    С серверной частью закончили. Для продолжения установки zabbix сервера переходим к .

    Установка сервера Zabbix 4.0 в Ubuntu, Debian

    С установкой Zabbix на сервер с Ubuntu или Debian попроще, так как в стандартных репозиториях посвежее версии софта, можно использовать их. Подключаем репозитории zabbix 4.0.

    # wget https://repo.zabbix.com/zabbix/4.0/ubuntu/pool/main/z/zabbix-release/zabbix-release_4.0-2+bionic_all.deb # dpkg -i zabbix-release_4.0-2+bionic_all.deb

    # wget https://repo.zabbix.com/zabbix/4.0/debian/pool/main/z/zabbix-release/zabbix-release_4.0-2+stretch_all.deb # dpkg -i zabbix-release_4.0-2+stretch_all.deb

    Если у вас другие версии систем, то простой найдите ссылки пакетов под свою версию в официальном репозитории - https://repo.zabbix.com/zabbix/4.0/ Дальнейшая установка не будет отличаться от текущей.

    Обновляем информацию о репозиториях, а заодно и последние обновления поставим:

    # apt update && apt upgrade

    Устанавливаем zabbix сервер:

    # apt install zabbix-server-mysql zabbix-frontend-php

    Он по-умолчанию ставится с apache, который сразу же запускается. Остановим его и отключим:

    # systemctl stop apache2 # systemctl disable apache2

    Ставим отдельно nginx и php-fpm:

    # apt install nginx php-fpm

    Запускаем скрипт начальной конфигурации mysql и задаем пароль для root. Все остальное можно оставить по-умолчанию.

    # /usr/bin/mysql_secure_installation

    Отредактируем некоторые параметры Mariadb в конфиге /etc/mysql/mariadb.conf.d/50-server.cnf . Добавляем туда в секцию :

    # mcedit /etc/mysql/mariadb.conf.d/50-server.cnf innodb_file_per_table=1 innodb_buffer_pool_size = 768M # внимание на параметр! установить примерно в 2 раза меньше объема оперативной памяти сервера innodb_buffer_pool_instances=1 # увеличивать на 1 каждый GB innodb_buffer_pool_size innodb_flush_log_at_trx_commit = 0 innodb_log_file_size = 512M innodb_log_files_in_group = 3

    Перезапустите mariadb и убедитесь, что она запустилась.

    # systemctl restart mariadb # netstat -tulnp | grep mysqld tcp 0 0 127.0.0.1:3306 0.0.0.0:* LISTEN 16753/mysqld

    Cоздадим базу данных, пользователя zabbix, и заполним базу.

    # mysql -uroot -p Enter password: > create database zabbix character set utf8 collate utf8_bin; > grant all privileges on zabbix.* to zabbix@localhost identified by "zabpassword"; exit # zcat /usr/share/doc/zabbix-server-mysql/create.sql.gz | mysql -uzabbix -p zabbix

    Теперь редактируем файл конфигурации сервера заббикс. Прописываем данные для подключения к БД, отключаем ipv6 и увеличиваем стандартный timeout.

    # mcedit /etc/zabbix/zabbix_server.conf

    Изменяем указанные строки, остальные не трогаем:

    DBHost=localhost DBName=zabbix DBUser=zabbix DBPassword=zabpassword ListenIP=0.0.0.0 Timeout=10

    Этих минимальных настроек достаточно, для работы сервера. Я рекомендую увеличивать параметр Timeout, так как он отвечает за время ожидания ответа от агента, snmp устройства или внешней проверки. Иногда стандартного значения в 4 секунды бывает недостаточно. В частности, когда используется какой-то скрипт, который долго выполняется, для получения метрики. Поставьте секунд 10.

    Запускаем zabbix и добавляем в автозагрузку.

    # systemctl start zabbix-server # systemctl enable zabbix-server

    Проверяем запустился ли.

    # netstat -tulnp | grep zabbix_server tcp 0 0 0.0.0.0:10051 0.0.0.0:* LISTEN 16847/zabbix_server

    Все в порядке. Запускаем nginx, который у нас будет выступать в качестве web сервера.

    # systemctl start nginx # systemctl enable nginx

    Убедимся, что в качестве web сервера работает nginx.

    # netstat -tulnp | grep 80 tcp 0 0 0.0.0.0:80 0.0.0.0:* LISTEN 17075/nginx: master tcp6 0 0:::80:::* LISTEN 17075/nginx: master

    Нам нужно сделать конфиг nginx для работы web интерфейса zabbix. Если у вас nginx работает на том же сервере, где сам zabbix, и других виртуальных хостов нет и не будет, то правьте сразу дефолтный - /etc/nginx/sites-available/default . Приводим его к следующему виду:

    # mcedit /etc/nginx/sites-available/default server { listen 80; server_name localhost; root /usr/share/zabbix; location / { index index.php index.html index.htm; } location ~ \.php$ { fastcgi_pass unix:/run/php/php7.2-fpm.sock ; # проверьте этот путь, для разных версий php он будет разный fastcgi_index index.php; fastcgi_param SCRIPT_FILENAME $document_root$fastcgi_script_name; include fastcgi_params; fastcgi_param PHP_VALUE " max_execution_time = 300 memory_limit = 128M post_max_size = 16M upload_max_filesize = 2M max_input_time = 300 date.timezone = Europe/Moscow always_populate_raw_post_data = -1 "; fastcgi_buffers 8 256k; fastcgi_buffer_size 128k; fastcgi_intercept_errors on; fastcgi_busy_buffers_size 256k; fastcgi_temp_file_write_size 256k; } }

    Проверим конфиг на ошибки и если все в порядке, перезапустим nginx.

    # nginx -t nginx: the configuration file /etc/nginx/nginx.conf syntax is ok nginx: configuration file /etc/nginx/nginx.conf test is successful # nginx -s reload

    С серверной частью закончили. Для продолжения установки zabbix сервера переходим к настройке Zabbix Frontend.

    Настройка Zabbix Frontend

    Идем в браузер и открываем адрес http://192.168.13.117. Вы должны увидеть установщик Zabbix 4.0.

    Нажимаем Next step и начинаем настройку web интерфейса. На следующей странице будет проверка требований. У вас должны быть выполнены все требования. В зависимости от системы и версии php, информация будет в каждом случае разниться.

    На следующем этапе указываем параметры доступа к базе данных, потом Zabbix server details. Там можно ничего не указывать, а оставить дефолтные параметры. Потом будет страница с проверкой введенных данных. Если все в порядке, то заканчивайте установку. В конце увидите сообщение: Congratulations! You have successfully installed Zabbix frontend.

    После нажатия на Finish увидите окно авторизации Zabbix сервера.

    Стандартная учетная запись для входа в web интерфейс zabbix следующая:

    • Пользователь Admin
    • Пароль zabbix

    После логина увидите стандартный dashboard.

    На этом установка бесплатного сервера мониторинга zabbix окончена. Можно приступать к настройке.

    Настройка Zabbix Server

    Создание учетной записи и смена пароля

    Первое, что нужно сделать — сменить стандартные учетные данные для входа. Можно просто поменять пароль пользователя admin, но лучше создать новую учетную запись с правами суперпользователя, а админа удалить. Для этого идем в раздел Administration -> Users и нажимаем Create User .

    Заполняем все необходимые поля. Можно выбрать русский язык. Обычно я стараюсь работать в английском, но в случае с заббиксом можно сделать исключение. Он очень качественно локализован и проблем не возникает. Не забудьте зайти во вкладку Permissions и выбрать User type — Zabbix Super Admin.

    Теперь можно зайти под новым пользователем, а Admin удалить. Но система не даст его удалить, так как он является владельцем некоторых объектов:

    • карты сети — Local Network
    • комплексного экрана Zabbix server
    • панелей Global view и Zabbix server health

    Они создаются автоматически при установке заббикса. Вам нужно сменить у них владельца на нового пользователя. После этого стандартного админа можно будет удалить.

    Настройка email оповещений

    Дальше нужно настроить очень важную часть системы мониторинга — уведомления на email. Без нее система мониторинга не выглядит целостной и полноценной. Zabbix сервер поддерживает отправку почты через сторонние smtp серверы. Настроим один из них. Для этого идем в раздел Администрирование -> Способы оповещений и нажимаем на Email .

    Покажу на примере настроек ящика в Яндексе.

    Это мы настроили адрес отправки. Теперь нужно пользователю добавить адрес для получения оповещений. Для этого идем в Администрирование -> Пользователи , выбираем своего пользователя. Идем во вкладку Оповещения и жмем Добавить . Добавляйте свой ящик и нажимайте Обновить .

    Зайдите еще раз в учетную запись и убедитесь, что ящик добавили.

    Все, отправку уведомлений мы настроили, осталось подождать срабатывания триггера, чтобы проверить. Сделаем это позже, когда подключим хост к мониторингу.

    Я вношу следующие изменения. Меняю шаблон темы письма при проблеме и восстановлении. В стандартном шаблоне в теме письма нет информации об имени хоста. В некоторых шаблонах триггера указано имя хоста, но есть и такие, где нет этой информации. В итоге в оповещении сразу не видно, о каком хосте идет речь. В моем же шаблоне сразу в теме будет указано имя хоста далее статус, а потом все остальное. Вот пример старого и нового оповещения:

    Мне мой вид кажется более наглядным. Шаблон меняет на следующий:

    {HOST.NAME} - {TRIGGER.STATUS}: {TRIGGER.NAME}

    Он одинаковый и для проблемы, и для восстановления.

    Изменение стандартных шаблонов мониторинга

    На своих серверах мониторинга я изменяю некоторые параметры стандартных шаблонов, чтобы было меньше бесполезных и неинформативных срабатываний. Вот список того, что я делаю.

    1. В шаблоне Template App Zabbix Agent отключаю триггер Version of zabbix_agent(d) was changed on {HOST.NAME} . Если его оставить, то после каждого обновления zabbix агента вы будете получать уведомление. Лично мне эта информация не нужна.
    2. В шаблоне Template OS Linux меняю в триггере Disk I/O is overloaded on {HOST.NAME} значение со стандартных 20% до 50%. Я считаю, что начинать беспокоиться и смотреть на машину надо при этом значении. Но вы можете подобрать под свои нужды.
    3. В этом же шаблоне в правиле обнаружения Mounted filesystem discovery добавляю еще один прототип триггера, скопировав Free disk space is less than 20% on volume {#FSNAME} . Новый шаблон полностью идентичен скопированному, только вместо 20% указываю 5% и ставлю важность с «Предупреждение» на «Высокая». Я добавляю еще одно оповещение, если свободного места на дисках остается меньше 5%. Стандартные 20% очень высокий порог, особенно если большой диск. Оперативное решение проблемы не требуется. Из-за этого часто откладываешь чистку диска на потом и забываешь о ней. Теперь будет еще один страховочный триггер, после которого точно надо идти и прямо сейчас разбираться с местом. В триггере на 20% свободного места ставлю разрешение на закрытие триггера вручную.
    4. В этом же шаблоне в триггере Lack of free swap space on {HOST.NAME} меняю порог срабатывания с 50% до 20%, либо вообще отключаю его. Сейчас много серверов работают без swap. Хотя лично я всегда его создаю и подключаю.
    5. В шаблоне Template OS Windows отключаю Правило обнаружения Windows service discovery . В дефолтном варианте оно генерирует очень много ненужных итемов и оповещений. Если нужен мониторинг какой-то службы windows, я делаю для этого отдельный шаблон.

    Общие настройки

    В общих настройках zabbix server, которые располагаются в разделе Администрирование -> Общие я меняю следующие параметры:

    1. В разделе Рабочее время выставляю актуальные рабочие часы.
    2. В разделе Опции отображения триггеров меняю значения Отображать триггеры в состоянии ОК в течении и Мигание триггеров при изменении состояния на 1 минуту. Это просто мои предпочтения. Мне не нравится, когда триггеры долго мигают, либо висят уже закрытые.
    3. В разделе Прочее меняю Обновление неподдерживаемых элементов данных на 1 минуту. Это актуально во время отладки новых шаблонов.

    Установка Zabbix Agent на Linux

    Если вы хотите установить zabbix-agent на сам сервер мониторинга, то ничего делать не надо, кроме самой установки. Для других систем необходимо подключить репозитории заббикса, которые мы использовали во время установки сервера. Можете посмотреть их в соответствующих разделах для своей системы.

    Установка zabbix agent в Centos:

    # yum install zabbix-agent

    Тоже самое в Ubuntu/Debian:

    # apt install zabbix-agent

    Для работы с сервером, который установлен локально на этой же машине, больше никаких настроек не надо делать. Если же вы будете устанавливать zabbix agent на другую машину, то в файле конфигурации агента /etc/zabbix/zabbix_agentd.conf нужно будет задать следующие параметры:

    # mcedit /etc/zabbix/zabbix_agentd.conf Server=192.168.13.117 ServerActive=192.168.13.117 Hostname=srv10 # имя вашего узла мониторинга, которое будет указано на сервере zabbix, Zabbix server если это сам сервер заббикса

    Запускаем агент и добавляем в автозагрузку:

    # systemctl start zabbix-agent # systemctl enable zabbix-agent

    Проверяем лог файл.

    # cat /var/log/zabbix/zabbix_agentd.log 14154:20181004:201307.800 Starting Zabbix Agent . Zabbix 4.0.0 (revision 85308). 14154:20181004:201307.800 **** Enabled features **** 14154:20181004:201307.800 IPv6 support: YES 14154:20181004:201307.800 TLS support: YES 14154:20181004:201307.800 ************************** 14154:20181004:201307.800 using configuration file: /etc/zabbix/zabbix_agentd.conf 14154:20181004:201307.800 agent #0 started 14157:20181004:201307.801 agent #3 started 14159:20181004:201307.802 agent #5 started 14155:20181004:201307.804 agent #1 started 14158:20181004:201307.806 agent #4 started 14156:20181004:201307.810 agent #2 started

    Все в порядке. Идем в веб интерфейс и проверяем поступление данных. Для этого идем в раздел Мониторинг -> Последние данные . Указываем в разделе Узлы сети Zabbix Server и ждем поступления первых данных. Они должны пойти через 2-3 минуты после запуска агента.

    Теперь попробуем остановить агент и проверить, придет ли уведомление на почту. Идем в консоль и выключаем агента:

    # systemctl stop zabbix-agent

    Ждем минимум 5 минут. Именно такой интервал указан по-умолчанию для срабатывания триггера на недоступность агента. После этого проверяем главную панель, виджет Проблемы .