Сразу оговорюсь, что все ниже написанное - мое, сугубо личное мнение, описывающее мой личный опыт и выводы, полученные в процессе работы.
Есть поговорка :"Хороший админ - ничего не делающий админ". И это верно! У хорошего администратора все и всегда под контролем, неожиданности для него - крайняя редкость. Но чтобы этого добиться, сначала нужно немного потрудиться... но награда за это велика - куча свободного времени и довольные клиенты или работодатель.
Каждый системный администратор должен знать, на сколько важны системы мониторинга и на сколько они полезны, если их правильно использовать. Особенно если под вашим руководством не один десяток серверов, роутеров и другого сетевого оборудования.
Существует множество программных продуктов, позволяющих осуществлять мониторинг сети, в том числе платные и бесплатные. Остановимся на бесплатных. Хочу сразу предупредить (как бы грустно это не звучало), что идеала - нет... У каждой программы есть свои достоинства и недостатки, поэтому зачастую приходится использовать несколько программ.
Рассмотрим наиболее распространенные системы мониторинга:
ZABBIX - свободная система мониторинга компьютерной сети, серверов и сетевого оборудования. На мой взгляд одна из лучших программ для мониторинга. Огромная функциональность(за частую не используется даже 60% возможностей). Сложна в первоначальной настройке и понимании принципов действия. Однако разобравшись, позволяет ставить на мониторинг оборудование, почти одним кликом мыши. Отлично реализованы способы оповещения(Email, Jabber и даже по sms). Имеет Web-интерфейс, поддерживает SNMP, внешние пробы типа ping, различные проверки. Так же есть отличная функция для хостинг-провайдера - можно создавать сценарии слежения за Web-сайтами. Эти сценарии подражают работе обычного пользователя. Zabbix может зайти на нужную страницу, залогиниться на сайт, при этом на графике можно видеть время загрузки и кол-во трафика при выполнении этих действий. Возможно масштабировать систему, путем установки нескольких серверов, отвечающих за определенный сегмент сети. В результате данные будут обрабатываться на нескольких серверах, а отображаться в одной центральной точке.
Из плюсов отмечу:
- отличная функциональность;
- возможность масштабирования;
- удобная система оповещений;
- возможность нарисовать карту сети;
- есть агенты под windows;
- возможность подключения скриптов.
- сложность первоначальной настройки;
- не очень хорошая стабильность;
- мониторит меньшее количество узлов чем конкуренты.
Nagios - программа мониторинга компьютерных систем и сетей с открытым кодом. Предназначена для наблюдения, контроля состояния вычислительных узлов и служб, оповещает администратора в том случае, если какие-то из служб прекращают (или возобновляют) свою работу.
Довольно старая система мониторинга, интерфейс не удобен и мало информативен. Отчеты почти никакие. В стандартном наборе нет графиков, что очень не удобно, т.к. зачастую надо наблюдать загруженность канала или CPU. Можно поправить различными плагинами, но на мой взгляд это тоже не очень удобно и нудно.
Из плюсов могу отметить что довольно стабильная система, которая железно делает свою функцию - мониторит различные сервисы(тот же zabbix).
Плюсы:
- стабильная и простая система;
- большой набор плагинов;
- мониторит тысячи хостов и десятки тысяч сервисов на одном Nagios-сервере.
- древний интерфейс;
- нельзя добавлять графики.
Cacti - open-source веб-приложение, система позволяет строить графики при помощи RRDTool. Cacti собирает статистические данные за определенные временные интервалы и позволяет отобразить их в графическом виде. Преимущественно используются стандартные шаблоны для отображения статистики по загрузке процессора, выделению оперативной памяти, количеству запущенных процессов, использованию входящего/исходящего трафика.
В простонародье - Кактус. Поддерживает SNMP, удобно группируются графики (возможно указывать временной интервал). На мой взгляд это отличная замена MRTG. Так же возможно подключать свои скрипты для обработки снятых данных, которые затем можно визуализировать.
Из плюсов:
- удобный, современный веб-интерфейс;
- красивые, информативные графики;
- возможность подключения скриптов.
- сложен в первоначальной настройке;
- служит только для визуализации.
Monit - демон, который наблюдает за сервисами и в случае необходимости их перезапускает. К примеру на одном из серверов у нас стоит zabbix-agent и если он вдруг подвисает или перестает работать то monit тут же его перезапускает. Администратор даже не заметит этого и будет продолжать заниматься своими делами. В зависимости от настроек, демон может проверять:
- существование процесса по PID;
- ресурсы занимаемые процессом;
- работу определенного порта(TCP/UDP);
- ответ протокола по определенному порту(SMTP,SSH,HTTP...);
- объем и свободное пространство в файловой системе;
- права доступа к файлу или каталогу.
- комбинация методов проверки;
- оповещение по email;
- поддерживает внешние скрипты;
- имеет веб-интерфейс.
Итог.
Если ваша сеть содержит менее 2-3 тысяч узлов, то смело используйте zabbix, он универсален и его возможностей вполне хватит для комплексного анализа и контроля сети. Ну и в дополнение добавьте monit.
Если же вы администратор огромной сети или необходимо мониторить множество сервисов, то делайте выбор в сторону nagios+cacti. Хотя zabbix тоже можно масштабировать как это описано выше.
Опять же повторюсь, это только мое субъективное мнение, основанное на моем собственном опыте.
В нагиосе МОЖНО добавить графики - причем очень хорошие - плагин pnp
ОтветитьУдалитьИ вообще вы очень сильно не до оцениваете нагиос, он также может работать с snmp, скрипты лично сам пишу под то что нужно, карту рисует(даже две :)), может и больше, не смотрел), оповещение по любому протоколу(mail, sms, jabber, ... и все что в вашу голову придет и сможете написать скрипт), в общем в нагиосе с помощью внешних скриптов можно использовать все возможности unix систем. Но самое главное и вкусное, что нагиос очень легко и удобно конфигурить через nconf(веб морда) - справиться любой ))).
ОтветитьУдалитьсейчас у меня 170 чеков(хосты и сервисы) каждые 3-5 мин - даже не заикается, с отличными графиками от RRDTool.
ЗЫ. забикс, по моему мнению - слишком монстроидален, не гибок, тяжелый. нет простоты, что-ли.
в том то и дело, что для норальной работы нагиоса надо подключать кучу модулей и дописывать кучу скриптов. заббикс все это имеет из коробки! и вы так же можете использовать там скрипты(и все возможности unix) для каких-то экзотических вещей.
ОтветитьУдалитьзаббикс очень гибок. так же отличная возможность масштабирования. а когда овладеете шаблонами, то мониторинг узлов вообще одно удовольствие
ОтветитьУдалитьу меня сейчас на мониторинге 400 узлов и 900 с лишним элементов данных, треть из них обновляется с интервалом 5-30 секунд... и даже не заикается)
сервак самый обычный, 2Гб оперативы и одноядерный проц. судя по потреблению оперативной памяти, запас еще большой)
Ни в коем случае я не хочу принижать возможности забикса, я всего лишь говорю что нагиос достаточно сильная платформа мониторинга которая не уступает по возможностям всем остальным системам. По моему мнению, единственное что отталкивает от использования нагиоса, это его конфигурационные файлы(точнее сложность в его настройки). Забикс, в свою очередь, "из коробки" дает "красивые картинки". Все это мелочи.
ОтветитьУдалитьМогу поделиться частным случаем в моей практике, так, для сравнения, как это бывает. У меня на предприятии "ентузазисты" воодушевленные идеей мониторинга перемацали все системы, проводили исследования, сравнивали, поднимали, запускали, в общем подходили серьезно к этому вопросу. Остановились на забиксе (картинки понравились, все из коробки, все через интерфейс, в общем конфетка). Проработал он 4 месяца а потом надоело им его реанимировать. Бывает такое. я со своим нагиосом стоял в сторонке и ждал чем это все закончится. За 7 лет работы нагиоса не одного сбоя. Сейчас подумываю над тем, что бы обновить нагиос, написать новые чеки, в общем усилить мониторинг.
На самом деле, каждому свое, я всего лишь поделился своим опытом, и узнал опыт других(про забикс и его нагрузки). Спасибо.
По поводу стабильности полностью согласен, предыдущие версии zabbix были очень не стабильны. Автор в принципе это указал в минусах заббикса. Но последние версии вполне нормально функционируют, к примеру у меня, за пол года не было ни одного сбоя или что-то похожего на это(использую версию 1.8.6). Проект продолжает развиваться, скоро намечен релиз 2.0 если не ошибаюсь.
ОтветитьУдалитьКстати по поводу нагрузок. Мой знакомый использует у себя в фирме заббикс, мониторят около 3000 устройств по 9 интерфейсов, 3 устройства по 250 интерфейсов, и еще по мелоче. Сервер обычный, 4х ядерный проц, 4Гб оперативки и рэйд на 2Тб(база данных большая). Правда говорят что ресурсы подходят к концу, собираются делать сервак помощнее
А что думаете о Zenoss?
ОтветитьУдалитьК сожалению никогда не пробовал и ничего сказать не могу... но слышал что серьезная система.
ОтветитьУдалитьУзнал еще про системы Pandora FMS, NetXMS и FreeNATS, но про них очень мало информации в рунете. Кто нибудь может про них что нибудь рассказать? Какое колл-во узлов они могут мониторить?
ОтветитьУдалить