[возможности Nagios]материал подготовил: А. В. Кириллов 13.12.2005
Наверное, любому сетевому администратору знакома ситуация, когда задачи идут одна за другой, а на их решение не выделяется никаких других ресурсов, кроме уже доступных. И чаще всего в небольшой организации эти самые ресурсы — сам администратор и его рабочее время. Таким образом, очень часто случается ситуация вроде той, когда излишняя нагрузка со стороны одного из отделов приводит к перегрузке корпоративного почтового сервера. Администратор может узнать про все последним, после нескольких дней бездействия ресурса, когда разбирательства уже идут на уровне шефа организации.
Как избежать подобной ситуации? Конечно, можно приходить утром и, как один мой старый знакомый, проверять доступность веб-сервера своей организации, смотреть на остаток места на разделе диска, в котором хранится почтовая база его организации, смотреть, не попал ли IP-адрес этого самого гейта в CBL-лист и ему подобные системы для борьбы со спамом. Конечно, приведенный список задач далеко не полный. У каждого системного администратора их намного больше. И если учесть, что информационные структуры некоторых коммерческих организаций имеют тенденцию к росту, то даже непосвященному сразу станет понятно, как важна нормально работающая система раннего оповещения для административного персонала ИТ-отдела. Согласитесь, ведь гораздо приятнее иметь возможность получения сообщений, например, на ваш мобильный телефон вместо ручного мониторинга множества сервисов.
Nagios позволяет отследить разнообразные отказы сетевых сервисов, будь то отсутствие активности вашего SMTP- или POP-сервера, отказы веб-сервера или неполадки на какой-либо из рабочих станций в вашей сети. С помощью механизмов удаленного запуска тестовых процедур вы можете контролировать свободное место и другие критичные для работоспособности параметры вверенных вам вычислительных ресурсов. Возможности этой системы расширяемы и достаточно масштабируемы. Ее можно применять как для мониторинга одного сервера, выпускающего сеть небольшой организации, состоящую всего из трех компьютеров, в интернет, так и для контроля нескольких десятков компьютеров, выполняющих различные задачи. Для этого изначально в системе введены уровни абстрагирования от отдельных вычислительных ресурсов и пользователей. К примеру, списки хостов и контактов объединены в группы. Это позволяет с помощью минимального количества изменений в конфигурации изменять получателей определенных типов сообщений о недоступности сервисов, что весьма удобно при постоянной ротации административного персонала вашей системы и при учете изменений продолжительности рабочего дня отдельных администраторов.
Разноликость системы, способность к масштабированию
Со всеми описанными задачами отлично справляется система контроля доступности сетевых сервисов Nagios. Конечно, не следует ожидать от небольшой статьи подробного руководства по системе, которую сами разработчики не рекомендуют к использованию нетерпеливыми и некомпетентными, предлагая им, впрочем, обратиться за помощью к квалифицированным подрядчикам. Сложность настройки состоит в отсутствии готовых рецептов именно под вашу систему. И следует быть готовым к тому, что, скорее всего, первоначальный запуск системы выдаст вам множество ошибок и предупреждений. Однако правильно настроенная система мониторинга на основе Nagios позволит раз и навсегда держать руку на пульсе ситуации в подконтрольном вам сегменте сети или отделе организации. Таким образом, можно сказать, что все сложности по настройке системы сторицей окупятся при ее эксплуатации.