[Из песочницы] Мониторинг сетевого оборудования Cisco в системе Observium03.02.2015 11:33

Observium — это система, ориентированная на сбор и анализ информации, позволяющая выявлять глубинные проблемы в работе сети. Если перед вами стоит задача провести аудит сетевого оборудования, составить схему и IP план незнакомой сети — Observium один из лучших бесплатных инструментов для этого. В статье содержится обзор основных возможностей системы — в первую очередь применительно к оборудованию Cisco, а также несколько реальных примеров выявления проблем с сетью заказчика при помощи Observium (много картинок).В этой статье я постараюсь описать основные возможности системы, не затрагивая процесс установки и конфигурирования.

Observium доступен в двух версиях — бесплатной Community и умеренно платной Professional (150 английских фунтов за годовую подписку). Ниже будет рассмотрена только Community версия.

Опрос устройств осуществляется по протоколу SNMP. Для добавления маршрутизатора Cisco достаточно задать SNMP community:

snmp-server community public RO Добавление устройств в Observium осуществляется либо через меню веб интерфейса (Devices→Add device), либо из командной строки сервера: ./add_device.php hostname На вкладке Devices доступен список добавленных устройств с возможностью фильтрации по типу платформы и версии ПО, что удобно, например, при подготовке к апгрейду:

Информация об устройстве содержит данные по загрузке процессора, памяти и график суммарного трафика со всех портов:

Наибольший интерес представляет вкладка Ports, где отображается список доступных интерфейсов с указанием IP и MAC адресов, текущей загрузкой трафика Unicast Up/Down Link, Broadcast Up/Down Link и другой полезной информацией. В последней колонке указываются соседние устройства (при условии, что они тоже добавлены в мониторинг), что очень удобно при составлении схемы сети.

Если на устройствах включен протокол CDP/LLDP, можно увидеть карту соседей:

Также доступна информация по включенным протоколам маршрутизации (пример по OSPF):

На вкладке Inventory содержится список плат и серийников, вплоть до SFP модулей (здесь часть информации отображается некорректно, т.к. использовался эмулятор GNS3 вместо реального маршрутизатора)

Observium можно использовать для просмотра Syslog сообщений (интеграция с RSyslog):

Из сторонних приложений поддерживается еще сборщик конфигов RANCID, что позволяет просматривать сохраненный конфиг:

Помимо сетевого железа Observium может мониторить сервера и рабочие станции Windows. При этом устанавливать агента не требуется, достаточно запустить и настроить службу SNMP. Как и для маршрутизаторов доступна информация по сетевым картам — IP, MAC, порт подключения соседнего устройства. Здесь закончилось место на диске D:

Возможностей по мониторингу Linux серверов больше. В простейшем варианте достаточно установки snmpd:

При дополнительной установке скриптов Unix Agent можно мониторить отдельные приложения, например Apache:

Собственно как мониторинг Observium Community годится только для сервисов не критичных к времени реакции, т.к. устройства по SNMP опрашиваются раз в 5 минут. В платной же версии предусмотрен модуль Alarms.

К минусам еще можно отнести не очень удобно реализованную карту с устройствами — она привязана к google maps, что требует подключения к интернету. Кастомные карты, как в том же zabbix, не предусмотрены. Пример главной страницы с отключенной картой:

Внизу главной страницы сообщения Syslog:

И напоследок 2 примера проблем, решенных с помощью Observium.

1. Заказчик жалуется на потерю пакетов в канале между центральным узлом и филиалом.График загрузки интерфейса на центральном узле (фиолетовый цвет — исходящий трафик):

График загрузки интерфейса в филиале (зеленый цвет — входящий трафик):

Как оказалось, провайдер вместо заявленных 10Mbit/s предоставлял услугу в филиале на скорости 2Mbit/s. Также графики загрузки позволили правильно настроить политики QoS — необходимо было шейпить исходящий трафик на центральном узле до скорости филиала 10Mbit/s

2. Заказчик жалуется на задержку в получении IP адреса по протоколу DHCP.Выявлена аномальная загрузка процессора на коммутаторе:

Что сразу наводит на мысли о Broadcast шторме. График Broadcast трафика подтверждает догадку — активность по времени совпадает с загрузкой CPU:

Графики по всем портам позволяют определить источник (фиолетовый цвет):

На этом все, будет время, постараюсь написать статью по конфигурированию Observium.