[Из песочницы] Мониторинг сетевого оборудования Cisco в системе Observium

230704a474754b03a4555529b52377cb.jpgObservium — это система, ориентированная на сбор и анализ информации, позволяющая выявлять глубинные проблемы в работе сети. Если перед вами стоит задача провести аудит сетевого оборудования, составить схему и IP план незнакомой сети — Observium один из лучших бесплатных инструментов для этого. В статье содержится обзор основных возможностей системы — в первую очередь применительно к оборудованию Cisco, а также несколько реальных примеров выявления проблем с сетью заказчика при помощи Observium (много картинок).В этой статье я постараюсь описать основные возможности системы, не затрагивая процесс установки и конфигурирования.

Observium доступен в двух версиях — бесплатной Community и умеренно платной Professional (150 английских фунтов за годовую подписку). Ниже будет рассмотрена только Community версия.

Опрос устройств осуществляется по протоколу SNMP. Для добавления маршрутизатора Cisco достаточно задать SNMP community:

snmp-server community public RO Добавление устройств в Observium осуществляется либо через меню веб интерфейса (Devices→Add device), либо из командной строки сервера: ./add_device.php hostname На вкладке Devices доступен список добавленных устройств с возможностью фильтрации по типу платформы и версии ПО, что удобно, например, при подготовке к апгрейду: fa844df374034c6e9be50ed18a69757d.jpg

Информация об устройстве содержит данные по загрузке процессора, памяти и график суммарного трафика со всех портов:

6359b92c758e4ac8a8ea8bde3da4098e.jpg

Наибольший интерес представляет вкладка Ports, где отображается список доступных интерфейсов с указанием IP и MAC адресов, текущей загрузкой трафика Unicast Up/Down Link, Broadcast Up/Down Link и другой полезной информацией. В последней колонке указываются соседние устройства (при условии, что они тоже добавлены в мониторинг), что очень удобно при составлении схемы сети.

bdd95b21b596490393566e9809912b02.jpg

Если на устройствах включен протокол CDP/LLDP, можно увидеть карту соседей:

c84bac9587b14908ad8fe75c43d00b5f.jpg

Также доступна информация по включенным протоколам маршрутизации (пример по OSPF):

fd9d2c5c4caa4d17abd8f7bf8b9b40a2.jpg

На вкладке Inventory содержится список плат и серийников, вплоть до SFP модулей (здесь часть информации отображается некорректно, т.к. использовался эмулятор GNS3 вместо реального маршрутизатора)

d6b642a4cd924b5e97b5e2f4b740d5fe.jpg

Observium можно использовать для просмотра Syslog сообщений (интеграция с RSyslog):

7695068a1b1444ffb62d90175ae5a0b0.jpg

Из сторонних приложений поддерживается еще сборщик конфигов RANCID, что позволяет просматривать сохраненный конфиг:

a7ef8269057443b7b2c89469f9009544.jpg

Помимо сетевого железа Observium может мониторить сервера и рабочие станции Windows. При этом устанавливать агента не требуется, достаточно запустить и настроить службу SNMP. Как и для маршрутизаторов доступна информация по сетевым картам — IP, MAC, порт подключения соседнего устройства. Здесь закончилось место на диске D:

56422b2ec8bf45b49a71978acb869dea.jpg

Возможностей по мониторингу Linux серверов больше. В простейшем варианте достаточно установки snmpd:

be3c0a10f8b7411fa4cdb01f6b477c15.jpg

При дополнительной установке скриптов Unix Agent можно мониторить отдельные приложения, например Apache:

c4b992dcebb64f5d8a791b86197bacab.jpg

Собственно как мониторинг Observium Community годится только для сервисов не критичных к времени реакции, т.к. устройства по SNMP опрашиваются раз в 5 минут. В платной же версии предусмотрен модуль Alarms.

К минусам еще можно отнести не очень удобно реализованную карту с устройствами — она привязана к google maps, что требует подключения к интернету. Кастомные карты, как в том же zabbix, не предусмотрены. Пример главной страницы с отключенной картой:

49ec407c0c5b48bd8d8c4aed38f0c3d5.jpg

Внизу главной страницы сообщения Syslog:

e778efce3aec4e30833ecf17932bb400.jpg

И напоследок 2 примера проблем, решенных с помощью Observium.

1. Заказчик жалуется на потерю пакетов в канале между центральным узлом и филиалом.График загрузки интерфейса на центральном узле (фиолетовый цвет — исходящий трафик):

1f315b04077d4f60b4090e3959e27fc6.jpg

График загрузки интерфейса в филиале (зеленый цвет — входящий трафик):

5fc153e856f74702a0f76b5ba447d996.jpg

Как оказалось, провайдер вместо заявленных 10Mbit/s предоставлял услугу в филиале на скорости 2Mbit/s. Также графики загрузки позволили правильно настроить политики QoS — необходимо было шейпить исходящий трафик на центральном узле до скорости филиала 10Mbit/s

2. Заказчик жалуется на задержку в получении IP адреса по протоколу DHCP.Выявлена аномальная загрузка процессора на коммутаторе:

74355b60c54f4dd5b1a3c095b22ff16b.jpg

Что сразу наводит на мысли о Broadcast шторме. График Broadcast трафика подтверждает догадку — активность по времени совпадает с загрузкой CPU:

70c8a856cc7e42d6a8f0aa7601ff1446.jpg

Графики по всем портам позволяют определить источник (фиолетовый цвет):

92c8ebc766114133a434ca5281038e38.jpg

На этом все, будет время, постараюсь написать статью по конфигурированию Observium.

© Habrahabr.ru