100GE: о частой причине линк-DOWN
Нередко заказчики обращаются с проблемой, когда с исправными и верно установленными трансиверами оптический линк 100GE не поднимается. Как правило, происходит это во время миграции/модернизации с одновендорных решений типа «Вендор А — Вендор А» на сеть типа «Вендор А — HUAWEI». В недавнем кейсе заказчик проделал путь из СПБ в Великий Новгород, чтобы провести ночные работы по замене коммутатора Вендора А на коммутатор HUAWEI CE6800. На другой стороне был пакетный брокер Profitap XX-3200. Ребята планировали быстро выполнить работы и вернуться в СПБ к утру, но линк не поднялся.
Линк строился на трансиверах HUAWEI 100GBase_SR4. Никаких ошибок, алармов не генерировалось, только сообщение, что трансивер вставлен и трансивер вытащен. Трансиверы при этом успешно определялись на обеих сторонах. Вывод команды display interface показывал, что скорость установлена жестко 100000, FULL дуплекс, автосогласование отключено (настройки по умолчанию). Ничего из этого мы не пытались изменить: трансивер не поддерживал скорость ниже 100GE, а скорость интерфейа 100G1/0/8 можно было изменить только на 40GE.
Но мы могли изменить FEC.
Выдержка из официальной документации Huawei относительно применения FEC
На стороне Profitap XX-3200G в настройках не удалось найти параметр FEC, поэтому предложили выключить его на Huawei:
fec mode none или undo fec mode (в представлении интерфейса)
После этого линк поднялся.
FEC: NONE, что значит FEC отключен
После применения команды важно ввести commit, чтобы изменения вступили в силу. Очевидная вещь, но недавно долго разбирали другой кейс, когда заказчик утверждал, что FEC отключил, но commit не применял.
---
Немного подробнее про FEC — FEC Huawei в WDW сетях.
Другая проблема отсутствия линка на 100GE интерфейсе — 100GE интерфейс DOWN (local fault) после добавления его в Virtual System NetEngine 8000