В сетях, особенно крупных, надёжность передачи данных зависит не только от скорости каналов и резервирования маршрутов, но и от способности инфраструктуры своевременно распознавать деградацию. На физическом уровне это чаще всего выражается в простом параметре — статусе порта. Логика, казалось бы, простая: если линк поднят, всё работает; если нет — ищем обрыв. Но реальность сетевых технологий куда сложнее. Бывают состояния, когда интерфейс физически активен, лампочка «горит», логи молчат, SNMP не выдаёт ошибок, а связь отсутствует или работает с перебоями. Это — самая коварная категория сбоев, потому что они не считаются аварийными событиями, и тем самым ускользают от внимания администратора до момента, когда ситуация выходит из-под контроля.