В условиях роста сетевых заторов ИТ-командам необходимо сокращать дублирование инструментов, контролировать затраты и готовиться к AIOps и агентам искусственного интеллекта, пишет на портале InformationWeek Мэри Шеклет, президент консалтинговой компании Transworld Data.

Затор (logjam) определяется как «непреодолимое скопление или клубок логов», подобно тому, как бревна накапливаются в реке и перекрывают ее. В сети, которая сама по себе является рекой коммуникаций, сетевые сотрудники также сталкиваются со своего рода заторами.

Они тонут в океане избыточных логов. Избыточное сетевое журналирование перегружает процессоры, переполняет память и сбивает с толку сетевых сотрудников, которые пытаются расшифровать, какие логи являются — и должны быть — пригодными для использования.

Между тем, ежедневные заторы данных и рабочих процессов превращаются в более серьезную проблему, поскольку сетевые сотрудники стремятся объединить инструменты, которые стандартный сетевой мониторинг, наблюдаемость, AIOps и теперь агенты ИИ навязали им для мониторинга телеметрии и других сетевых событий на все более детальном уровне.

Эти технологии пересекаются друг с другом, и дублирование приводит к неэффективному расходованию корпоративных ИТ-ресурсов. Как ИТ-службы могут контролировать затраты? И как сетевым сотрудникам избежать дублирования усилий, когда они все еще пытаются понять, какие инструменты следует использовать и для чего?

Понимание типов сетевых проблем, требующих решения

Современные ИТ-сети охватывают центральные ИТ-подразделения, периферийные узлы, облачные локации, а также удаленные домашние и полевые офисы. Стандартные инструменты мониторинга сети, которые до сих пор используются многими подразделениями, были разработаны для монолитных сетей, таких как единая корпоративная сеть масштаба предприятия. Они не могут справиться со сложностями гибридной сетевой топологии, выходящей за пределы предприятия.

Подразделения это понимают, как и поставщики сетевого оборудования. И те, и другие видят необходимость обновления планов развития средств управления сетью, поскольку почти никто больше не работает с монолитными корпоративными сетями.

Перед ними стоит вопрос: какие надлежащие инструменты и методологии следует обновить — и какие существующие инструменты можно исключить?

Навигация по инструментам

Существуют четыре категории инструментов мониторинга и предотвращения сбоев в сети:

1. Стандартный мониторинг сети. Стандартный мониторинг сети самодостаточен, поскольку это зрелая технология, и сотрудники хорошо с ней знакомы. Он использует метрики сетевого трафика, использования ЦП и ресурсов хранения, допустимых ошибок и времени отклика, но ИТ-специалисты должны предварительно определить эти метрики. Инструменты мониторинга выдают оповещения, когда происходит превышение этих предопределенных метрик, и затем задача ИТ-специалистов — найти и устранить проблемы.

2. Наблюдаемость. Стандартный мониторинг сети недостаточен, поскольку он сообщает только о том, что ИТ-специалисты предварительно для него определили. Наблюдаемость идет глубже. Она сообщает не только о нарушениях метрик, но и о том, где и почему произошло нарушение. Она предоставляет эту информацию, анализируя метрики, журналы и трассировки — и соответствующее ПО может делать это автономно. Это дает ИТ-специалистам преимущество в решении проблем.

3. AIOps. Цель AIOps — расширить возможности наблюдаемости за счет применения ИИ и автоматизации для решения проблем. Недостаток AIOps заключается в том, что при анализе данных эта методология имеет ограниченное представление о контексте сетевого события. Она даже не может определить, являются ли анализируемые телеметрические данные достоверными. Именно здесь по-прежнему должна вмешиваться ИТ-служба, поскольку для подтверждения достоверности результатов AIOps и применения исправлений требуются специалисты по сетям.

4. Сетевые ИИ-агенты. Новая волна инструментов в виде сетевых ИИ-агентов пытается еще больше автоматизировать решение проблем там, где есть необходимость вмешательства сетевого персонала. ИИ-агенты автоматически обнаруживают и устраняют проблемы. Они делают это, используя машинное обучение для изучения истории производительности сети, чтобы получить бизнес-контекст того, как сеть должна функционировать.

Пять лучших практик управления переходом

Переход от стандартного мониторинга сети к наблюдаемости, затем к AIOps, а затем к сетевым ИИ-агентам — это естественное развитие ПО для управления сетями. Компании и поставщики это понимают, поэтому была определена эволюционная дорожная карта управления сетями.

Но прежде чем они смогут приступить к реализации этой дорожной карты с использованием новых технологий, компании должны оценить, на каком этапе пути они находятся с точки зрения инструментов, персонала, бизнес-требований и затрат. Вот пять лучших практик:

1. Оцените свой текущий набор инструментов. Для многих сотрудников ИТ-подразделений, занимающихся сетевыми технологиями, разбор используемых в настоящее время инструментов — и тех, которые были забыты и лежат на полке — является колоссальной задачей. Но сейчас самое время этим заняться.

Инструменты управления сетью должны быть учтены во всех сетях предприятия, независимо от того, находятся ли сети локально в дата-центре, на периферии предприятия или в облаке.

Инструменты должны быть классифицированы по функциям, чтобы исключить любые дублирования. Если разные инструменты используются для одних и тех же функций в разных местах сети, эти инструменты должны быть стандартизированы в единый набор инструментов. Это упростит работу персонала, уточнив, какие инструменты следует использовать и как проводить обучение.

2. Встретьтесь с поставщиками для оценки их планов развития. Часть процесса инвентаризации и оценки инструментов — это взаимодействие с поставщиками инструментов, чтобы узнать, в каком направлении они движутся со своими планами развития.

План развития средств управления сетью ясен: от стандартного мониторинга сети к наблюдаемости, затем к AIOps и, наконец, к сетевым ИИ-агентам.

Если у поставщиков эта эволюция не отражена в их планах, пора искать тех, у кого она отражена.

3. Займитесь повышением квалификации персонала по AIOps. Большинство сотрудников, занимающихся корпоративными сетями, хорошо владеют стандартным мониторингом и уже работают с наблюдаемостью.

Следующий шаг — внедрение автоматизации в наблюдаемость с помощью AIOps, что все еще находится в процессе, поскольку требует перестройки и, в некоторых случаях, переосмысления рабочих процессов сети.

Сетевые сотрудники должны изучить новые инструменты AIOps, а также способы интеграции дополнительной AIOps-автоматизации в рабочие процессы сети и повседневные операции.

Эти изменения должны быть задокументированы, а документация — слабое место в сетевых операциях.

Чтобы обеспечить соответствие оперативной документации изменениям в рабочих процессах, целесообразно привлечь внешних аудиторов для проверки документации и операций, чтобы выявить и исправить любые несоответствия.

4. Очень осторожно внедряйте агентов ИИ. Концепция полностью автоматизированных сетевых операций с использованием агентов ИИ пока остается скорее теорией, чем фактом.

Тем не менее, некоторые организации уже пробуют свои силы в этом направлении.

Сетевые агенты ИИ используют машинное обучение для изучения прошлой производительности сети, чтобы получить бизнес-контекст для своей автоматизации. Но у них нет практических знаний и опыта, которыми обладают сотрудники сетевой службы.

Рекомендуется первоначально внедрять сетевых ИИ-агентов в хорошо предсказуемых и контролируемых сетях с низким риском изменений или аномалий.

5. Оцените ценность унаследованных технологий. Унаследованные технологии означают не только старость, но и проверенность, надежность и долговечность.

Существуют инструменты управления сетью, которые выдержали испытание временем и продолжают хорошо работать.

При анализе имеющихся инструментов организациям следует внимательно изучить, что продолжает приносить пользу. Безусловно, следует совершенствовать инструменты и навыки, но не стоит выбрасывать то, что по-прежнему хорошо работает.