Под «коллективным интеллектом» (collective intelligence) понимают коллектив людей, в котором наибольшее значение приобретает желание делиться опытом, новаторский стиль мышления и открытость новым знаниям, которые служат на общее благо бизнесу. Директор направления AIOps и вице-президент по разработке продуктов New Relic Гай Фигел рассказывает на портале Information Age о роли AIOps для достижения этой цели.

Традиционные ИТ-инструменты, решения и подходы разрабатывались без учета объема и разнородности данных и скорости, которыми оперируют современные сложные и подключенные ИТ-среды, поэтому они агрегируют и консолидируют данные исходя из их средних значений, что ставит под угрозу точность и достоверность информации. В сегодняшней перенасыщенной данными среде очень важно прибегать к коллективному сотрудничеству и задействовать критическое мышление как способ воздействия на интеллектуальный механизм, поскольку он автоматически изучает шаблоны и тенденции клиентских сред и предоставляет наиболее ценные идеи для команд.

Одна из наиболее отличительных особенностей платформ AIOps (artificial intelligence for IT operations, искусственный интеллект для ИТ-операций) — возможность собирать данные любых форматов из нескольких источников, а затем осуществлять автоматизированный их анализ, что позволяет командам получить расширенный оперативный простор, стать более активными и реагировать на упреждение.

Стратегия AIOps предусматривает комплексный подход, который требует, чтобы операционные команды расширяли круг своих обязанностей как в области ИТ, так и в отношении бизнес-инициатив, поскольку им в равной степени приходится решать задачи по устранению повторяющихся неполадок и принимать участие в стратегических проектах. Вместо того, чтобы сужать подход AIOps до одного конкретного аспекта реагирования на инциденты, стоит укреплять отношения сотрудников на каждом этапе внедрения — это позволит создать более мощное решение. Тем не менее, обнаружение ошибок, улучшенное реагирование на них и другие действия не будут значимыми, если у команд не будет инструмента, сравнимого по качеству работы с лучшими инженерами доступности сервисов (SRE).

Ниже приведены пять стратегических элементов, которые помогут предприятиям раскрыть свой интеллектуальный потенциал и извлечь преимущества от применения AIOps.

1. Снижение «шума»

Известно, что современные программные среды создают ряд проблем, и одной из наиболее актуальных из них является необходимость постоянного анализа потока событий. Как правило, за неделю приходится обрабатывать сотни или даже тысячи обращений. Пользуясь богатыми и надежными возможностями AIOps, операционные ИТ-команды могут коррелировать события, что снизит уровень информационного «шума» и улучшит понимание контекста. Для этого нужно настроить прием данных из различных источников и систем и агрегирование различных типов данных, включая события, журналы, метрики и данные мониторинга пользовательских систем, в едином консолидированном хранилище данных. Подавление «шума» достигается путем разбора событий, которые возникают в пределах полосы нормальности, и тех, которые вызывают истинные аномалии, затрагивающие интересы пользователей. Таким образом, ИТ-команды будут получать уведомления только в том случае, если требуется участие человека.

2. Непрерывное улучшение

Несколько лет назад Gartner оценила среднюю стоимость простоя в ИТ в 5600 долл. за минуту. Современные компании нуждаются в инструментах, которые позволят избежать перерасходов, связанных с выходом систем из строя. Непрерывное улучшение — это очень ценная интеллектуальная возможность, которая приближает команды разработчиков ПО к общей оценке ситуации и единому видению. AIOps-платформа в непрерывном режиме изучает шаблоны и применяет изученные модели к входящим потокам предупреждений, чтобы воздействовать на них в каскадном или параллельном режимах. Она группирует связанные оповещения в логические выводы на основе моделей обучения, позволяя ИТ-отделам и командам DevOps управлять ими вместо реагирования на отдельные вызовы. Все это снижает уровень «шума», который пользователи должны просеивать в повседневной работе. Настройка выводов позволяет обеспечить работу в режиме бесперебойного конвейера CI/CD.

3. Поддержка

После имплементации существующих ручных процессов в AIOps-решение для их автоматизации и масштабирования очень важно, чтобы команды оценили их ценность, разработали новые на основе существующих или устранили недостатки. Платформа AIOps не только позволяет делать то, что раньше было практически невозможно, но делает это с размахом и скоростью, выявляя ранее недоступные аналитические глубины. С момента внедрения AIOps роль ИТ-специалистов меняется со «специалистов» на «аудиторов», вместе с этим к ним придет понимание, как системы обрабатывают данные и достигаются ли желаемые бизнес-результаты.

4. Обнаружение

Цель AIOps — это автоматизация, однако ее невозможно реализовать без обнаружения аномалий, что позволяет выявлять инфраструктурные проблемы и отслеживать тенденции. Средства обнаружения помогают распознавать необычное поведение (например, замедленную реакцию сервера в ответ на запросы или повышенную сетевую активность, связанную с внешним вторжением) и соответствующим образом реагировать. Помимо этого инструменты AIOps могут в автоматическом режиме устранять проблемы, если таковые были обнаружены. Например, в ответ на угрозу безопасности они могут заблокировать хост, закрыть порт или запустить дополнительные экземпляры приложения, если для удовлетворения спроса недостаточно существующих.

Это важнейший компонент стратегии AIOps, поскольку он не только позволяет командам разработчиков ПО обнаруживать проблемы на ранних стадиях (когда они еще не затрагивают клиентов), но и позволяет им упростить обслуживание конфигураций, которые предназначены для обнаружения аномалий инфраструктуры. В конечном итоге AIOps может придать уверенности командам, гарантируя, что их часть производственной среды контролируется правильно и практически в реальном времени.

5. Обзорность

Большинство организаций находятся на стадии раннего внедрения нативных облачных технологий, поэтому методология проведения анализа и выявления критических сбоев еще недостаточно проработана, чтобы можно было проследить за тем, где и когда происходят поломки в облачной инфраструктуре. Чтобы успешно маневрировать ею, получение информации о поведении приложений становится для команд более актуальным, чем когда-либо прежде. Инженерные группы должны уметь эффективно и продуктивно управлять современными программными системами.

Поскольку системы продолжают усложняться, единственный способ эффективно реализовать стратегию AIOps в долгосрочной перспективе — это автоматизировать как можно больше задач клиентов, а также помогать решать те задачи, которые требуют участия человека. Это даст возможность командам разработчиков сократить трудозатраты, проводить аудит, контролировать доступ и конфигурацию инфраструктуры. Истинная выгода платформы AIOps — в коллективном разуме. Он позволит организациям прорваться сквозь преграды, способствуя истинному, эффективному и конструктивному сотрудничеству.