Что такое AIOps? По сути это искусственный интеллект, который предназначен для улучшения ИТ-операций. Он позволяет снизить уровень ИТ-шума и усталость от оповещений, быстрее анализировать первопричины возникновения ошибок и обладает рядом других преимуществ, о которых на портале ZDNet рассказывает вице-президент и главный аналитик Constellation Research Энди Турай.

Перед многими специалистами в области технологий сегодня стоит задача применения ИИ и машинного обучения для решения бизнес-задач, с большими надеждами на улучшение качества продукции и услуг. Недавно появившийся подход — AIOps — позволяет применить машинный интеллект для решения сложных ИТ-проблем. Такой вывод сделан в недавнем отчете Constellation Research «A CIO’s Guide to AIOps», в котором приводятся аргументы в пользприменения у AIOps для улучшения состояния ИТ-операций и помощи в «разматывании» возникших за многие годы «спагетти-архитектур».

«ИТ-руководители сталкиваются с серьезными проблемами в обеспечении эффективности, поскольку они добавили слишком много разрозненных инструментов, — говорит Турай. — В дополнение к фрагментированным данным, многие инструменты производят критические оповещения об одном и том же событии, что создает „усталость от оповещений“. AIOps — это применение ИИ для улучшения ИТ-операций. Вопреки некоторым мнениям, речь идет не о совершенствовании ИИ с помощью ИТ-операций, а скорее наоборот».

Таким образом, AIOps — это инструмент, который потенциально может повысить производительность ИТ-команд. Турай приводит семь веских причин рассмотреть подход AIOps для управления сложными ИТ-задачами:

  • снижение уровня ИТ-шума и усталости от оповещений. «Современные ИТ-команды действительно перегружены шумом, создаваемым ложными тревогами, а также слишком большим количеством оповещений об одном инциденте, — утверждает Турай. — Это может вызывать усталость от оповещений». По его оценке, AIOps позволяет снизить шум на 80-90%;
  • более быстрый анализ первопричин. В современных мультиоблачных и гибридных средах «крайне сложно определить основное событие, которое вызвало инцидент, — говорит эксперт. — Основная проблема при анализе первопричины заключается в том, чтобы собрать воедино журналы, метрики и трассировки, происходящие в одном временном интервале во всем стеке. AIOps помогает пролить свет на происхождение аномалий. А также показывает временную шкалу инцидента с момента его возникновения»;
  • улучшение планирования мощностей и использования ресурсов. «Благодаря составлению карт на основе данных и с помощью ИИ вы можете развернуть рабочие нагрузки на нужной комбинации серверов, экземпляров и машин, — поясняет Турай. — Если определенная комбинация не сработала, вы можете скорректировать ее в режиме реального времени и продолжать вносить изменения в том же режиме, пока она не будет работать так, как ожидалось, без ручного вмешательства».
  • возможность корреляции событий. AIOps позволяет «группировать связанную телеметрическую информацию вместе — журналы, метрики и трассировки. Это дает возможность просматривать связанную телеметрическую информацию из различных инструментов вместе, на одной приборной панели и в одно и то же время, что позволит получить четкое представление о том, что происходит в системе, и поможет довольно быстро определить первопричину», — добавляет эксперт;
  • обогащение контекста/предупреждения/инцидента. «Как только происходит инцидент, первый шаг, который должна сделать команда ITOps, — это как можно скорее выяснить контекст инцидента (что, когда и почему), — отмечает Турай. — Правильно внедренное решение AIOps добавит контекст к инциденту или оповещению, вместо того, чтобы изводить своими уведомлениями задействованный вспомогательный персонал»;
  • обнаружение аномалий. AIOps-решение должно уметь анализировать все данные и выявлять закономерности;
  • возможности самовосстановления и автоматизации. «Качественное решение AIOps должно либо иметь встроенную автоматизацию, либо интегрироваться со средствами автоматизации через API для инициирования мер по исправлению ситуации. Например, если наблюдается перегрузка процессора или перерасход памяти, перезагрузка или отключение некоторых процессов может устранить проблемы без необходимости отдельного оповещения и траты ИТ-ресурсов на расследование и устранение инцидента», — утверждает Турай.

Оставаться на вершине всех требований сегодняшнего массива систем может оказаться непосильной задачей для ИТ-команд, ограниченных в плане количества людей, времени и бюджета. AIOps предоставляет интеллектуальную цифровую помощь для решения повседневных проблем, чтобы ИТ-специалисты уделяли больше времени проблемам бизнеса.