AIOps (Artificial Intelligent Operations) — это сочетание ИИ-технологий, которые позволяют обнаружить проблемы в ИТ-операциях до того, как они станут серьезными, а также автоматизировать их устранение без участия человека. AIOps продолжает проникать в корпоративные системы и в 2022-2023 гг. повысит производительность операций, обзаведется улучшенной SecOps-интеграцией и некоторыми другими улучшениями, о которых на портале TechBeacon рассказывает директор по стратегии облачных вычислений Deloitte Consulting Дэвид Линтикум.

Многие организации применяют AIOps, но не идут дальше пилотных проектов, поскольку не могут понять, что он может им предложить по-настоящему полезного. Проблема, с которой они сталкивается, заключается в том, как найти время и деньги для выбора технологического стека AIOps, который можно будет применять в долгосрочной перспективе. Здесь нужно отметить, что, с одной стороны, сама технология пугает предприятия, но, с другой, к ним поступают сведения о ее возможностях и достижениях, что вызывает осторожный оптимизм и подталкивает их к более решительным действиям. Им уже не нужно спрашивать себя, переходить ли на AIOps, а следует задаваться вопросом — когда это сделать.

Недавний рост AIOps объясняется двумя ключевыми причинами. Во-первых, по мере того, как предприятия переходят к сложным архитектурам, таким как мультиоблачные вычисления, они в конечном итоге упираются в стену, когда при тех же ресурсах и бюджете не могут управлять растущим количеством гетерогенных систем. Во-вторых, они испытывают все большее беспокойство по поводу безопасности; к ним также приходит понимание того, что современные операции по обеспечению безопасности требуют проактивного мониторинга и реагирования.

Большинство существующих инструментов мониторинга начали применять функции AIOps. Это означает, что инструмент мониторинга, который использовался с 1980-х, внезапно становится AIOps-инструментом и клиенты платят за его возможности и функции. Облачные инструменты мониторинга, которые задействовали AIOps с самого начала, становятся более стратегически ориентированными, многие из них подключают как к традиционным платформам, так и к облачным системам.

Сегодня технические руководители и сотрудники чувствуют давление, заставляющее их принять решение о внедрении AIOps на своем предприятии. Это то, что я называю форсированным маршем к AIOps. Если вас принудили к нему, пришло время узнать о прагматичном использовании технологии AIOps, чтобы вы могли давать справедливые и обоснованные рекомендации. Новые знания должны включать в себя понимание текущей технологии AIOps и того, что она предлагает, и, что более важно, краткосрочных и долгосрочных перспектив. Они станут еще более актуальными, так как в 2022-2023 гг. ожидается повальный переход на нее.

В 2022 г. AIOps покорит новые рубежи, показав четыре новых достижения (плюс одно в более отдаленной перспективе). Понимание того, что они из себя представляют, поможет вашей команде CloudOps извлечь из них пользу.

1. Улучшенная SecOps-интеграция

Большинство технологических инструментов AIOps пока не фокусируются на том, как улучшить безопасность, о чем хорошо знают специалисты, которые занимаются общими ИТ-операциями и операциями безопасности (SecOps). Чтобы сформировать новые роли для AIOps, многие предприятия используют системы автоматизации, а также API для подключения. Например, распространенной новой ролью является повышение наблюдаемости телеметрии систем, такой как производительность сети, проблемы ввода-вывода, операции с БД или любые другие данные, которые могут указать на вероятность атаки на систему.

К сожалению, многие пользователи и/или операционные команды обнаруживают нарушения безопасности, лишь когда происходит что-то, выходящее за рамки нормы. Это может быть перегрузка процессора и ввода-вывода, причиной которой является вредоносный двоичный файл, который находится на каком-то компьютере или даже в системах на базе IoT, таких как приборы и автомобили. В прошлом приходилось обращаться в ИБ-отдел, который вступал в бой с атакующими системами. Проактивный подход гораздо эффективнее. Проактивные меры требуют, чтобы системы безопасности обзавелись функциями мониторинга за инструментами верификации, включая ключевые показатели, которые могут указывать на атаку. AIOps обладает потенциалом для получения таких показателей в режиме реального времени.

Чтобы обеспечить такую видимость, многие предприятия будут использовать инструменты AIOps для интеграции с существующими системами безопасности, поскольку ИБ-специалисты будут требовать, чтобы эта функция была включена в дорожную карту разработчиков AIOps-инструментов.

Помимо функции обнаружения вторжений, в 2022 г. можно ожидать появления инструментов AIOps, которые будут выполнять автоматическое исправление.

2. Улучшение производительности операций

Контроль производительности операций обычно включает в себя деятельность по мониторингу общей производительности систем, таких как процессоры, хранилища, БД и приложения. В прошлом операционные команды (IT Ops) получали жалобы от пользователей на медленное время отклика. Сегодня важнее всего выявлять проблемы до того, как пользователи с ними столкнутся, а затем устранять их с помощью ручных или автоматизированных процессов.

Большинство инструментов AIOps могут выявлять проблемы с производительностью с помощью заранее определенного набора ограничений, которые предупреждают IT Ops о наличии проблемы. Однако большинство инструментов не предоставляют заранее определенных методов их исправить. В мире операций могут существовать сотни возможных проблем и способов их устранения.

Допустим, время отклика сервера БД увеличилось с 0,3 с до 0,9 с. Поскольку это время выходит за пределы порогового значения, инструмент AIOps генерирует предупреждение о проблеме производительности. Но что делать дальше? Может быть масса причин падения производительности сервера БД, как внутренних, так и внешних, например, сетевые проблемы. Найти эту проблему — трудная задача для большинства поставщиков технологий AIOps и/или пользователей, которые используют автоматизацию для создания процессов, выявляющих проблемы.

В 2022 г. эта головоломка приведет к усовершенствованию методов поиска проблем с производительностью и, что более важно, способов их предотвращения. Именно здесь ценность инструментов AIOps будет по-настоящему велика. Операции, управляемые событиями, уже включают оповещение о системных проблемах. Вскоре они получат возможность проведения сложной диагностики для определения причины и развертывания автоматического исправления. IT Ops даже не будет участвовать в этих процессах.

3. Автоматическое обновление и исправление интерфейсов

Если и есть что-то, что идет не так в большинстве старых и новых систем AIOps, так это интерфейс, который работает со всеми управляемыми системами. Иногда эти интерфейсы представляют собой скрытые API или готовые адаптеры, которые сглаживают различия между системами, входящими в операционную коллекцию, чтобы инструменты AIOps могли работать с ними. Кроме того, API позволяют AIOps одинаково работать со всеми видами системных компонентов, включая облачные и локальные, БД, приложения и т. д.

Если с интерфейсом возникают проблемы, пользователи AIOps обычно вынуждены останавливать системы или обновлять адаптеры или другие интерфейсы для их решения. Они случаются, в основном, когда платформы автоматически устанавливают исправления и улучшения, которые по тем или иным причинам в итоге выводят из строя адаптеры и интерфейсы. Иронично, что инструмент AIOps, который может обеспечить возможности самовосстановления, не умеет восстанавливать собственную работоспособность.

Многие изменения в 2022 г. будут направлены на автоматизацию обновлений и исправлений интерфейсов. Пользователям AIOps и IT Ops больше не придется иметь дело с сотнями интерфейсов, которые используют системы AIOps. Эти мучительные задачи, которые еще больше усложняли работу операторов, исчезнут.

4. Новая интеграция управления

Большинство инструментов AIOps не ориентированы на управление. Некоторые из них взаимодействуют с системами безопасности, которые разрешают или запрещают пользователям доступ к чему-либо. Однако управление — это возможность отслеживать, как пользователи и приложения потребляют ресурсы, и устанавливать ограничения на их использование. Например, существуют системы управления, устанавливающие ограничения на использование API, данных или обеспечивающие соблюдение политик, связанных с соответствием нормативным требованиям. Системы управления могут контролировать все, но в теории они должны это делать заранее определенными способами и с рядом ограничений.

Одним из наиболее распространенных примеров этого является управление затратами, которое иногда называют финансовыми операциями, или FinOps. В этом случае системой мониторинга, как правило, выступают публичные облачные системы, которые выставляют счета исходя из потребления ресурсов в разрезе пользователей, подразделений, компаний и т. д. Существует немало способов, которые позволяют компании отслеживать расход средств как для облачных, так и для локальных систем.

Инструменты AIOps должны быть связаны с системами управления, что диктуется операционными аспектами управления. В случае управления затратами важную роль в отслеживании также могут играть перебои и проблемы с производительностью. Если система продается по подписке, на нее установлена фиксированная цена, но 30% времени она находится в простое, то может быть справедливо зачесть процент за время простоя, о котором сообщает инструмент AIOps, обратно пользователям, отделу и/или компании. Другие преимущества интеграции с инструментами управления — информирование систем управления данными о проблемах с API, сбоях в работе БД или других проблемах.

5. Вложенные специализированные базы знаний

Хотя для большинства игроков AIOps базы знаний являются новой функцией, использование одной обобщенной базы знаний просто недостаточно для предприятий. На горизонте планирования появляется концепция вложенных баз знаний (nested knowledge bases), или общих хранилищ, которые содержат другую специализированную информацию для более структурированного подхода к поиску и решению операционных проблем.

Возьмем плохо работающий сервер БД из предыдущего примера. Инструмент AIOps может использовать обобщенную базу знаний, чтобы найти проблему производительности, задействуя для этого как установленные пользователем пороговые значения, так и более широкий набор накопленных знаний, которые являлись бы источником «знания» для инструмента AIOps. Отдельная база знаний может хранить и предоставлять информацию о конкретной системе, такой как сетевой коммутатор, облачные СХД, приложения или, в данном случае, некачественно работающий сервер БД.

Идея заключается в том, чтобы определить первопричину проблем, связанных с конкретными компонентами системы, и хранить комплексные знания, относящиеся к каждому компоненту. В случае с этим сервером база знаний могла бы предоставить опыт, показывающий, что большинство его проблем с производительностью связаны с системой индексирования, и искать их в первую очередь там. В теории она могла бы автоматически загрузить и установить исправление, которое еще никто не удосужился сделать. Или это может быть одна из множества других вещей, которые система должна рассмотреть.

AIOps, разумеется, еще не достиг такого уровня развития, но большинство пользователей захотят (а вскоре будет требовать и рынок) инструменты, предоставляющие общие знания об операциях и конкретных компонентах. Поставщики инструментов AIOps могли бы продавать эти специализированные базы знаний в качестве опции, чтобы клиентам не пришлось создавать эти хранилища или повторять работу, которую уже сделал кто-то другой.

Больше знаний — это хорошо

Любое из пяти вышеперечисленных достижений может оказать глубокое воздействие на способы разработки и внедрения AIOps на вашем предприятии. Пользователи и руководство должны понимать, что может произойти с AIOps в ближайшем будущем, независимо от того, развернули вы уже свой набор инструментов AIOps или нет. Знать, что будет дальше, действительно полезно.