Исследование PagerDuty «2026 State of AI-First Operations» показывает, что сбои в ИТ-инфраструктуре обходятся крайне дорого и приводят к выгоранию разработчиков. Манди Уоллс, специалист по DevOps компании PagerDuty, рассказывает на портале The New Stack о том, как использовать автоматизацию на основе искусственного интеллекта для повышения надежности.
Безотказная работа ИТ прочно утвердилась в качестве приоритета на уровне совета директоров. Это неудивительно, поскольку организации платят высокую цену за цифровые сбои. Недавнее исследование PagerDuty показывает, что 68% глобальных организаций теряют более 300 тыс. долл. в час во время ИТ-инцидентов.
Это плохо не только для лояльности клиентов и прибыли. 42% руководителей операциями признают, что сбои также могут способствовать выгоранию разработчиков. Но, эффективно сочетая человеческие команды и автономные инструменты ИИ, организации могут снизить нагрузку на специалистов по реагированию, что, в свою очередь, может помочь повысить устойчивость, операционную зрелость и инновационность.
Откуда берется усталость?
Усталость разработчиков — это цена, которую платят глобальные компании за безупречный, ориентированный на цифровые технологии опыт, который они обещают клиентам. Инженерные команды постоянно находятся под давлением необходимости выпускать обновления, но сложные, ненадежные архитектуры, с которыми они работают, делают инциденты неизбежными. Каждый новый релиз приносит новые зависимости и потенциальные источники сбоев.
Когда что-то идет не так, инженеров отвлекают от важной работы для расследования и устранения неполадок. Ситуацию усугубляет то, что разрозненные инструменты, которые они вынуждены использовать, не могут подавлять лишние оповещения, интеллектуально маршрутизировать инциденты или заблаговременно находить и исправлять хорошо известные проблемы. Среднестатистической команде приходится обрабатывать тысячи ежедневных оповещений, многие из которых нерелевантны или дублируются.
Автоматизация может помочь, но она также может увековечивать организационные барьеры, приводить к вводящим в заблуждение результатам и создавать дополнительную работу, если требуются команды для отладки скриптов и управления исключениями. В результате падает моральный дух, наступает истощение, и тушение пожаров становится важнее инноваций.
Есть способы избежать этой участи. ИИ потенциально может принести значительную выгоду организациям, которые разберутся, как использовать его в интересах разработчиков.
Рассмотрите следующие три шага:
1. Формирование доверия среди разработчиков
Без доверия к ИИ невозможно продвижение к более зрелой и удобной для разработчиков модели. Уверенность в технологии ИИ высока среди ИТ-руководителей и бизнес-лидеров. Исследования показывают, что 59% лиц, принимающих решения в ИТ-сфере, ожидают, что ИИ улучшит показатели времени простоя и восстановления более чем на 20%. Однако разработчики, похоже, не разделяют этого энтузиазма: только 37% согласны с этим. Поэтому изменение этих представлений является критически важным первым шагом к снижению выгорания.
Организациям необходимо продвигать ИИ и помогать командам понять, как он может помочь им в личном и профессиональном плане. Ключевым моментом является демонстрация того, как ИИ может устранить рутинную работу и освободить их для выполнения более творческих и полезных задач.
Однако нет двух одинаковых членов команды. Некоторых потребуется убеждать больше, чем других, потому что они не уверены в ценности ИИ, беспокоятся о стабильности работы или и о том, и о другом. Важно проявлять эмпатию. Руководители поймут, что эти усилия приносят результаты, если члены команды начнут посещать факультативные семинары, пробовать новые инструменты и делиться полученными знаниями без просьбы.
2. Повышение квалификации существующих команд
Пожалуй, самая сложная часть проекта заключается в следующем этапе: получении командами разработчиков навыков использования инструментов ИИ в их повседневной работе. Около половины (51%) мировых организаций планируют нанимать или переобучать сотрудников для внедрения систем обнаружения инцидентов и реагирования на них с помощью ИИ.
Ключевой момент заключается не в том, чтобы записывать их на общие учебные курсы, которые дадут лишь поверхностные знания. Вместо этого повышение квалификации должно быть актуальным для каждого человека и включать в себя используемые им инструменты, языки программирования и рабочие процессы.
Начните с основных навыков, необходимых для овладения ИИ. Это может включать в себя декомпозицию проблем, разбиение задач на отдельные компоненты, которые может обрабатывать ИИ. Или побудите инженеров эффективно взаимодействовать с системами ИИ и понимать, как различные модели интерпретируют входные данные. Разработчикам также необходимы базовые знания в области оценки качества, позволяющие им эффективно определять, когда результат работы ИИ достаточно хорош, а когда требуется участие человека. Далее, адаптируйте учебные программы, чтобы сделать практические курсы актуальными для конкретных ролей. Используйте те же инструменты, данные и рабочие процессы, чтобы сделать курсы максимально контекстно релевантными. Помните, что все это требует времени, и обучение следует рассматривать как непрерывный процесс.
3. Эффективное сочетание людей и агентов ИИ
Как бы ни был важен ИИ в снижении рабочей нагрузки команд разработчиков, это не панацея. Осторожность остается нормой для многих организаций, особенно при оценке автономных, агентных систем ИИ. Почти две трети (62%) стремятся к сбалансированному сочетанию работы людей и агентов ИИ в течение следующих трех лет. Это делает крайне важным четкое определение того, когда требуется участие человека.
Один из способов сделать это — следовать трехступенчатой модели.
Первый этап включает в себя рутинные проблемы с известными способами решения. ИИ обрабатывает все эти проблемы, от обнаружения до устранения. Люди требуются только для проверки отчетов и совершенствования процессов после инцидента, чтобы учиться и улучшать свою работу. На другом конце спектра находятся новые или сложные проблемы, требующие экспертных знаний и творческого подхода к решению. Люди всегда будут играть здесь ведущую роль, используя ИИ только для сбора контекста, данных и обработки рутинных коммуникаций.
Между двумя крайностями находятся знакомые инциденты с элементами неопределенности. На этом этапе ИИ может быть задействован в детальном анализе, корреляции данных и генерации рекомендаций. Однако окончательное решение по исправлению ситуации будет приниматься людьми, которые в конечном итоге станут надзирать за работой ИИ.
Расширение команды
Для запуска этих проектов организациям необходимо пройти несколько этапов.
Сначала это налаживание управления, затем обучение пользователей и определение того, когда следует привлекать людей к процессу. Далее организациям необходимо установить ограничения для лимитирования автономии агентов и механизмы для логирования решений, создания аудиторских следов и повышения прозрачности.
Наконец, необходимо отслеживать множество показателей для мониторинга и постоянного улучшения производительности ИИ. Дополнительным преимуществом этой структуры является то, что она помогает укрепить доверие инженеров к инструментам ИИ.
Агентов ИИ следует рассматривать как новых членов команды, поэтому их влияние необходимо оценивать так же, как и влияние их коллег-людей. Если эти усилия будут успешными, организации получат выгоду от более довольных команд, меньшего выгорания и более устойчивых цифровых операций.






























