Пять рекомендаций, как обеспечить надежный цифровой сервис, избежать негативных отзывов и сохранить клиентов в период пандемии COVID-19.

В результате ограничительных мер для борьбы с распространением COVID-19 миллионы людей по всему миру вынуждены сидеть дома, переведя всю привычную жизнь в онлайн-пространство. В этих условиях многие компании столкнулись с существенным ростом трафика и взрывным пиком цифрового взаимодействия со своими клиентами. Хотя в некоторых странах уже вводятся послабления режима самоизоляции, частичный запрет на передвижения и удалённая работа надолго останутся нормой для многих людей, а приложения и онлайн-сервисы займут ещё более заметное место в нашей жизни.

В последние недели мы могли наблюдать, как карантинные меры повлияли на рост популярности всех видов онлайн-услуг: удаленная работа, дистанционное обучение, виртуальные покупки, тренировки, развлечения и даже встречи с друзьями.

На примере нашей клиентской базы мы видим беспрецедентный рост объёмов сетевого трафика. Например, у страховой компании, которая обрабатывала в среднем 12 000 заявок в неделю, их количество выросло в 25 раз — до 300 000, с пиковым значением более 100 000 за день. Отрасль ритейла также показывает рекордные цифры: некоторые розничные сети продуктовых магазинов выявляют 4-кратный рост трафика в приложениях и увеличение числа посещений сайта до 900%.

Любой компании необходимо учитывать меняющиеся условия ведения бизнеса и поддерживать высокий уровень оказания онлайн-услуг. Бесперебойная работа цифровых сервисов стала приоритетом для ИТ-департаментов, и технологии мониторинга и контроля работоспособности сервисов и приложений (APM-решения) — как никогда важны для успешного развития на рынке с высокой конкуренцией.

По данным исследования AppDynamics «The Agents of Transformation Report», 74% ИТ-специалистов в России отмечают, что пандемия COVID-19 стала причиной самой высокой технической нагрузки на их организации. В связи с этим, подавляющее большинство отечественных компаний — 92% — в сложившейся ситуации пересмотрели свои приоритеты в сфере технологий и приняли решение ускорить реализацию ряда инициатив, которые были предусмотрены в рамках долгосрочной программы цифровой трансформации.

Для поддержания производительности приложений в период пикового спроса на цифровые услуги существует пять приоритетных задач для ИТ-департамента, на которые следует обратить особое внимание.

1. Обеспечьте максимальную надежность ключевых функций, отвечающих за работоспособность вашего приложения

В каждом онлайн-сервисе или приложении есть функции, которые для клиентов важнее других. Например, при покупке товаров в Интернете это кнопки «авторизоваться», «добавить в корзину», «оформить заказ» и «оплатить». Именно на данных этапах по времени отклика, скорости загрузки страницы и отсутствию сбоев пользователи определяют качество обслуживания. Эти критические функции мы называем «бизнес-операциями», их отлаженная работа важна не только для оценки общей производительности приложения, но и для получения прибыли, удержания клиентов и успеха бизнеса в целом.

Такая высокая нагрузка на сервисы, как сегодня, иногда не позволяет поддерживать высокий уровень производительности всех функций и операций, доступных в приложении, поэтому следует сделать акцент именно на контроль бизнес-операций. Для этого необходимо чётко определить список, который включает от 5 до 20 функций, ключевых для оказания ваших услуг и получения прибыли. Важно, чтобы ИТ-специалисты сконцентрировались на технической поддержке именно этих функций, бросая все силы на обеспечение их высокой производительности и предотвращение сбоев.

2. Используйте искусственный интеллект и машинное обучение для быстрого устранения проблем

Когда вы получаете информацию о сбоях в работе критически важных функций приложения, желательно определить локацию и причину проблемы, а также оперативно устранить её ещё до того, как пользователи заметят неполадки и получат негативных опыт взаимодействия с вашей компанией. Бизнес-мониторинг позволяет ИТ-отделам в режиме реального времени получить необходимую информацию о коде приложения прямо через технический стек, что дает возможность специалистам быстро выявлять и устранять причины сбоев.

Учитывая огромное количество данных мониторинга, поступающих в операционные ИТ-отделы, оперативно обрабатывать их вручную и принимать соответствующие меры в реальном времени практически невозможно. Искусственный интеллект и машинное обучение играют решающую роль в обеспечении мгновенной идентификации, локализации и поиске путей решения проблем, возникающих в работе приложений. Более того, возможности искусственного интеллекта позволяют автоматизировать поиск аномалий и угроз для всех компонентов приложения. Это снижает нагрузку на ИТ-команды, которые порой могут тратить по несколько дней только на поиски причины сбоя.

3. Определите влияние внешних факторов на производительность приложения

Причина негативного пользовательского опыта не всегда кроется в проблемах ИТ-инфраструктуры самой компании. В первую очередь необходимо определить источники сбоев: какие из них находятся под контролем компании, а какие — нет. Сквозной мониторинг действий конечных пользователей и состояния сторонних компонентов дают необходимую для этого информацию.

Например, за период карантина произошло уже несколько инцидентов, связанных со сбоями у провайдеров проводной и беспроводной широкополосной связи, среди них зафиксированы задержки сигнала и снижение пропускной способности сетей. Это привело к падению скорости доступа у клиентов различных компаний, а в некоторых случаях — даже к полной потери доступа к приложениям из-за отсутствия связи. На практике многие также столкнулись с медленной работой сервисов из-за повышенной нагрузки на канал в доме, возникшей при резком росте спроса на видеоконференции, онлайн-тренинги, трансляции Netflix и другие виртуальные платформы, генерирующие высокий трафик.

Кроме того, встречаются и более локализованные проблемы, связанные с конкретными пользователями, мощностью их оборудования и возможностями операционной системы. В частности, на компьютере клиента могут быть запущены ресурсоёмкие фоновые приложения, которые препятствуют работе других цифровых сервисов. Медленная загрузка приложения также может быть связана с низкой эффективностью работы внешнего источника данных. Например, пользователь не может оплатить покупку в онлайн-магазине, так как система банка дала сбой из-за роста числа запросов к их базам данных.

4. Установите показатели нормы в периоды пиковых нагрузок

Настало время сосредоточиться на действительно важных проблемах и не отвлекаться на второстепенные задачи. ИТ-департаменты могут установить четкий регламент и определить параметры, определяющие нормальное или ожидаемое состояние системы. Эти параметры должны быть основаны на измеряемых величинах, таких как среднее время отклика для бизнес-операции или скорость загрузки центрального процессора (ЦП) для узла. При отклонении подобных показателей от нормы выполняется автоматическая отправка оповещений по электронной почте ответственным специалистам или запускаются корректирующие сценарии.

В текущей ситуации большинство компаний не наблюдают «нормальных» вариантов работы своих приложений и цифровых сервисов. Вместо этого они видят постоянные и часто противоречивые уведомления о скачках трафика и росте запросов. Это может привести к «лавине аварийных сигналов», когда срабатывает «эффект домино» и сбои появляются один за другим. Чтобы снизить нагрузку на персонал, необходимо адаптировать показатели нормы и определить приоритетные для специалистов задачи.

5. Оптимизируйте ИТ-инфраструктуру, пока она не повлияла на качество цифрового обслуживания компании

ИТ-инфраструктура — это комплекс взаимосвязанных компонентов, который включает различные программы, политики кибербезопасности, сетевые сервисы, системы резервного копирования и хранения данных, а также мониторинг и управление приложениями. Эффективное распределение ресурсов инфраструктуры помогает обеспечить доступность и производительность цифровых сервисов и приложений для пользователей.

Классическое решение сбоев в работе приложений — выделение дополнительных ресурсов инфраструктуры для достижения «нормального» уровня обслуживания клиентов. Но это очень дорогостоящая и не самая эффективная мера, особенно в период кризиса, когда расходы на увеличение пропускной способности инфраструктуры крайне неуместны.

По мнению экспертов компании IDC, основной фактор для эффективной реализации ИТ-операций — грамотное планирование и использование инфраструктурной емкости. Подходящий вариант для улучшения ИТ-инфраструктуры — внедрение ПО для оптимизации рабочей нагрузки, которое позволяет распределять уже имеющиеся ресурсы и снижает затраты, решая задачи координации требований приложений и ресурсов инфраструктуры в локальных и мультиоблачных конфигурациях.

Сегодня способность российских компаний вести эффективный бизнес в цифровой среде и качественно взаимодействовать с клиентами, особенно важна. Исследование AppDynamics показывает, что в случае сбоев в работе приложения 49% пользователей уйдут к конкуренту, даже не обратившись в службу поддержки, а 63%, испытав негативный опыт при использовании сайта компании, никогда не порекомендуют ее услуги или продукты знакомым.

Проблема неэффективности онлайн-сервисов ещё никогда не стояла так остро и не обсуждалась пользователями так широко, как сейчас, прямым образом влияя на репутацию компаний. Таким образом, в кризисных условиях именно регулярный контроль работы сайтов и приложений, а также оперативная реакция на всплески пользовательской активности могут стать долгосрочным конкурентным преимуществом для любого бизнеса.
Денис Яковенко, региональный директор AppDynamics в России и СНГ