Портал IT Business Edge рассказывает об особенностях новой технологии роботизации данных (robotic data automation, RDA).

Данные — это новая нефть, говорят некоторые, это желанный ресурс, который обеспечивает принятие решений на предприятии. Однако данные в сыром виде мало на что годятся. Их нужно добывать, очищать и перерабатывать — их составляющие превращаются в различные субпродукты, перекачиваемые по «трубопроводам», проходящим от источника до «перерабатывающего завода» и конечного потребителя.

Каждое узкое место в этой системе имеет свою цену в деньгах. Данные, на основе которых получаются неправильные аналитические результаты, по сути, являются отходами, и по мере роста массивов данных становится все более обременительной задачей извлечение нужной, наиболее ценной информации для последующего использования.

Осознавая эту проблему, несколько компаний попытались автоматизировать «остановочные пункты» на пути передачи данных — этот процесс называется роботизацией данных, или RDA.

Переформатирование данных

Корпоративные наборы данных не просто растут, во многих случаях они также собираются в реальном времени. Эти наборы представлены в различных форматах и разбросаны по разрастающейся ИТ-инфраструктуре компании — на локальных серверах, в облаках и на периферии.

Они требуют сбора, очистки, проверки, извлечения, обогащения метаданными — целая серия шагов, чтобы подготовить данные к использованию по назначению. Каждый этап может отнимать много времени, а неудача на любом этапе может привести к недостоверным результатам.

RDA стремится автоматизировать многие из этих процессов с помощью ботов Low-code, которые выполняют простые, повторяющиеся задачи, с подключением к более сложным инструментам искусственного интеллекта, таким как IBM Watson, OpenAI, GPT-3 или сотни других ботов, для выполнения задач обработки естественного языка (NLP), когда это необходимо.

По сути, простая машина призвана собирать воедино разрозненные элементы, при необходимости обращаясь к более сложным машинам, чтобы скомпилировать необработанные данные в нечто пригодное для использования. При правильном подходе такая автоматизация дает возможность предприятиям гораздо быстрее осознать ценность информации.

Инструменты RDA также могут помочь разрушить существующую парадигму работы с данными, при которой поставщики AIOps предлагают клиентам ограниченные, заранее определенные наборы инструментов для взаимодействия с данными. Они имеют ограниченные связи с другими инструментами, узкий спектр сценариев применения и ограниченные возможности форматирования данных.

Поставщики RDA утверждают, что их инструменты освобождают клиентов от этих ограничений и включают другие преимущества, такие как генерация синтетических данных, проверка целостности данных «на лету», встроенные боты ИИ и МО, поточное отображение данных, маскирование, редактирование и шифрование данных.

Другие варианты использования инструментов RDA включают:

  • обнаружение аномалий: извлечение данных из инструмента мониторинга, сравнение исторических данных об использовании ЦП для узла, затем использование регрессии для построения модели, которая может быть отправлена в качестве вложения;
  • кластеризация тикетов: компиляция тикетов из ПО для управления тикетами компании, их объединение в кластеры, а затем вывод в новый набор данных для визуализации на выбранной вами приборной панели;
  • обнаружение изменений: изучение виртуальных машин и сравнение с текущим состоянием для обнаружения незапланированных изменений.

RDA vs. RPA

Многие знакомы с роботизацией процессов (RPA). Эта старая концепция имеет сходство с RDA в том, что обе они направлены на упрощение общих задач за счет использования ботов Low-code. В чем они расходятся, так это в том, что RPA предназначена для упрощения общих пользовательских задач и рабочих процессов, в то время как RDA нацелена непосредственно на конвейер данных. Хотя и RDA, и RPA подразумевают использование простых ботов для экономии времени на трудоемких, рутинных задачах, хотя и в разных контекстах.

Типовым примером RPA является бот, наделенный возможностями МО для заполнения форм. Бот следит за тем, как человек многократно заполняет форму, пока RPA не обучится делать это правильно. Этот тип МО похож на то, как мобильные телефоны могут генерировать прогнозируемые текстовые предложения на основе разговорных привычек и словарного запаса своих пользователей.

После обучения бот может взять на себя командование заполнением формы, а также другими аспектами, такими как отправка формы к ожидаемым получателям. Хотя в долгосрочной перспективе это может ускорить процесс, обучение систем RPA может занять месяцы, прежде чем их преимущества станут реальностью.

Долгосрочная ценность RDA

Автоматизация трудоемких задач и высвобождение человеческого труда для работы, требующей больших познавательных усилий, всегда будут иметь ценность. Однако по мере ликвидации одного узкого места на его место будет приходить другое. При этом успех таких систем, как RDA или RPA, зависит от того, как их внедрили.

Естественно, инструменты должны быть разработаны должным образом для взаимодействия с целевыми наборами данных, но предприятия также несут ответственность за правильную интеграцию новых инструментов с существующими конвейерами данных.

Инструменты на основе ИИ и ПО для автоматизации все еще находятся в зачаточном состоянии, все еще ищут новые ниши и все еще совершенствуются с точки зрения того, как они предоставляют услуги. И о том, как RDA перетряхнет конвейеры данных, еще только предстоит узнать.