Тереза Уингфилд, директор по маркетингу продуктов, и Льюис Карр, старший директор по маркетингу продуктов, компания Actian, рассказывают на портале The New Stack о том, как выстроить процессы принятия бизнес-решений на основе сочетания ткани данных и композитности.

В списке десяти главных тенденций-2021 в области данных и аналитики, подготовленном Gartner, инженерный подход к интеллектуальному принятию решений (engineered Decision Intelligence, eDI) назван растущей тенденцией, способной обеспечить успешный процесс принятия решений в бизнесе. Компании регулярно сталкиваются со сложными экосистемами передачи данных, которые задерживают сборку данных, затягивая и потенциально портя процесс принятия решений. Если организации используют eDI в сочетании с общей тканью данных (data fabric) и поддержкой композитности, они могут последовательно проложить путь к более точным, повторяемым и отслеживаемым решениям.

Прежде чем погрузиться в преимущества eDI, мы должны сначала понять, что это такое. Удобно, что его определение содержится в самом названии: это целенаправленный и структурированный процесс интеллектуального принятия бизнес-решений на основе данных. Предприятиям необходимо принимать хорошо обоснованные решения по мере развития ситуации в режиме реального времени; постфактум обычно бывает слишком поздно и приводит к неоптимальным или, что еще хуже, неудачным результатам. Это одна из основных проблем, которую пытается преодолеть eDI.

Но есть еще более фундаментальная проблема, которую необходимо решить в первую очередь. В настоящее время существует огромный арсенал DI-инструментов, которые можно использовать: от базовых запросов и отчетов до продвинутой аналитики, включая приложения ИИ и адаптивных систем. Однако все эти инструменты хороши лишь настолько, насколько хороши данные, на которых они основаны.

По мнению Gartner, это означает, что eDI — это объединение этих инструментов с общей тканью данных и поддержкой композитности, что позволяет использовать компоненты различных решений в области данных, аналитики и ИИ, тем самым прокладывая путь к принятию более точных, повторяемых, отслеживаемых и своевременных решений.

Необходимость ткани данных

Ткань данных необходима для eDI. Это архитектура, обеспечивающая согласованный набор сервисов и возможностей работы с данными в критически важных онпремисных и облачных средах. Она выступает в качестве основы, которая позволяет абстрагировать данные из систем, физически и логически различных, создавая общий набор объектов данных, которые можно рассматривать как единый набор данных предприятия.

Поскольку eDI-система должна работать с данными из систем, которые могут быть онпремисными, облачными, распределенными по нескольким облакам и даже развернутыми удаленно на периферии сети, ткань данных предоставляет возможность объединить эти источники в единую информационную сеть для работы DI-инструментов.

Используя ткань данных, вы сможете полностью реализовать потенциал своих DI-инструментов. Поскольку она позволяет быстрее и эффективнее получать доступ к данным в масштабах всего предприятия, вы получите более интегрированные и точные бизнес-инсайты и повысите гибкость бизнеса. И, поскольку благодаря ткани данных решения оказываются более операционализированными и стандартизированными, они становятся более повторяемыми и отслеживаемыми. Кроме того, поскольку DI-инструменты способны выполнять больше итераций на новых данных, открываемых тканью данных, они могут учиться на предыдущих результатах для получения более надежных и повторяющихся результатов.

Создание современной ткани данных

Внедрение современной ткани данных и раскрытие ценности ваших данных для eDI — это процесс, состоящий примерно из трех этапов:

  1. первый шаг — создание каталога метаданных, содержащего контекстную информацию о данных, к которым вы собираетесь получать доступ — например, откуда взялись данные, как они были определены и когда они были обновлены в последний раз. Метаданные делают данные более удобными для поиска и дают представление о профилях данных, используемых в DI. Эти метаданные не следует рассматривать как статичные. Вместо этого следует ожидать, что метаданные будут меняться по мере подключения дополнительных источников данных, настройки и модификации алгоритмов, а изменения результатов влекут за собой последующие изменения в бизнес-процессе;
  2. далее используйте каталог метаданных для создания графа знаний. Это обеспечивает семантический слой, который представляет каждую сущность (такие вещи, как человек, местоположение, организация, продукт и т. д.) и ее связи с другими сущностями. ИИ и машинное обучение могут обогащать метаданные, что еще больше улучшает интерпретацию и контекстуализацию данных. Это помогает пользователям получать более релевантные и быстрые ответы на запросы. Граф знаний также позволяет просматривать данные в нескольких измерениях и получать доступ к ним с помощью различных DI-инструментов — без изменения исходных данных в базовых системах;
  3. наконец, службы интеграции используют граф знаний для объединения необходимых источников данных предприятия и согласования их в общий набор данных. Эти службы должны уметь подключаться к облачным хранилищам Google Cloud Storage, Amazon S3 и Azure Data Lake Storage — а также к более обычным приложениям, API веб-сервисов, данным JSON и даже электронным таблицам. После интеграции источников данных ткань данных обеспечивает оркестровку и автоматизацию потоков данных для предоставления информации пользователям и DI-инструментам.

Сопряжение ткани данных с композитными данными и аналитикой

Ткань данных предоставляет доступ к данным из различных систем, композитность же заключается в использовании компонентов, которые работают вместе, даже если они получены из различных решений в области данных, аналитики и ИИ. Сочетание компонентов поможет вам создать гибкий, удобный и настраиваемый под пользователя опыт. Существует множество типов аналитических инструментов, назначение и ценность каждого из которых существенно различаются. Композитность позволяет вам собирать более сложные стеки решений, которые помогут вам получить новые, мощные инсайты.

Существует несколько способов улучшить возможности и поддержку композитных данных и аналитики, включая хранилища данных.

1. Расширение возможностей аналитики реальном времени за счет обработки транзакционных и периферийных данных. Лица, принимающие решения, ищут способы действовать быстрее, используя данные с миллиардов подключенных мобильных устройств и устройств Интернета вещей (IoT). Предиктивное обслуживание, управление запасами в режиме реального времени, эффективность производства и предоставление услуг — вот лишь несколько из множества областей, где аналитика данных IoT в режиме реального времени может помочь компании сократить расходы и получить дополнительные доходы.

Аналитика транзакций в реальном времени и анализ данных IoT с помощью ИИ, вероятно, будут играть все более важную роль во многих организациях. То, что мы видим сегодня, — это только начало. Получение еще больших выгод будет зависеть от способности организации предоставлять разнообразные данные для DI-решений.

Тем не менее, исторически существовало четкое различие между транзакционной базой данных и хранилищем данных. Транзакционная база данных отслеживала и обрабатывала бизнес-транзакции. Хранилище данных, напротив, анализировало исторические данные. Однако современные потребности в получении инсайтов в реальном времени сблизили эти ранее разные миры — до такой степени, что сегодня существует большой спрос на смешанные рабочие нагрузки, сочетающие транзакционную обработку и аналитику. Это можно наблюдать в самых разных сценариях применения: от автоматизированных персонализированных предложений электронной коммерции и котировок страхования в режиме реального времени до утверждения кредитов и управления портфелем ценных бумаг, и это лишь некоторые из них.

Большинство операций не выполняются в вакууме. Прибыльность и оптимизация процессов являются функцией множества операций, зависящих от поточной аналитики с запросами в реальном времени к разрозненным наборам данных, что можно наблюдать в перекрестных и дополнительных продажах, сложной конфигурации систем, системах загрузки грузов и т. д. Эта аналитика позволяет принимать автоматизированные решения и поддерживать принятие решений человеком, что необходимо для обеспечения прибыльности современных предприятий.

2. Привлекайте любые источники данных в любое время. Потребности eDI в реальном времени означают, что аналитические инструменты больше не могут полагаться только на исторические данные для получения инсайтов. Лица, принимающие решения, по-прежнему хотят иметь доступ по требованию к данным из традиционных источников пакетной обработки, но им также нужна возможность действовать в соответствии с текущими тенденциями и поведением в реальном времени. Это требует бесшовной оркестровки, планирования и управления в реальном времени потоковыми данными, поступающими от расположенных в организации и в Интернете систем, которые постоянно их генерируют.

В развивающемся мире данные должны быть доступны для анализа независимо от того, где они находятся, но только для систем и людей, которым необходимо знать и использовать эти данные. Например, лица, принимающие бизнес-решения, которые могут получать инсайты благодаря анализу полуструктурированных и неструктурированных данных в режиме реального времени, смогут более эффективно использовать возможности и повысить вероятность успеха стратегических инициатив.

3. Используйте преимущества эффективности, обеспечиваемой контейнеризацией и микросервисами. Контейнерный подход делает аналитические возможности более композитными, что позволяет более гибко включать их в приложения. Однако более выгодно, если сама архитектура хранилища данных поддерживает контейнеры — фундаментальный строительный блок для инфраструктуры микросервисов. Такая поддержка является ключевым фактором, позволяющим организации удовлетворить потребности в ресурсах, связанные с ИИ, МО, потоковой аналитикой и другими ресурсоемкими методами DI.

Развертывание контейнеров представляет собой более портируемый и ресурсоэффективный способ виртуализации вычислительной инфраструктуры по сравнению с виртуализированным развертыванием. Поскольку контейнеры виртуализируют операционную систему, а не базовое оборудование, для запуска приложений требуется меньше виртуальных машин и ОC. Архитектура на основе комбинации контейнеров и микросервисов позволяет получить бóльшую ценность при меньших ресурсах и обеспечивает превосходное средство итерации предоставляемых услуг.

4. Приспосабливайте любой инструмент. Ищите гибкость, позволяющую легко интегрировать DI с хранилищем данных. Или, если у вас есть уникальные требования, требующие создания заказных приложений, обратите внимание на инструменты разработки, поддерживаемые платформой, чтобы добиться композитности, которая необходима современной аналитической среде.

Назначение и ценность различных типов аналитических инструментов существенно различаются, и разным пользователям, включая инженеров по данным, специалистов по аналитическим данным, бизнес-аналитиков и бизнес-пользователей, нужны разные инструменты. Тем не менее, существует острая необходимость в инсайтах в режиме реального времени и в смешанных рабочих нагрузках, сочетающих транзакционную обработку и аналитику. Современное хранилище данных, способное работать как в онпремисной, так и в различных облачных средах, является одним из вариантов расширения возможностей пользователей различных платформ на предприятии для анализа чего угодно, где угодно и когда угодно, что позволяет предприятиям использовать важнейшие данные в режиме реального времени и принимать обоснованные решения. Каждый может воспользоваться преимуществами eDI — сочетание ткани данных с композитностью поможет вам встать на путь успеха.