Портал Datanami приводит прогнозы ряда отраслевых экспертов о том, что будет происходить в сфере корпоративных данных в 2023 г.

Показать себя

По мнению Александра Лавелла, руководителя отдела продуктов компании Fivetran, в 2023-м командам, занимающимся данными, придется сделать нелегкий выбор: «подняться во весь рост или прикрыть рты». Он считает, что в условиях широкомасштабной неразберихи в экономике самое время им блеснуть, предоставляя действенные инсайты, поскольку руководители не могут полагаться на свою интуицию, когда рынки находятся в движении. Команды, которые смогут это сделать, будут расти и приобретать все большее влияние, а те, которые не смогут, — столкнутся с растущими бюджетными ограничениями.

Реванш SQL

В 2023 г. пользователи SQL наконец-то смогут позлорадствовать, считает Майк Ваас, генеральный директор и соучредитель компании Datometry: «Отказавшись от своего первоначального боевого клича покончить с SQL, сообщество NoSQL признало, что корпоративные ИТ требуют стандартов, а вместе с ними и простоты общего, но мощного языка запросов. Практически каждая база данных NoSQL, которая еще жива, в настоящее время находится в процессе добавления SQL или SQL-подобного интерфейса. Состоится реванш SQL, когда практически любая СУБД, которая хочет быть успешной на предприятии, будет стараться выглядеть как надлежащая».

Ткань и сетка данных

Как отмечает Анхель Винья, генеральный директор и основатель компании Denodo, данные исторически проходят через фазы распределенности и централизации. Однако в настоящее время мы находимся на стадии распределенности, и данные вряд ли снова соберутся вместе, что требует новых подходов к работе с ними, включая ткань данных (data fabric) и сетку данных (data mesh).

«Между этими двумя понятиями есть внутреннее различие: data fabric — это композитный стек технологий управления данными, а data mesh — это ориентация на процесс, позволяющий распределенным группам команд управлять корпоративными данными так, как они считают нужным, — говорит Винья. — И data fabric, и data mesh могут играть критически важную роль в доступе, интеграции, управлении и доставке данных в масштабах всего предприятия, если они правильно построены и имеют соответствующую инфраструктуру». По его мнению, в 2023 г. можно ожидать быстрого роста внедрения обоих архитектурных подходов на средних и крупных предприятиях.

Постмодернистский стек данных

2022-й был годом бурных дискуссий вокруг современного стека данных, но в следующем году вы будете больше слышать о постмодернистском стеке данных, полагает Крис Любаш, CDO компании Snowplow: «Появились голоса, которые подвергли сомнению современный стек данных как таковой, поскольку разрозненный подход часто приводит к появлению множества инструментов и высоким затратам, не говоря уже о сложности объединения всего этого вместе. Начались дискуссии вокруг так называемого „постмодернистского стека данных“, и нам всем не терпится увидеть, куда это приведет нас в ближайшие годы».

Гипермасштабирование данных

Крис Гладвин, основатель компании Cleversafe, специализирующейся на объектном хранении данных (приобретена IBM в 2015 г. за 1,3 млрд. долл.), знает толк в масштабировании больших данных. Теперь, создав свой третий стартап — поставщика хранилищ данных Ocient, — он прогнозирует, что 2023-й станет годом, когда гипермасштабирование данных станет мейнстримом.

«Предприятия, интенсивно использующие данные, переходят от больших данных к гипермасштабируемым, которые растут экспоненциально. И это требует переоценки инфраструктуры данных. В 2023 г. поставщикам хранилищ данных придется разрабатывать новые способы создания и расширения систем и услуг, — говорит Гладвин. — Технологи должны планировать не только общий объем данных, но и рост наборов данных и рабочих нагрузок. Некоторые передовые ИТ-организации сегодня работают с наборами данных, состоящими из миллиардов и триллионов записей. В 2023-м мы можем увидеть даже наборы данных с квадриллионами строк в таких интенсивно использующих данные областях, как рекламные, телекоммуникационные и геопространственные технологии».

DPA и обмен без копирования

Мэтт Кэрролл, генеральный директор и соучредитель компании Immuta, считает, что в 2023 г. мы станем свидетелями роста применения соглашений об обработке данных (DPA) и обмена данными без копирования.

«DPA станут стандартными элементами контрактов SaaS и переговоров об обмене данными. То, как организации будут работать с этими договорами, в корне изменит инфраструктуры данных и определит бизнес-ценность данных. Руководители в области данных будут все больше заинтересованы в том, чтобы полностью внедрять DPA. Эти объемные документы будут сложными, но оцифровка DPA и привлечение юридических специалистов значительно упростят их понимание и реализацию», — поясняет он.

Кроме того, по словам Кэрролла, обмен данными без копирования станет новым стандартом, поскольку обмен данными продолжит расти, а команды по работе с данными и ИТ-специалисты окажутся в цейтноте. По мере того, как организации будут создавать современные стеки данных, произойдет взрывной рост размеров и количества наборов данных. Создавать копии перед обменом станет практически невозможно. Предприятия будут стремиться использовать такие платформы, как Snowflake Data Exchange и протокол Delta Sharing от Databricks, чтобы упростить безопасный обмен данными и их монетизацию.

Год приложений, основанных на данных

Как считает Дхруба Бортакур, соучредитель и технический директор компании Rockset и инженер-основатель RocksDB, 2023-й станет годом приложений, основанных на данных (data apps).

«За последние 10 лет мы наблюдали рост веб-приложений и приложений для телефонов, но 2023-й ознаменуется тем, что надежные и высокопроизводительные приложения, основанные на данных, станут важнейшим инструментом успеха, поскольку компании будут искать новые решения для улучшения работы клиентских приложений и внутренних бизнес-операций. При работе с приложениями, использующими данные по требованию (примеры: Uber, Lyft и Doordash), для клиента нет ничего хуже, чем застрять в крутящемся колесе обреченности, когда запрос не проходит. Такие приложения должны не только работать в реальном времени, но и быть отказоустойчивыми».

Освоение клиентских данных

Директор по продуктам компании Tamr Энтони Дейтон надеется на прогресс в 2023 г. в плане чистоты данных. «„Мусорные“, или „грязные“ данные — это данные неправильные, неполные, непоследовательные, устаревшие, дублирующиеся — или все вышеперечисленное, которые могут убивать ваш бизнес. Это распространенная проблема, которая часто обостряется в циклические периоды, когда вам больше всего нужны работающие данные о клиентах, — например, во время праздничных покупок и путешествий, — отмечает он. — Избежать путаницы и разочарования, а также облегчить своим клиентам опыт покупок и путешествий можно, освоив данные о своих клиентах. Это позволяет создать единое, точное и обогащенное представление данных о клиентах в различных системах и источниках, а также уникальный идентификатор, позволяющий последовательно отслеживать клиента. И в масштабе компании дает командам по продажам, маркетингу и работе с клиентами мощный способ ускорить продажи на основе данных. Не говоря уже о конкурентных преимуществах».

Долой барьеры между рабочими нагрузками

Как гласит старая поговорка, «за хорошим забором — хорошие соседи». Но это не относится к корпоративным рабочим нагрузкам, считает Энди Гутманс, вице-президент и генеральный менеджер баз данных Google в Google Cloud, который утверждает, что барьеры между транзакционными и аналитическими рабочими нагрузками начнут исчезать в 2023 г.

«Традиционно архитектуры данных разделяли эти рабочие нагрузки, поскольку для каждой из них требовалась своя база данных. Транзакционные базы оптимизированы для быстрого чтения и записи, а аналитические — для агрегирования больших наборов данных, — говорит он. — С развитием облачных архитектур данных, которые используют высокомасштабируемые, дезагрегированные вычисления и хранилища с высокопроизводительными сетями, мы прогнозируем появление новых архитектур баз данных, которые позволят выполнять как транзакционные, так и аналитические рабочие нагрузки в рамках одной системы, не требуя от приложений компромиссов в отношении требований рабочих нагрузок».

От больших данных к «умным»

В последнее время много говорят о якобы смерти больших данных. Не верьте этой шумихе, призывает Кристиан Бакнер, старший вице-президент по аналитике данных и IoT компании Altair. По его словам, поставщики будут пытаться опередить тенденции, рекламируя использование «умных» данных как альтернативу Big Data для получения более глубоких знаний. «Но, несмотря на всю эту рекламу, большие данные пока продолжают играть важную роль в бизнес-операциях. Главное — убедиться, что у вас есть простые в использовании инструменты самообслуживания, позволяющие очищать, проверять и подготавливать данные, которые затем можно подключить к модели анализа данных для получения ценных результатов и принятия обоснованных решений. В перспективе компании, которые превратят свои большие данные в „умные“, будут теми, кто выиграет от нового подхода к данным».

Питон спешит на помощь

По словам Торстена Грабса, директора по управлению продуктами компании Snowflake, на помощь в сфере демократизации данных в 2023 г. придет Python.

«Python станет более пригодным для корпоративного использования, поскольку инфраструктура среды выполнения становится все более простой и понятной, а также включает в себя больше средств безопасности и управления. В то же время, получать результат с помощью Python станет проще, а накопленный пользовательский опыт поможет легче его воспринимать и понимать пользователям, не связанным с ИТ, например, маркетинговой команде компании, — говорит он. — Python окажет такое же или, скорее всего, даже большее преобразующее воздействие на демократизацию данных, чем появление инструментов самообслуживания для бизнес-аналитики 15-20 лет назад».