Времена, когда базы данных существовали сами по себе как острова, прошли, утверждает компания Gartner, которая выявила наличие сильной и растущей тенденции к тому, что облачные базы данных должны стать частью «более широких экосистем данных». Аналитическая группа провела оценку участников экосистем ведущих баз данных, и результаты могут вас удивить, сообщает портал Datanami.

Gartner выпустила «2023 Magic Quadrant for Cloud DBMS (CDBMS)», в котором анализируется рынок транзакционных и аналитических баз данных, работающих в публичных и частных облаках. В магический квадрант попали 19 поставщиков облачных СУБД, среди которых доминируют AWS, Microsoft Azure, Google Cloud и Oracle.

Основной тенденцией, выявленной аналитиками Gartner, является объединение стандартных функций и возможностей баз данных с функциями и возможностями, предлагаемыми на более широком рынке инструментов управления данными, которые традиционно находились за пределами собственно СУБД.

В прошлом заказчики баз данных обычно обращались к независимым поставщикам ПО (ISV) за такими функциями управления данными, как отслеживание истории данных, управление данными, интеграция данных/ETL, качество данных и безопасность данных. Однако многие из этих функций были объединены в так называемой «ткани данных», которая обеспечивает определенную повторяемость и согласованность различных процессов управления данными.

Магический квадрант 2023 года для облачных СУБД (источник: Gartner)

Теперь, согласно Gartner, поставщики баз данных все теснее сотрудничают с поставщиками решений для управления данными, и наоборот. Поскольку базы данных являются наиболее важным звеном в стеке данных, очень важно, чтобы они хорошо (или хотя бы лучше) взаимодействовали с другими важными продуктами для управления данными, на которые компании должны полагаться, чтобы получать от данных пользу и при этом минимизировать затраты и риски.

Хотя не все поставщики СУБД сотрудничают с ISV в одинаковой степени, по данным Gartner, наблюдается явная тенденция к тому, чтобы СУБД играли важную роль в экосистеме данных.

«Облачные СУБД уже начинают взаимодействовать с другими компонентами управления данными, — пишут авторы отчета. — Это не означает, что облачные СУБД поглотят функции других систем; скорее, они будут знать о них и принесут больше пользы, взаимодействуя с ними».

По словам представителей Gartner, наблюдается «значительное расширение возможностей» участия облачных СУБД в более широкой экосистеме данных и «осознанное стремление к взаимодействию с ними»: «Прогресс в этом направлении оказался более быстрым, чем ожидалось: с момента выхода прошлогоднего магического квадранта облачных СУБД было анонсировано множество значимых решений».

Тенденция к включению в экосистему данных является более широкой и не ограничивается облачными СУБД или СУБД в целом (напомним, что в 2019 г. Gartner предсказывала, что облако узурпирует большую часть рынка СУБД, что и происходит — по данным аналитиков, в 2022 г. 55% расходов на СУБД пришлось на облако, и на облако пришлось 98% роста всего рынка СУБД).

Gartner утверждает, что к 2025 г. 90% новых внедрений решений для данных и аналитики «будут осуществляться через уже созданные экосистемы данных, что приведет к консолидации рынка данных и аналитики». Более того, аналитики утверждают, что к концу следующего года 55% ИТ-покупателей примут экосистему данных. «Это приведет к консолидации рынка поставщиков на 40%, что позволит сократить расходы и одновременно уменьшить выбор», — считает Gartner.

Рейтинги с точки зрения экосистем данных

Gartner поставила более высокие оценки некоторым облачным СУБД за их участие в экосистемах данных. Хотя компания не упоминает в своем магическом квадранте участие в экосистемах данных или их совместимость во всех 19 профилях поставщиков, в 10 из них она это сделала. Вот краткое описание того, что было сказано об этих 10 поставщиках.

По мнению Gartner, недавние партнерства Alibaba Cloud с такими ISV, как MongoDB, ClickHouse и PingCAP, продемонстрировали улучшение облачной экосистемы. «Это дает больше возможностей для выбора решений D&A [данные и аналитика] от сторонних производителей при меньших усилиях по интеграции в Alibaba Cloud», — говорится в отчете Gartner, где Alibaba Cloud представлена в квадранте лидеров.

Gartner также отмечает движение AWS в сторону экосистемы данных. У облачного гиганта есть ресурсы для перехода к более интегрированному набору решений, опираясь на работу, начатую с Amazon DataZone, сервисом управления данными, который был запущен в октябре прошлого года и состоит из портала данных, каталога данных, проектов и сред данных, а также уровня управления и контроля доступа. Однако Gartner также предостерегает от использования экосистемы, состоящей только из AWS-продуктов, поскольку это вызывает опасения по поводу привязки к вендору.

Компания Cloudera, которую Gartner отнесла к квадранту провидцев, получила высокую оценку за работу над экосистемой данных. «Cloudera продолжает инвестировать в свое лидерство в области Open Source, чтобы через сообщество стимулировать инновации с открытыми стандартами в своей экосистеме данных, предоставляя переносимые сервисы данных и искусственного интеллекта во всех облачных архитектурах данных, — говорится в отчете. — Централизованная плоскость управления во всех облачных и локальных средах обеспечивает интеграцию безопасности, метаданных и управления с прикладной наблюдаемостью и открытой экосистемой данных».

Gartner отмечает, что экосистемы, доступные через облачных провайдеров, более «тесно интегрированы» и «проще в использовании», чем экосистема Cloudera. Однако приверженность Cloudera к мультиоблачным и гибридным развертываниям, а также простота переносимости рабочих нагрузок «являются эффективным противовесом этому конкурентному давлению, которое потребует постоянных усилий для сохранения эффективности».

Компания Couchbase, которая разрабатывает базу данных NoSQL, используемую в основном для транзакционных и операционных задач, была отмечена Gartner за ее возможности в области мобильных и периферийных решений, а также за простоту использования Capella, ее сервиса управляемых баз данных. Однако, по мнению Gartner, Couchbase не хватает экосистемной поддержки, и аналитики поместили ее в квадрант «нишевых игроков».

«У Couchbase нет полноценной возможности доступа к данным или предоставления данных движкам за пределами мира Couchbase, хотя это записано в ее дорожной карте, — говорится в отчете. — Возможность широкого взаимодействия с несколькими движками в рамках экосистемы способствовала бы повышению гибкости и эффективности в различных сценариях использования, в первую очередь в аналитике и ИИ. Другие нереляционные продукты также имеют это ограничение».

Компания Databricks, которую Gartner отнесла к квадранту лидеров, получила высокие оценки за Unity Catalog, каталог метаданных компании и центр управления данными, существующими как в Databricks, так и во внешних репозиториях. Аналитики также высоко оценили экосистему данных Delta Live Tables за ее способность упрощать разработку ETL-конвейеров для потоковых, пакетных и ИИ-нагрузок.

Gartner также положительно отозвалась об участии в экосистеме данных компании Google Cloud, которая вошла в квадрант лидеров. В частности, высокой оценки удостоился Dataplex, уровень метаданных и управления, который позволяет создать более интегрированную экосистему данных.

Компания Microsoft, также вошедшая в квадрант лидеров, получила высокую оценку за готовность сделать свою базу данных более открытой и способной работать с другими продуктами компании, включая Microsoft 365, Power BI и Purview, а также с внешними решениями от ISV. «Это обеспечивает более последовательный опыт для клиентов, — говорится в отчете. — В то же время направление „единого озера“ в Microsoft Fabric обеспечивает большую открытость для данных в системах, не принадлежащих Microsoft, что может уменьшить опасения клиентов по поводу привязки к поставщику». Однако, отмечает Gartner, некоторые клиенты Microsoft выразили обеспокоенность сложностью экосистемных возможностей СУБД Microsoft, которая негативно сказывается на производительности, безопасности и контроле затрат.

Компания SAP, вошедшая в квадрант провидцев, получила высокую оценку за возможность запуска операционных и аналитических рабочих нагрузок в одной и той же базе данных HANA. Gartner также понравилась способность SAP Datasphere объединять данные SAP и не-SAP в рамках экосистемной игры. «Сейчас SAP гораздо более открыта в своих возможностях импорта и экспорта данных между средами SAP и не-SAP через обмен файлами, репликацию и федерацию», — говорится в отчете. Однако мало кто из не-SAP-клиентов будет использовать SAP для управления данными, считают аналитики. А Datasphere, скорее всего, будет использоваться клиентами со «значительным присутствием технологий SAP».

Компания Snowflake, разрабатывающая аналитическое хранилище данных и находящаяся в квадранте лидеров, была выделена Gartner за «солидные» экосистемные возможности. «Snowflake продвигает философию простого в использовании интегрированного решения, дополненного надежной системой обмена данными и меркетплейсом данных», — отмечает Gartner.

Teradata — еще один поставщик хранилищ данных, участвующий в экосистеме данных. Аналитикам Gartner, поместившим Teradata в квадрант провидцев, нравится функциональность Teradata QueryGrid, которая «эффективно реализует доступ к данным за пределами Teradata путем интеллектуального переноса обработки вниз, где это необходимо, разгружая циклы с машины Teradata и уменьшая объем данных, которые нужно возвращать в Teradata».

Очевидно, что возможности облачных СУБД не ограничиваются интеграцией с инструментами управления данными сторонних производителей и более широкими экосистемами данных. Но, как показала Gartner, экосистемный уровень базы данных становится все более важным фактором для покупателей СУБД.