Разговоры об импортозамещении, развернувшиеся в последнее время, все чаще апеллируют к возможности использования в отечественных проектах ПО Open Source. В частности, говоря об альтернативных СУБД, обычно вспоминают свободные продукты PostgreSQL и MySQL. Законный вопрос: чем объясняется популярность таких продуктов, отражает ли она их функциональные возможности и соответствует ли масштабам реального использования. Кое-какие выводы позволяет сделать очередное исследование, проведенное ресурсом DB-Engines (датировано августом 2014 г.). В нем представлен рейтинг популярности с оценкой в баллах, на трех верхних позициях которого расположились Oracle Database, MySQL и Microsoft SQL Server.

Любопытно, что эти три продукта получили оценку более 1000 баллов, а следующие за ними PostgreSQL и MongoDB (ориентированная на хранение документов) — немногим более 200. А где же один из лидеров мирового рынка IBM DB2? Здесь же с оценкой 206 баллов на «почетном» шестом месте. Не забыты общественностью некогда весьма популярные Informix (17-е место) и Ingres (35-е), а вот активно пропагандируемая новая SAP HANA с 22 баллами пребывает на скромном 23-м месте. Столь необычное ранжирование заставляет задуматься о том, что же понимается под популярностью того или иного продукта.

Для своих оценок DB-Engines учитывает следующие факторы:

1. Количество упоминаний о продукте в Сети, оцениваемое по результатам поисковых запросов (Google и Bing).

2. Количество обрабатываемых поисковых запросов о тех или иных продуктах по статистике Google Trends.

3. Интенсивность технических дискуссий в Сети. Измерялось количество вопросов и число участников обсуждений на сайтах Stack Overflow и DBA Stack Exchange.

4. Количество предлагаемых вакансий с упоминанием определенной СУБД.

5. Число профилей участников профессиональной социальной сети LinkedIn, в которых упоминается продукт.

6. Засвеченность в социальных сетях (измерялось количество твитов в Twitter с упоминанием конкретной СУБД).

Поскольку итоговый балл вычисляется DB-Engines по некой сложной методике, трудно судить, какой из приведенных выше факторов имеет больший вес, но, как мне кажется, рейтинг скорее свидетельствует об интенсивности разговоров о продуктах, а не реальном их использовании. Тем не менее, какие-то тренды на этой основе можно зафиксировать. К примеру, в первой пятерке только PostgreSQL продемонстрировала положительную динамику популярности по сравнению с прошлогодними результатами. Абсолютно доминируют в этом списке реляционные СУБД (86%), за которыми следует средства хранения документов (5%), БД поисковых машин (2,8%) и движки, обрабатывающие таблицы ключ/значение (2,6%). Наблюдается снижение популярности коммерческих продуктов (с 65% в январе 2013 г. до 60% в июле нынешнего) в пользу опенсорсных.

Как влияют на популярность число внедрений, рыночные доли продуктов или масштабность проектов из данного исследования, узнать по понятным причинам невозможно. Нужно просто отдавать себе отчет в том, что отражает тот или иной рейтинг, а не полагаться только на него при выборе стратегии или программного продукта.


Версия для печати (без изображений)