Спустя полгода после покупки компании Greenplum корпорация EMC выпустила бесплатную версию Community Edition популярной СУБД EMC Greenplum Database, использующей технологию обработки с массовым параллелизмом (MPP), а также бесплатные аналитические алгоритмы и инструменты интеллектуального анализа данных. Наряду с СУБД, ориентированной на аналитическую обработку больших объемов данных, предлагается библиотека аналитических алгоритмов с открытым исходным кодом MADlib, реализующая параллельные вычисления в области математической статистики и методы машинного обучения при обработке структурированных и неструктурированных данных. В комплект входит также ПО независимого от EMC производителя Alpine Miner, представляющее собой аналитический инструментарий с визуальными средствами построения моделей для интеллектуального анализа данных, а также с встроенным в СУБД движком data mining, который специально создан для приложений, имеющих дело с большими объемами данных.

СУБД EMC Greenplum Database использует параллельную архитектуру, основанную на сегментировании все БД с последующей параллельной обработкой отдельных сегментов (shared-nothing massively parallel processing, MPP) на множестве серверов стандартной архитектуры, каждый из которых владеет и управляет отдельной частью общего массива данных. Благодаря тому, что все коммуникации осуществляются через сетевое межсоединение (interconnect), здесь отсутствуют проблемы совместного доступа к данным на диске или конфликтов адресации. Версия Community Edition предназначена только для опробования, разработки приложений и исследовательских целей. Прежде чем использовать ПО для внутрикорпоративной обработки данных или в любых коммерческих либо производственных целях, предприятию придется купить коммерческие лицензии на Greenplum.

Версия для печати