Сразу две “СУБД-в-памяти” вышли на рынок в октябре: GridGain и hServer от ScaleOut. Более того, они объединены одной целью — скоростной поддержкой платформы распределённых вычислений Hadoop. С точки зрения пользователя-разработчика, схемы эксплуатации этих систем почти идентичны: они ускоряют работу MapReduce-кода, обрабатывающего данные, хранящиеся в ОЗУ, а не в файловой системе Hadoop HDFS. Заторможённое выполнение пакетных операций MapReduce стало уже притчей во языцех, и хотя эта технология в грядущем Hadoop 2.0 будет полностью пересмотрена и станет рядовой реализацией, легко заменяемой на иные альтернативы, на текущих дистрибутивах Hadoop развёрнуто уже столько проектов по обработке больших данных, что ПО для текущей версии ещё долго будет пользоваться хорошим спросом.

Наш соотечественник Никита Иванов, основатель GridGain, полагает, что классические подходы к обработке информации уже достигли своего предела, и требуются кардинально новые подходы к этой теме. Так, если SAP HANA с помощью запросов сперва извлекает из Hadoop-кластера “сырые” данные, и только потом их анализирует, то технологии GridGain и ScaleOut подразумевают уже тесную интеграцию с внутренним устройством Hadoop, благо эта система свободно доступна в исходных текстах.

Версия для печати