НовостиСобытияКонференцииФорумыIT@Work
Идеи и практики автоматизации:

Блог

От NoSQL и Hadoop к BIзнес-аналитике

Сергей Бобровский
19.12.2012 11:40:53

Новый тренд -- от универсальных технологий (наподобие СУБД) к системам, специфичным для задач BI, выявила аналитическая группа Forrester. Насколько этот тренд выражается в реально происходящих на рынке событиях?

В принципе, любое развитие некоторой системы можно притянуть за уши к нужному тренду. Например:

1) Amazon выпустила SDK, который позволяет обращаться к ее СУБД DynamoDB, а также S3, EC2 и Simple Workflow Services через JavaScript.

Казалось бы, при чем здесь BI? Однако эксперты Forrester заявляют, что мобильность в BI уже не просто маст хэв, это фишка, жизненно необходимая соответствующим продуктам, дабы не потеряться на рынке. Что интересно, на этом фоне в BI полная беда с облаками -- менее 2% реализовали BI-систему в облаках, и менее 4% планируют это в ближайшие два года.
Ну а где мобильность (как минимум, доступ к аналитическому движку с мобильных гаджетов), там прежде всего и JavaScript как наиболее простая технология для организации кросс-платформного мобильного доступа к системе из браузеров.

2) Новая версия NoSQL-СУБД Couchbase Server 2.0 (среди ее пользователей -- Zynga и Starbucks), ранее поддерживавшая лишь схему "ключ-значение", теперь работает с новой моделью документа, в полноценном JSON-формате (то есть стала и документоориентированной). И индексация, и запросы Couchbase также понимают JSON. Поддерживается в Couchbase распределенная модель MapReduce (написана на JavaScript), добавилась кросс-ЦОДовская репликация. Утверждается, что в кластере с десятками узлов в крупных проектах обеспечивается субмиллисекундное время отклика. AOL хранит в Couchbase полмиллиарда документов, обработка одной такой "записи" требует 40-50 мс.

Применительно же к задачам BI, именно новая способность эффективного доступа к деталям документов делает Couchbase хорошо пригодной для быстрой аналитики реального времени.

3) "Графовая" СУБД Neo4j, которую одно из авторитетных международных ИТ-изданий назвало в сентябре лучшей опенсорсной СУБД, получило 11 млн долл инвестиций. Neo4j особенно важна в задачах, где присутствуют длинные "взаимосвязи" между данными -- классические РСУБД эффективно работают лишь с цепочками длиной 2-3 связи. А Neo4j таким образом отлично подходит для множества специфических BI-задач, от анализа социальных сетей до выявления телекоммуникационных мошенничеств. На выделенные деньги Neo Technology постарается сделать кластерный вариант Neo4j, потому что пока она работает только на одной машине, что большой минус.

4) Активно развиваются BI-технологии в рамках Hadoop (которая уже вполне созрела для использования в критически важных инфраструктурах).
Так, в ноябре-декабре сообщили о своих BI-решениях для Hadoop (подчас весьма дорогих) компании Datameer (для обработки Больших данных на типовом оборудовании), Karmasphere (задействовав СУБД Hive), Hortonworks (дочерняя фирма Yahoo, которая сама по себе крупнейший пользователь Hadoop), Platfora (экспериментальные технологии, когда нужную информацию можно получить за минуты или часы -- в сравнении с классическими реляционными хранилищами, которым на схожих объемах требуются дни или недели).

BI-зоопарк активно наполняется, и в этой связи Forrester выделяет очевидную тенденцию использования в компаниях множественного BI-инструментария, отмечая и естественную востребованность технологий консолидации BI-продуктов.

P.S. В тему необходимо отметить вышедшую на этой неделе Oracle NoSQL Database 2.0 -- Berkeley DB, переписанную на Java. Она входит в основу платформы Oracle Big Data, состыкованную с Hadoop, ну а сделано на Java, видимо, чтобы выглядело "по-взрослому", а не для кустарных проектов на коленке.

Комментариев: 0

Только зарегистрированные и авторизованные пользователи могут добавлять комментарии