НовостиСобытияКонференцииФорумыIT@Work
Идеи и практики автоматизации:

Блог

Hadoop возглавил NoSQL-оппозицию

Сергей Бобровский
05.12.2011 10:35:24

Интересно, что выступление бывшего директора ЦРУ с критикой облачных технологий состоялось на конференции MarkLogic, где традиционно тусуются ведущие проектировщики баз данных и крупных систем. MarkLogic вполне можно назвать компанией, оппозиционной классическим SQL-системам -- ее движки обрабатывают XML-данные, а запросы формируются с помощью языка XQuery. При этом MarkLogic хорошо справляется с Big Data, без проблем обрабатывая базы с неструктурированными данными объемом несколько сотен терабайтов -- за что, кстати, компания получила в ноябре UK IT Industry Award 2011 за лучшее организационно-техническое решение года. А среди крупных пользователей MarkLogic можно назвать LexisNexis.

Но лидером (или, точнее, задавальщиком тренда) NoSQL-движения остается Java-движок распределенных вычислений Hadoop. К его поддержке и развитию присоединяется все больше компаний -- на днях, например, о его использовании в своем новом ЦОДе объявила EMC. Неспроста и MarkLogic выпустила осенью адаптер к Hadoop. Понятно, что использовать Hadoop можно и с РСУБД, однако наибольший эффект он дает при эксплуатации NoSQL-систем.

Практически единственным ИТ-монстром, кто пока откровенно игнорирует эту технологию, остается Oracle -- хотя сторонние компании уже предлагают какие-то комбинации Hadoop и ее продуктов, а эксперты призывают эту корпорацию поспешить и, например, купить стартап Cloudera, который обеспечивает профессиональный суппорт для Hadoop. Ведь на Cloudera давно облизываются и другие ИТ-гиганты.

Комментариев: 3

Только зарегистрированные и авторизованные пользователи могут добавлять комментарии

Дмитрий Менщиков
07.12.2011 10:41:27

Интересный тренд.
Думаю, что в этом NoSQL внутри там все равно подобие реляционных таблиц - для построения каких-либо индексов.
Ведь, чем структура более регулярная, тем легче ее обрабатывать (делать поиск).

08.12.2011 10:53:02

Да, более того, индексы тут самые важные. Это собственно основная задача NoSQL -- быстро взять нужную запись по индексу. Ну и для любого поля любой таблицы (точнее, для любого элемента JSON/BSON-документа в NoSQL-базе) можно задавать прикладные индексы.

Михаил
11.12.2011 16:54:17

Похоже они загружают всю терабайтовую базу в оперативку, а вместо индексов - бинарные деревья.

Только зарегистрированные и авторизованные пользователи могут добавлять комментарии