НовостиОбзорыСобытияIT@WorkРеклама
Идеи и практики автоматизации:

Блог

Hadoop возглавил NoSQL-оппозицию

Интересно, что выступление бывшего директора ЦРУ с критикой облачных технологий состоялось на конференции MarkLogic, где традиционно тусуются ведущие проектировщики баз данных и крупных систем. MarkLogic вполне можно назвать компанией, оппозиционной классическим SQL-системам -- ее движки обрабатывают XML-данные, а запросы формируются с помощью языка XQuery. При этом MarkLogic хорошо справляется с Big Data, без проблем обрабатывая базы с неструктурированными данными объемом несколько сотен терабайтов -- за что, кстати, компания получила в ноябре UK IT Industry Award 2011 за лучшее организационно-техническое решение года. А среди крупных пользователей MarkLogic можно назвать LexisNexis.

[spoiler]Но лидером (или, точнее, задавальщиком тренда) NoSQL-движения остается Java-движок распределенных вычислений Hadoop. К его поддержке и развитию присоединяется все больше компаний -- на днях, например, о его использовании в своем новом ЦОДе объявила EMC. Неспроста и MarkLogic выпустила осенью адаптер к Hadoop. Понятно, что использовать Hadoop можно и с РСУБД, однако наибольший эффект он дает при эксплуатации NoSQL-систем.

Практически единственным ИТ-монстром, кто пока откровенно игнорирует эту технологию, остается Oracle -- хотя сторонние компании уже предлагают какие-то комбинации Hadoop и ее продуктов, а эксперты призывают эту корпорацию поспешить и, например, купить стартап Cloudera, который обеспечивает профессиональный суппорт для Hadoop. Ведь на Cloudera давно облизываются и другие ИТ-гиганты.
Дмитрий Менщиков
Интересный тренд.
Думаю, что в этом NoSQL внутри там все равно подобие реляционных таблиц - для построения каких-либо индексов.
Ведь, чем  структура более регулярная, тем легче ее обрабатывать (делать поиск).
Сергей Бобровский
Да, более того, индексы тут самые важные. Это собственно основная задача NoSQL -- быстро взять нужную запись по индексу. Ну и для любого поля любой таблицы (точнее, для любого элемента JSON/BSON-документа в NoSQL-базе) можно задавать прикладные индексы.  
Михаил
Похоже они загружают всю терабайтовую базу в оперативку, а вместо индексов - бинарные деревья.