Блокчейн Искусственный интеллект Open Source Интернет вещей Big Data/Аналитика Цифровая трансформация Инновации	Сети/Серверы/СХД/ЦОД ПК и периферия Мобильные решения Инфраструктура	Документооборот/ECM Идеи и практики автоматизации Промышленная автоматизация ИТ-менеджмент Автоматизация	Государство и ИТ ИТ-бизнес ИТ-индустрия	Облака	Безопасность
Идеи и практики автоматизации: Статьи Новости компаний Решения

Блог

Hadoop возглавил NoSQL-оппозицию

Не задан ID пользователя.

05.12.201110:3505.12.2011 10:35:24

Интересно, что выступление бывшего директора ЦРУ с критикой облачных технологий состоялось на конференции MarkLogic, где традиционно тусуются ведущие проектировщики баз данных и крупных систем. MarkLogic вполне можно назвать компанией, оппозиционной классическим SQL-системам -- ее движки обрабатывают XML-данные, а запросы формируются с помощью языка XQuery. При этом MarkLogic хорошо справляется с Big Data, без проблем обрабатывая базы с неструктурированными данными объемом несколько сотен терабайтов -- за что, кстати, компания получила в ноябре UK IT Industry Award 2011 за лучшее организационно-техническое решение года. А среди крупных пользователей MarkLogic можно назвать LexisNexis.

[spoiler]Но лидером (или, точнее, задавальщиком тренда) NoSQL-движения остается Java-движок распределенных вычислений Hadoop. К его поддержке и развитию присоединяется все больше компаний -- на днях, например, о его использовании в своем новом ЦОДе объявила EMC. Неспроста и MarkLogic выпустила осенью адаптер к Hadoop. Понятно, что использовать Hadoop можно и с РСУБД, однако наибольший эффект он дает при эксплуатации NoSQL-систем.

Практически единственным ИТ-монстром, кто пока откровенно игнорирует эту технологию, остается Oracle -- хотя сторонние компании уже предлагают какие-то комбинации Hadoop и ее продуктов, а эксперты призывают эту корпорацию поспешить и, например, купить стартап Cloudera, который обеспечивает профессиональный суппорт для Hadoop. Ведь на Cloudera давно облизываются и другие ИТ-гиганты.

Не задан ID пользователя.

05.12.201110:3505.12.2011 10:35:24

Просмотров:4463 Комментариев:3

Теги: Big Data, Hadoop, MarkLogic, NoSQL

Дмитрий Менщиков

Дмитрий Менщиков 7 декабря 2011 10:41

Интересный тренд.
Думаю, что в этом NoSQL внутри там все равно подобие реляционных таблиц - для построения каких-либо индексов.
Ведь, чем структура более регулярная, тем легче ее обрабатывать (делать поиск).

Ещё

Сергей Бобровский

Сергей Бобровский 8 декабря 2011 10:53

Да, более того, индексы тут самые важные. Это собственно основная задача NoSQL -- быстро взять нужную запись по индексу. Ну и для любого поля любой таблицы (точнее, для любого элемента JSON/BSON-документа в NoSQL-базе) можно задавать прикладные индексы.

Ещё

Михаил

Михаил 11 декабря 2011 16:54

Похоже они загружают всю терабайтовую базу в оперативку, а вместо индексов - бинарные деревья.

Ещё