Однако выпущен для нее и "SQL"-движок запросов в реальном времени -- Impala от Cloudera (исходники тут). Так, можно формировать запросы SELECT, JOIN и вызывать агрегатные функции (на HiveQL). SQL-подобные запросы работают, что интересно, с данными из Hadoop Distributed File System и HBase.
Даже Microsoft, пораженная величием проекта Hadoop , отказалась от собственных наполеоновских планов создания оригинального хранилища для Больших данных (соответствующий многолетний проект известен как Dryad), и заключила соглашение с фирмой Hortonworks, поставщиком коммерческого Hadoop-дистрибутива, на создание комплекта Hadoop для Windows Azure и Windows Server.
Соответствующая стыковочная технология получила название HDInsight, и ее превью можно скачать тут.
Что получится теперь из "дружбы" MS и Hadoop, крайне интересно)