Одним из наиболее популярных интерфейсов взаимодействия с Hadoop-хранилищами больших данных является язык SQL. В той или иной степени он реализован как в популярных опенсорсных Hadoop-дистрибутивах (Apache Hadoop, Cloudera, Hortonworks, MapR), так и в коммерческих продуктах ведущих поставщиков традиционных СУБД (IBM, Microsoft, Oracle). К ним только что присоединилась компания HP, выпустившая дополнение HP Vertica for SQL on Hadoop к своей аналитической кластерной СУБД с поколоночным хранением данных Vertica. Как утверждают в HP, их решение поддерживает более широкий спектр операторов SQL, включая join и merge, масштабируется лучше основных конкурентов и способно интегрироваться со всеми популярными дистрибутивами Hadoop. Сообщается также о поддержке файловых форматов Parquet и ORC и привлекательной модели ценообразования по числу узлов кластера. Для управления и администрирования Vertica for SQL on Hadoop использует собственный инструментарий, не полагаясь на стандартный для этой распределенной среды YARN (Yet Another Resource Negotiator).

Версия для печати