Компания Hortonworks предлагает для свободного скачивания дистрибутив Hadoop, включающий учебные курсы для начинающих использовать технологию больших данных.

Компания Hortonworks, ведущий разработчик дистрибутива Apache Hadoop, анонсировала свой новый продукт, который поможет крупным предприятиям быстро овладеть технологией больших данных.

Компания предлагает систему Hortonworks Sandbox, которую можно бесплатно скачать с ее сайта. Этот дистрибутив имеет размер 2 Гб и представляет собой автономную виртуальную машину с предварительно сконфигурированной системой Apache Hadoop. По существу это персональная переносимая автономная Hadoop-среда с набором практических пошаговых учебных руководств, которые дают возможность пользователю самостоятельно изучить и освоить Hadoop.

По утверждениям представителей Hortonworks, этот продукт позволяет получить представление о технологии больших данных всего за 15 мин. В любом случае, он обеспечивает последовательное приобретение навыков работы с Apache Hadoop для тех, кто интересуется изучением, оценкой пригодности или использованием технологии больших данных на своем предприятии. Hortonworks Sandbox дает возможность неискушенным в новой технологии пользователям развернуть небольшой Hadoop-кластер совместно с интегрированной рабочей средой, в рамках которой, как новички, так и эксперты по работе с Hadoop, могут получить доступ к демонстрационным примерам, видео-урокам и многоуровневым учебным руководствам. Пакет Hortonworks Sandbox построен с использованием Hortonworks Data Platform (HDP) 1.2 — программной платформы с открытым исходным кодом, включающей Apache Hadoop. По заверениям официальных представителей Hortonworks, эта платформа обеспечивает обработку огромных массивов данных простым для персонала предприятий способом.

Apache Hadoop — это программное обеспечение с открытым исходным кодом для создания распределенных приложений для интенсивной работы с данными. Такие приложения могут запускаться на больших кластерах стандартной архитектуры. Метод функционирования Hadoop заключается в разбиении всего вычислительного задания на множество небольших фрагментов, которые могут выполняться на любом узле кластера. Как базовая технология работы с действительно большими данными, Hadoop обеспечивает работу с тысячами компьютеров и петабайтами данных.

Команда компании Hortonworks, состоящая из архитекторов, разработчиков и операторов, занимающихся Apache Hadoop, обещает регулярно пополнять набор учебных материалов, обеспечивая информацией как о партнерских решениях, так и о новых все более продвинутых учебных руководствах. Кроме того, пользователи пакета Hortonworks Sandbox могут загружать в него собственные наборы данных для проверки технологии Hadoop на собственных архитектурных решениях.

Hortonworks Sandbox является идеальным решением для разработчиков, которые хотели бы освоить программный интерфейс Hadoop без развертывания кластера, отмечают представители компании. Имея виртуальную машину, пользователям даже не нужен выход в Интернет, если у них установлен Sandbox и подготовлены необходимые наборы данных.

В связи с выходом Hortonworks Sandbox, официальное заявление сделал Пол Росс, вице-президент по маркетингу продукции компании Alteryx, разрабатывающей ПО в области бизнес-аналитики. “Компании Alteryx и Hortonworks объединили свои усилия в целях достижения того, чтобы максимальное число организаций получило наибольший эффект от применения технологии больших данных, — заявил Росс. — Пакет Hortonworks Sandbox позволит заказчикам быстро строить приложения бизнес-аналитики для больших данных на основе корпоративной версии Apache Hadoop”.

Упрощая процессы обучения и тестирования Apache Hadoop, компания Hortonworks дает возможность организациям оценить технологию Hadoop и соответствующие средства бизнес-аналитики, что помогает “гуманизировать большие данные” при использовании решений компании Alteryx, заявил Пол Росс.

Кроме того, загрузив Hortonworks Sandbox, пользователи получают доступ к среде, в которой они могут изучить и оценить возможности базовых проектов семейства Apache Hadoop, таких как Apache Pig, Apache Hive, Apache HCatalog и Apache HBase, входящих в состав платформы на основе технологии больших данных и построенной по принципу открытых исходных кодов. Интегрированные учебные руководства разработаны с учетом практического опыта тренинг-команды компании Hortonworks, которая создает учебные курсы по разработке приложений с использованием Apache Hadoop и средствам его администрирования. Эти курсы вобрали в себя опыт подготовки многих тысяч пользователей, которые прошли обучение в специальном университете компании Hortonworks.

“Большому количеству ИТ-профессионалов необходимы элементарные практические знания по Hadoop, прежде чем они смогут осуществить свой первый оценочный или аналитический проект в этой сфере, — заявил Филип Руссом, директор по исследованиям Институту хранилищ данных (The Data Warehousing Institute, TDWI). — Хотя в Сети достаточно источников, с которых может быть загружен Hadoop, но овладение методами работы с платформой, которая является новой для вас, может занять очень много времени и дать не всегда положительные результаты”.

Дистрибутив же Hortonworks Sandbox снабжает пользователя демонстрационными примерами, видео-уроками и пошаговыми практическими руководствами, что позволяет сделать обучение технологии Hadoop “более быстрым и эффективным”, заключил Руссом.