Панорама

Игорь Буторин: «Собственная архитектура — это форма технологической независимости IT-сектора в России»

Разработчик архитектурного коммуникационного ядра, которое применялось при разработке продуктов для разных сегментов рынка …

Продуктовой разработке пора уходить с Jira

Крупные компании продолжают использовать Jira по инерции — это решение создавалось для небольших команд, но его …

Дарья Богун: «Обучение IT и криптовалютам скоро станет повсеместным»

Недавно завершился престижный международный конкурса Cases and Faсes, где отбирают самые инновационные и технологичные …

СУБД ЛИНТЕР СОКОЛ: Будьте готовы к нагрузкам будущего уже сегодня!

Пока многие разработчики борются с наследием старого кода, мы создали будущее с чистого листа. На конференции …

Как получить финансовый контроль над ИТ: интеграция ITSM+ITAM

ИТ-отдел работает как часы: заявки обрабатываются быстро, доступность услуг высокая, пользователи довольны. Но каждый …

Apache Software Foundation представил Hadoop 2.0

Сергей Стельмах | 18.10.2013

Помимо YARN и обновления в виде MapReduce 2.0 новая версия Hadoop 2.0 получила поддержку Windows

Фонд Apache Software Foundation (ASF) анонсировал выход новой версии популярной открытой программы для распределённой обработки больших массивов данных Hadoop. Это ПО использует парадигму MapReduce, согласно которой задача делится на множество более мелких обособленных фрагментов, каждый из которых может быть запущен на отдельном узле кластера. Версия Hadoop 2.0 позволяет одновременно работать со множеством приложений на серверах и имеет встроенные механизмы для быстрого и эффективного развертывания массивов данных на высоких скоростях.

Последняя версия платформы была в разработке около четырех лет и имеет несколько совершенно новых компонентов. Самый заметный из них — это YARN (Yet Another Resource Negotiator), представляющий собой дальнейшее развитие системы Hadoop MapReduce. Новая версия имеет ряд отличий, в частности, она работает в оперативной памяти сервера и управляется двумя подсистемами, одна из которых предназначается для планирования и отслеживания выполнения заданий (JobTracker), другая — для общего мониторинга системы. Ключевые компоненты YARN: ResourceManager (RM, управляет распределением всех ресурсов системы для всех приложений), NodeManager (координирует работу каждого узла) и ApplicationMaster (AM, запускается для каждого приложения и обеспечивает выполнение заданий с использованием полученных от ResourceManager ресурсов).

Технически, YARN основывается на HDFS (Hadoop Distributed File System) и работает как крупномасштабная, распределенная файловая система для больших данных. По заверению разработчиков, Hadoop и YARN предоставляют пользователям возможность работать в реальном времени с большими нагрузками и в целом повышают стабильность платформы при работе с огромными массивами данных. Одновременно с YARN Apache выпускает и MapReduce 2.0, который на уровне API совместим с прежней версией продукта. Для упрощения доступа к данным в Hadoop-хранилище разработана СУБД HBase и SQL-подобный язык Pig, который является своего рода SQL для MapReduce, запросы которого могут быть распараллелены и обработаны несколькими Hadoop-платформами.

Проект оценивается как полностью стабильный и готовый для промышленной эксплуатации. Hadoop активно используется в крупных промышленных проектах, предоставляя возможности, аналогичные платформе Google Bigtable/GFS/MapReduce, при этом Google официально делегировала Hadoop и другим проектам Apache право использования технологий, на которые распространяются патенты, связанные с технологией MapReduce.

Hadoop 2.0 также получила повышенную производительность HDFS и средства для объединения разных экземпляров HDFS (Federation HDFS); возможность создания снэпшотов данных в HDFS и поддержку доступа к HDFS через NFSv3. Новая версия Hadoop обеспечивает бинарную совместимость с существующими приложениями MapReduce, созданными для Apache Hadoop 1.0, а также поддерживает платформу Windows.

Систему Hadoop активно используют многие крупные компании, в том числе Amazon, AOL, Apple, Ebay, Facebook, Netflix, Hewlett-Packard и другие. Hadoop лежит в основе платформы Oracle Big Data и некоторых продуктов Microsoft, IBM, Teradata и SAP.

Печать Печать без изображений

Мы используем cookie-файлы, возможности Яндекс.Метрики и SberAds для наилучшего представления нашего сайта в соответствии с Политикой обработки персональных данных. Если Вы согласны с этим, пожалуйста, нажмите кнопку «Принять». Продолжая пользоваться сайтом, Вы подтверждаете, что были проинформированы об использовании сайтом cookie-файлов, Яндекс.Метрики и SberAds, и согласны с Политикой обработки персональных данных.

Apache Software Foundation представил Hadoop 2.0

Помимо YARN и обновления в виде MapReduce 2.0 новая версия Hadoop 2.0 получила поддержку Windows

Комментарии