НовостиСобытияКонференцииIT@Work
Облака/ИТ-сервисы:

Блог

Hadoop как сервис

В продолжение поднятой мною темы "Big Data как сервис" хочу обратить внимание, на объявление стартапом Altiscale, созданным в 2011 г. выходцами из Yahoo и Google, доступности облачного сервиса Hadoop as a Service (HaaS). В своем блоге CEO Altiscale Рейми Стата, занимавший в свое время пост CTO в  Yahoo, отмечает, что пользователи, подписавшиеся на HaaS, смогут хранить в распределенной файловой системе HDFS на облаке свои данные объемом от десятков терабайт до петабайт и обрабатывать их там же, не задумываясь о вопросах масштабирования, управления и отказоустойчивости. Оплачиваться сервис HaaS будет, исходя из используемого клиентом пространства хранения и времени, реально затрачиваемого на процессорную обработку. Иными словами, его не следует рассматривать как Hadoop-кластер, развернутый на облачной IaaS-инфраструктуре. Пока что у Altiscale около десятка клиентов, работающих, в основном в области цифровых медиа и рекламе, а также разработчики SaaS-решений. Два из них планируют довести к концу нынешнего года объем загруженных данных до петабайта.
Митин Владимир
 
Оплачиваться сервис HaaS будет, исходя из используемого клиентом пространства хранения и времени, реально затрачиваемого на процессорную обработку.

Потребное ему пространство хранения клиент оценить, видимо, в состоянии, а вот как он может хотя бы примерно оценить время на обработку этих данных?  
Свинарев Сергей
Пока опыта не наберется, методом тыка. Возможно, поставщик сервиса подскажет: у него, вроде бы, реальный опыт есть.
Платить все равно будет только за реальное время работы процессоров.