Think Big Analytics, дочерняя компания корпорации Teradata, открывает исходный код своей платформы управления озерами данных Kylo. Выигрыш для больших данных будет заключаться в самообслуживании наполнения озер данными.

Think Big Analytics выпускает платформу Kylo, позволяющую создавать озера данных на основе Hadoop, NiFi и Spark. Озера данных представляют собой большие репозитории хранения, содержащие информацию в ее изначальном формате, пока она не будет востребована.

Kylo (код размещен на GitHub) базируется на опыте работы над 150 проектами озер данных для компаний из списка Fortune 1000, заявила Teradata. Платформа создана на основе кода, созданного компанией Think Big Analytics, которую Teradata приобрела в 2014 г. Teradata планирует предлагать сервисы, обучение и поддержку на базе Kylo.

По сообщению Teradata, Kylo позволяет клиентам создавать озера данных в производственной среде всего за девять недель. Обычно это занимает от шести месяцев до года, поскольку у предприятий отсутствуют необходимые знания.

Kylo включает интерфейс пользователя для наполнения данными и их агрегирования (wrangling) посредством самообслуживания без написания кода. Самообслуживание позволяет предприятиям использовать инженеров и специалистов по данным для работы с другими проектами с области бизнес-данных.

Teradata утверждает также, что по сравнению с другими адаптируемыми к нуждам пользователей решениями Kylo лучше защищена. Подход Kylo к обеспечению безопасности строится на управлении данными и их защите в состоянии покоя.