НовостиОбзорыСобытияIT@WorkРеклама
Идеи и практики автоматизации:

Блог

Netflix переходит с Oracle на Cassandra

Популярный сервис видеопроката и потокового мультимедиа Netflix завершает перенос своих 33 млн. пользователей с РСУБД Oracle на NoSQL-СУБД Cassandra. Объясняется это стремлением устранить простои системы, вызываемые периодической необходимостью внесения изменений в схемы данных.

[spoiler]Одно из ключевых преимуществ NoSQL перед SQL-системами, собственно, и заключается в их высокой гибкости -- NoSQL фактически бессхемны, а менять структуры данных можно на лету. Да и хранятся данные формально в свободном виде -- просто как наборы документов, каждый из которых по структуре может отличаться от другого.

В 2007-м СУБД Oracle была выбрана в качестве бекэнда в собственном ЦОДе, а уже в 2011-м число запросов к системе выросло в сравнении с 2010-м в 37 раз. В результате любые манипуляции с серверной частью в горячем режиме приводили к замедлению её работы, отключению отдельной функциональности, что сразу же вызывало гнев пользователей. Главная проблема, заявляли инженеры компании, что если вы всё держите в одном месте, то это удобно, но любой сбой вызывает проблемы. Кроме того, схемы БД постоянно менялись, так как Netflix регулярно наращивала функциональность, и внесение изменений в структуру БД  приводило к пятиминутным простоям каждую неделю. Недовольны были разработчики и ограничениями, типичными для реляционных СУБД («the limitations of a SQL database impacted our availability and scalability»).

В итоге Netflix уже тогда принялась частично перетаскивать свою систему на Amazon Web Services и разработанную в недрах Фейсбука опенсорсную Cassandra (http://cassandra.apache.org/), которая к тому же бесплатна :)
Так, поднять дополнительный облачный кластер на Cassandra можно за десять минут. А схем в этой СУБД вообще нету.

На сегодня 95% данных из БД Oracle успешно перенесены в Cassandra. На ней развёрнуто 50 кластеров с 750 узлами, система ежесекундно обрабатывает 50 тыс. запросов на чтение и 100 тыс. запросов на запись.

Любят Кассандру eBay, Twitter, Reddit и многие другие, а крупнейший Cassandra-кластер поддерживает 300 Тб данных.
Сергей Стельмах
Интересно, есть ли у Oracle своя NoSQL-система? Если нет, то ей следует поторопиться :)  
Сергей Бобровский
Что интересно, есть, так и называется Oracle NoSQL, причём уже года два. Причина, почему её не выбрали, к сожалению, за кадром. Скорее всего, потому, что либо на амазоне есть готовый хостинг под кассандру, либо кассандра хорошо в облака ставится, а оракл нет.
rav
Будем ждать когда Оракл начнет ставить Oracle NoSQL Database в свой же Oracle Cloud...  :)