Программных средств Big Data, в том числе и предлагаемых на облаке AWS, сегодня очень много и поэтому делать выбор действительно не просто. Чтобы облегчить заказчикам задачу Шива Раупати предлагает руководствоваться пятью принципами.
1. Стройте слабосвязанные системы. К примеру, параметры СХД не должны быть привязаны к процессорной мощности. Это позволит варьировать возможности системы по мере необходимости в более широких пределах.
2. Выбирайте нужный инструмент для каждой задачи с учетом структуры данных, их объема, допустимых временных задержек, шаблонов взаимодействия и т.д.
3. Применяйте управляемые (managed) сервисы. Они более эластичны, масштабируемы, надежны, безопасны и требуют меньше затрат на администрирование.
4. Стройте системы Big Data вокруг лог-файлов, содержащих всю историю работы с данными. Сегодня емкость СХД стоит не дорого, поэтому нет острой необходимости удалять лог-файлы, которые в экстренных случаях помогут обеспечить целостность вашей информации.
5. Не забывайте о стоимости. Системы на основе больших данных не обязательно должны иметь большую цену. Если первые оценки обещают очень высокие затраты, присмотритесь к более дешевым инструментам. Они, по словам Шивы Раупати, используются клиентами AWS чаще всего.