Платформа Yandex.Cloud открыла общий доступ к сервису для разработчиков машинного обучения Yandex DataSphere. Сервис помогает компаниям и индивидуальным разработчикам снизить стоимость создания и эксплуатации моделей машинного обучения, автоматически управлять объемом и типом вычислительных ресурсов, сократить потерю времени на создание и организацию среды разработки. В открытом доступе Yandex DataSphere будет с 1 октября.

Глобальные расходы компаний на искусственный интеллект по прогнозам IDC удвоятся в течение следующих четырех лет с 50 млрд долларов в 2020 году до 110 млрд в 2024 году. Расходы российских компаний на ИИ составили по итогам 2019 года 172 млн долларов с прогнозом роста на 30% ежегодно. Разработки на базе машинного обучения уже активно применяют многие российские компании. Например, в медицине для создания решений анализа снимков, в ритейле для разработки рекомендательных систем.

«Методы машинного обучения становятся все более популярным инструментом для бизнеса во всем мире. Но для многих компаний он все еще недоступен из-за высокого порога входа и стоимости необходимых вычислительных ресурсов. Для решения этих задач мы создали DataSphere, где вы можете получить готовую ML-среду одним нажатием кнопки. В DataSphere доступны разные виды вычислительных ресурсов — от классических мощностей до GPU и распределенных вычислений, а тарификация происходит только за фактически потребленные серверные мощности во время выполнения ваших задач», — прокомментировал Алексей Башкеев, руководитель платформы Yandex.Cloud.

В Yandex DataSphere впервые в мировой практике публичных облаков применена технология бессерверных вычислений при разработке моделей машинного обучения. Технология автоматизирует управление ресурсами и позволяет добиться значительной экономии. В DataSphere при редактировании и просмотре кода не задействуются вычислительные ресурсы CPU или GPU, виртуальная машина нужного типа подключается только на время непосредственных расчетов (обучение моделей, запуск, другие вычисления). В результате пользователь платит только за реально потребленный вычислительный ресурс. Время редактирования и просмотра кода, работа случайно не выключенной виртуальной машины не тарифицируется. По результатам тестирования DataSphere, в котором приняли участие 200 пользователей из различных сфер, время простоя вычислительных мощностей при разработке машинного обучения составляет 50–70%. При использовании DataSphere это время не будет тарифицироваться.

Также впервые в мире в Yandex DataSphere реализовано бесшовное переключение между разными типами вычислительных ресурсов. Это значит, что в рамках одного сценария обучения модели пользователь может применять разные типы виртуальных машин — экономичные с обычными процессорами (CPU) и быстрее с GPU (графические ускорители). Прогресс обучения модели при этом сохранится. В большинстве облачных сред разработки машинного обучения расчет модели обучения может вестись только на машине одного типа.

Третья уникальная функция DataSphere, которой нет в других облаках — сохранение версий расчетов модели, включая данные, код и состояния. Эта делает процесс разработки машинного обучения более выгодным для бизнеса: достигнутый прогресс в обучении не теряется, его можно воспроизвести при необходимости.