В марте в Москве состоялся открытый фестиваль по анализу данных Data Science Week, посвященный технологиям глубокого обучения и искусственного интеллекта. Придя к началу мероприятия, свободного места в зале я найти не мог: сотни две молодых программистов (средний возраст около 25 лет) уже заняли не только расставленные, но и наспех позаимствованные из соседнего кафе стулья.

«Ребята, вы собрались в правильное время! — начал свой телемост-разговор с аудиторией Николай Давыдов (инвестиционный фонд Gardian Capital). — Мы инвестируем во все, что так или иначе связано с искусственным интеллектом — в машинное обучение, глубокое обучение, большие данные. Наш бизнес напрямую зависит от точности прогноза, поэтому говорю с большой долей уверенности: нейронные сети и искусственный интеллект — это ворота в будущее. В XX веке люди научили компьютеры решать простые счетоводческие задачи. Теперь пришло время более сложных машинных задач — в области генной инженерии, роботизированной хирургии, медицинской диагностики и создания новых лекарств. На очереди — автоматизация журналистики и юриспруденции, профилактика правонарушений и „умные“ контракты».

Он привел данные аналитической компании Quid, согласно которым искусственный интеллект за последние пять лет привлек более 20 млрд. долл. А TechSciResearch прогнозирует рост рынка производства продукции с искусственным интеллектом к 2018 г. до 37 млрд. долл.

«Сегодня дата-сайентист — одна из самых высокооплачиваемых профессий. Огромное количество специалистов по ИИ приходится на постсоветские страны — Россию, Украину, Белоруссию. Эти три страны выпускают по 300-400 тыс. ИИ-специалистов ежегодно. Но вот парадокс: в реальных проектах занята лишь малая часть этих людей, — продолжил Николай Давыдов. — Почему индустрия не генерирует достаточных поток задач для дата-сайентистов? В чем сегодня главная проблема в этой области? В том, что мы как бы понимаем фантастические возможности искусственного интеллекта. Но до сих пор плохо понимаем, где и как их можно применить. Плохо понимают это и такие, казалось бы, прицельно занимающиеся ИИ гиганты, как Facebook, Google и им подобные. Где можно применить ИИ? Везде! А как конкретно? Разводим руками. Те, кто умеют создавать хорошие решения, как правило, не умеют запускать их в рынок. А главное — плохо разбираются в предметных областях возможного приложения искусственного интеллекта. Пытаясь решить эту проблему в обход, гиганты индустрии предпочитают приобретать стартапы, которые уже сложились как команды, уже сделали какой-то продукт, и кто-то уже начал этим продуктом пользоваться».

По его данным, в 2016 г. IBM приобрела 14 ИИ-стартапов, Google — 12, Microsoft — 9, Facebook — 8 и Amazon — 4.

«Сегодня проблема дата-сайентистов — в том, что они мало общаются с представителями предметных областей бизнеса. А потом еще оказывается, что не всегда достаточно собрать их в одном офисе: важно, чтобы они научились понимать друг друга и работать над решением общей задачи. Вот с этим во всем мире большие трудности. Дефицит предметных знаний у дата-сайнтистов приводит к тому, что технологии нейросетей все больше проскакивают мимо реальных задач и заворачивают в сферу развлечений. Появляются огромное количество аттракционов типа „Маскарада“ или „Призмы“. Но я призываю всех, кто собирается заниматься искусственным интеллектом: не идите в развлекуху! Ищите применение в медицине, сельском хозяйстве, генной инженерии, строительстве. Вникайте, как устроен их бизнес и какие конкретно проблемы стоят в их предметной области. Тогда вы будете знать, что там можно автоматизировать и ускорять и как получать потрясающие бизнес-результаты», — призвал Николай Давыдов.

Он привел пример некой медицинской лаборатории, которая проводит тесты на наличие у пациентов различных возбудителей болезней. «Анализы занимают очень много времени. Почему? Потому что их проводят люди, которые смотрят в микроскоп. А теперь мы монтируем в микроскоп веб-камеру, она делает снимки, передает их в дата-центр, и оттуда мгновенно возвращается результат. После внедрения новинки пропускная способность лаборатории — уже не 10 человек в день, а 10 тыс. А стоимость анализа — не 5 тыс. долл., а всего пять. И рынок становится гигантским, даже в Африке люди могут позволить себе сделать такой тест. Вот за счет таких проектов и ожидается, что в мировой экономике появятся десятки миллиардов новых долларов. Мы стараемся идти этим путем. Недавно мы провели встречу с представителями нескольких крупных корпораций, которые выращивают сельхозкультуры. Подумали-подумали вместе — а давайте возьмем снимки полей со спутников и сопоставим с тем, в каком году какой был с каждого поля урожай. Вот уже и основа для прогнозирования! Просто? Просто! Давайте усложним и запустим исследование: какой квадратный метр какого поля каким удобрением нужно поливать?», — рассказал Николай Давыдов.

По его словам, 90% всех накопленных человечеством данных введены в информационные системы в течение последних двух лет. При этом 80% данных являются неструктурированными. «Человечество собрало неимоверное количество данных про все на свете, и теперь не знает, что с ними делать». — отметил он.

На вопрос, что произойдет быстрее — предметник освоит работу с нейросетями или дата-сайентист станет экспертом в предмете, Николай Давыдов ответил категорически: оба пути тупиковые! «Математик, хорошо разбирающийся в искусственном интеллекте, чтобы освоить до нужной детализации предметную область, должен потратить 10 лет жизни. Ему это нужно? Равно как и продвинутый эксперт-предметник не станет переучиваться 10 лет на математика. Нет, здесь нужно другое: создавать команды и внутри них искать и находить взаимопонимание на уровне универсальных основ и высоко абстрактных концепций — и о том, какие проблемы стоят в той или иной предметной области, и том, как работает искусственный интеллект», — уверен он.

Практически о той же проблеме, но в ином развороте, рассказал Александр Сербул («1С-Битрикс»). «Глубокое обучение застало программистов врасплох, — признался он. — Оказалось, почти все они плохо знают математику. А без математики в обучении нейронных сетей — ну никак! Беда в том, что большинство математиков, как правило, ничего не понимают в программировании, а большинство разработчиков — полные нули в математике». В доказательство своих тезисов он провел небольшое социологическое исследование и был посрамлен: оказалось, что 99% из присутствующих пишут код. И около половины из них понимают смысл терминов «скалярное произведение векторов», «теория вероятности» и «линейная алгебра». И тем не менее, проблема есть, и проблема серьезная. Просто, похоже, выборка оказалась смещенной: в зале собрались наиболее любознательные и продвинутые юноши и девушки из столичной индустрии data science.

«Глубокое обучение нейросетей — это очень хороший, достойный вызов для математиков, разработчиков и аналитиков. Наша сила — в единстве! Призываю всех и в первую очередь себя — учиться обмениваться знаниями и искать синергию математиков и программистов!», — закончил свое выступление Александр Сербул.