За последнее время было представлено множество разработок, которые стали реальностью только благодаря использованию нейронных сетей. Например, исследователи из Массачусетского технологического института разработали алгоритм, который на основании картинки создаёт короткое видео о том, что, по его мнению, должно произойти в будущем. В основе этой технологии лежат нейронные сети, машинное обучение и компьютерное зрение, сообщает New Scientist.
Чтобы научиться прогнозировать последующие моменты в кадре, нейронной сети потребовалась проанализировать 2 млн. роликов. Среди них были сцены с пляжа, поля для гольфа, вокзалов и из детских больниц. Все видео были без маркировки — то есть они не были помечены различными подсказками, помогающими искусственному интеллекту понимать, что же показано в кадре. Например, если ИИ получал снимок железнодорожного вокзала, то он мог представить поезд, отходящий от платформы. Или же, скажем, изображение пляжа могло вдохновить ИИ на «оживление» волн моря.
Интересно, что над созданием видео работали одновременно две нейронные сети: одна непосредственно заставляет объекты в кадре двигаться, а вторая определяет, является ли полученное видео реальным или смоделированным. Результат считается успешным, если сама система не смогла распознать, что это она же его и создала. На данный момент эта технология позволяет создавать ролики длиной лишь 1,5 с.
«Любому роботу, работающему в нашем мире, всё-таки необходимы некоторые базовые навыки для предугадывания будущего. Например, если человек собирается сесть на стул, то вряд ли он захочет, чтобы робот вытащил стул из-под него», — объясняет один из разработчиков новой системы Карл Водрик. В конце концов, природа наградила человека интуицией (и даже прописала её в генах). Так почему бы не одарить такого рода навыками машины?
В данный момент даже у самых продвинутых систем ИИ отсутствуют базовые возможности предсказания ближайшего будущего. Работу над этим ведут исследовательские группы в Нью-Йоркском университете и компании Facebook, но их нейросети выдают всего несколько кадров из будущего либо показывают его слишком размыто. В перспективе навыки предсказания будущего ИИ пригодятся, например, для вождения самоуправляемых машин.
Если учёным удастся научить технологию прогнозировать будущее больше, чем на 1,5 с, то это может сделать самоуправляемые автомобили ещё умнее, т. к. они смогут предсказывать движения пешеходов и других автомобилей, чтобы избегать аварий. Также эта технология может привести к революции в сжатии видео, поскольку необходимости хранить полностью все кадры больше не будет — алгоритм сможет воссоздать их в любой момент.