НовостиОбзорыСобытияIT@WorkРеклама
Идеи и практики автоматизации:

Блог

Интеллектуальное распознавание будет стандартизовано

Перечень приложений для устройства Kinect растет быстро, но отнюдь не так стремительно, как хотелось бы пользователям. На днях для этого расширения приставки Xbox 360, позволяющего управлять системой жестами, голосом и иными нешаблонными методами, был запущен соответствующий интерфейс для популярного ресурса потокового видео Netlix. Но Microsoft явно не ожидала феноменального успеха Kinect (продано уже более 10 млн. комплектов; да и само по себе производство миллионов качественных высокотехнологичных устройств за три месяца -- на самом деле инженерное чудо, хоть и считается сегодня делом обыденным), первоначально предложив скудный перечень игрушечек про ежика и пляжный волейбол, но контроллер практически сразу же вышел за пределы рынка игр и развлечений. Софт в Kinect проприетарный, однако он быстро был взломан, и на свет появилось немало поистине уникальных неофициальных приложений, которые активно применяются в различных компьютерных исследованиях, робототехнике и т. д.

[spoiler]К счастью, Microsoft этот тренд оперативно отследила и на прошедшей на прошлой неделе корпоративной конференции MIX 2011 сообщила, что в мае выходит полноценный SDK разработчиков для Kinect, ориентированный на ПК и Windows 7. Так, построение скелетной модели человека, попавшего в кадр, займет пять миллисекунд.

Понятно, что бум подобных технологий не ограничивается только контроллером Kinect. В  этом посте рассказывалось про всевозможный открытый софт расширенной реальности, использующий обычную веб-камеру как мощное распознающее устройство. Вот свежий пример: общедоступная система в исходных текстах Predator -- способна отслеживать перемещение любого объекта в видеопотоке в реальном времени. Страничка проекта, много наглядного видео.

Заинтересовался подобной активностью и консорциум по открытым стандартам Khronos Group (OpenGL, OpenCL), который пообещал выпустить в 2012-м стандарт StreamInput по универсальному использованию устройств наподобие распознающих веб- и 3D-камер, сенсорных планшетов и софта понимания пространственных жестов на базе кросс-платформного API.