Форсайт Д., Понс Ж. Компьютерное зрение. Современный подход. Пер. с англ. М.: Издательский дом "Вильямс", 2004. - 928 с.: ил.
Этот фундаментальный труд двух специалистов Берклийского и Иллинойского университетов представляет собой набор самостоятельных и проверенных на практике курсов лекций по компьютерному зрению (КЗ). Он разбит на 7 частей и 26 глав. Для понимания материала требуется достаточно серьезная физико-математическая подготовка (в объеме технического вуза).
В первой части рассматривается работа фото- и видеокамер разных конструкций. Описаны принципы построения аналоговых и цифровых камер, даны геометрические модели их функционирования и методы калибровки, рассказано о физике цвета. В каждой главе используется математический аппарат, объясняющий поведение световых лучей, теней, затенений и т. п.
Базовая теория и практика КЗ раскрывается во второй части. Читатель знакомится с математическими и алгоритмическими способами обработки и анализа одного изображения, с использованием линейных фильтров для его сглаживания и преобразования, технологиями выделения краев объектов и распознавания текстур.
Изложенный материал обобщается и развивается в третьей части, где даны подходы к анализу объектов, представленных несколькими изображениями. С нее, собственно, и начинается рассказ о реальном компьютерном зрении, так как по одному изображению нельзя определить, например, глубины точек в исследуемых сценах и связанные с ними лучи проекций. В качестве первого приложения КЗ рассмотрены системы стереозрения, возможности которых необходимы при построении автономных роботов. Из третьей части читатель также узнает и о более сложных подходах к КЗ и принципах создания систем активного зрения, когда положение камер и их параметры могут со временем меняться.
Высокоуровневому логическому исследованию изображений отведена четвертая часть книги. В ней вводится понятие о сегментации и сборке формального описания сцены по набору ее изображений. В этой связи рассматриваются алгоритмы кластеризации, подбора моделей, вероятностные методы исследований и т. д. Особое внимание уделено определению траектории движения объекта.
Два следующих раздела знакомят с другими способами понимания содержимого изображений. В пятой главе объясняются принципы зрения на основе моделей, когда выявляются количественные и качественные взаимосвязи между ключевыми элементами сцены и задаются эффективные способы определения расстояния до ее различных точек. В шестой главе предлагается способ понимания содержимого изображений путем его сравнения с шаблонами разной сложности и объясняется, как при этом учитывать возможные деформации элементов сцен, что необходимо, если в движении находится много связанных друг с другом шаблонов.
В приложении, по построению фактически ничем не отличающемся от предыдущих частей, можно познакомиться с организацией библиотек цифровых образов и способами эффективного поиска в них нужных сведений, а также с методами синтеза изображений.
В силу естественных ограничений на объем в книге не рассмотрен ряд достаточно принципиальных тем, например отслеживание объектов с нелинейной динамикой, некоторые новейшие концепции КЗ (деформируемые таблицы, мозаики и т. п.). Впрочем, ряд таких глав доступен в электронном виде на сайте авторов, а другие войдут, как ожидается, во второе издание.
Данное пособие отличается хорошо подобранными примерами и упражнениями в конце каждой главы, достаточно интересными сами по себе и подчас представляющими готовые технические задания для прикладных проектов. Возможность глубокого знакомства с различными аспектами КЗ будет интересна робототехникам, создателям систем обработки изображений и компьютерной графики и всем, кто интересуется теоретическими и практическими аспектами этого перспективного направления. Книгу можно использовать как учебный курс, пособие для самостоятельного изучения КЗ или справочную основу для создания собственных систем машинного зрения, благо в ней достаточно подробно раскрыты математический и алгоритмический аппараты и указаны важнейшие направления прикладных разработок.