УДК 681.327.12
Е. А. Семенчев, канд. техн. наук, доц. (4872) 35-19-80, [email protected] (Россия, Тула, ТулГУ)
СТРУКТУРНО-ФУНКЦИОНАЛЬНЫЕ АСПЕКТЫ В 3Б-СИСТЕМЕ ИСКУССТВЕННОГО ЗРЕНИЯ, ПОСТРОЕННОЙ НА ОСНОВЕ ЗАКОНА СОХРАНЕНИЯ ДВОЙСТВЕННЫХ ОТНОШЕНИЙ
Отмечается ограниченность широко используемых подходов к построению систем искусственного зрения при измерении пространственно-временных характеристик и свойств внешних объектов. Для преодоления ограничении существующих систем предлагается и исследуется подход к организации системы искусственного зрения на основе закона сохранения двойственности - универсального способа построения всех систем живых организмов.
Ключевые слова: искусственное зрение, автономные аппараты и системы, объемное восприятие.
Основу для целенаправленного поведения безлюдных активных автономных аппаратов и систем в большей мере составляет зрительная информация. Поэтому технологии искусственного зрения являются в настоящее время одними из наиболее востребованных. В дальнейшем под системой искусственного зрения (СИЗ) будем понимать программноаппаратную систему, автоматически извлекающую информацию из изображений, сформированных зрительными сенсорами.
Особое место в области обработки изображений занимает задача слежения за подвижными объектами и извлечения информации об их «намерениях». Ключевой проблемой в области разработки СИЗ для анализа реальных сцен является проблема предварительной обработки изображений с целью выделения объектов, их характерных признаков и пространственно-временных характеристик. Для выделения контурных признаков объектов на неравномерно контрастных изображениях известен широкополосный градиентный метод [1], позволяющий выделять как полезную информацию, так и отсеивать шумы в каждом конкретном узком частотном диапазоне. Оригинальный подход [2,3] слежения за несколькими подвижными целями на основе информационного подхода позволяет повысить эффективность алгоритмов слежения за счет направления «стробирующего окна» выборочно в области возможного присутствия объектов с учетом их энтропии. Одним из подходов к решению задачи определения пространственной ориентации исследуемого объекта по зашумленным изображениям является подход, основанный на использовании анизотропных свойств изображения [4,5].
В числе существенных недостатков большинства существующих подходов к организации СИЗ можно отметить следующие:
1) использование преимущественно монокулярных систем видения обеспечивающих отображение плоской проекции исследуемого объекта, что приводит к потере информации о его пространственных характеристиках.
2) алгоритмы анализа изображений в СИЗ излишне сложны в программной реализации, ориентированы на выделение контура объекта наблюдения и последующий контурный анализ, что не гарантирует от ошибок, требует больших вычислительных ресурсов и времени анализа;
3) для активных автономных объектов выделяется класс задач по измерению пространственно - временных характеристик (относительные размеры объектов, расстояния, скорости движения и т. п.) и свойств (цвет, яркость, рельеф поверхности, форма и т. п.) внешних объектов, которые существующие СИЗ не способны решать в полной мере.
Целью данной работы является построение системы, которая при изначальном незнании конкретного смысла сенсорных данных, посредством анализа последовательно наблюдаемых зрительных картин производит формирование абстрактных понятий и законов, обеспечивающих возможность достаточно полного предсказания дальнейшего хода изменения этих картин и организации на этой основе целенаправленного поведения.
Все процессы и явления подчиняются законам природы, таким как закон двойственности, закономерность иерархичности, законам ограниченности и замкнутости, принципу фрактальности [6].
Рассмотрена идея организации искусственного органа зрения, работающего на основе метода декомпозиции по двойственным парам [6]. Двойственная пара зрительных рецепторов формирует два зеркально симметричных образа объекта внимания, хранящих пространственно - временную и качественную информацию. Анализ симметрии двойственного образа объекта выделяет между значениями измеренных характеристик внешнего объекта разницу, которая участвует в формировании управляющих воздействий на эффекторы зрительных рецепторов. Объект внимания, попадающий в фокус парных рецепторов, выделяется на основе сравнения яркости суммарного изображения с некоторым порогом и запоминается в оперативной памяти образов. Повторяющиеся наслоения одного и того же образа за некоторый интервал времени формируют шаблон характерных (отличительных) черт объекта, который запоминается в долговременной памяти и используется для его распознавания при последующих восприятиях.
Принцип работы системы искусственного зрения иллюстрируется рис.1. Информация об объектах окружающей среды поступает в виде последовательности кадров через определенный интервал времени от парных рецепторов зрения - правого и левого сенсора соответственно.
Поступающие на вход СИЗ кадры преобразовываются (переписываются) соответствующим образом в матрицы, причем каждый кадр право-
го и левого сенсора имеет свою координатную систему с началом координат в центре. После чего кадры подвергаются инверсии и зеркально складываются друг с другом в совмещенной системе координат. Затем находится баланс изображения.
В процессе анализа изображения значение яркости в каждой точке матрицы (для соответствующих дальностей) сравнивается с пороговым значением: если значение выше порогового - это потенциальный объект внимания, если ниже - это фон.
Совмещение фокуса внимания с объектом ж
ПВ - порог внимания
ПЧ - порог чувствительности
О 0 0
в в
”ХУ~ Х,У
р "К"
V V
4>п
А»
Рис. 1. Принципработы системы искусственного зрения (см. также с. 237)
Окончаниерис. 1
В результате фиксируется некоторое количество потенциальных объектов внимания, находящихся на одинаковом с «центральным» объектом внимания расстоянии. Выделение иного объекта внимания может осуществляться как по скорости, так и по направлению его перемещения.
При регистрации пространственно-временных характеристик в оперативной памяти ЭВМ порождаются сразу два объекта, образующих двойственную пару (двойственный образ) для каждого потенциального объекта внимания. С образом связывается набор характеристик объекта (координаты, скорости и др.). После переключения фокуса на другой объект внимания, для него также создается двойственный образ в памяти ЭВМ.
Блок анализа симметрии характеристик объекта внимания определяет отклонения от фокуса внимания, причем со своим знаком, и передает эти данные в блок формирования сигнала управления положением эффекторов зрительных рецепторов.
В системе параллельно протекают другие процессы. Информация, полученная во время выделения потенциальных объектов внимания, параллельно поступает и в блок формирования изображения объектов, где формируются отображающие объекты векторы, которые передаются в оперативную память. Далее эта информация поступает и используется для формирования шаблона отличительных черт методами сравнения, усиления локальных областей и компарации с пороговым значением яркостей. После чего сформированный и классифицированный шаблон поступает в долговременную память образов, где он хранится и в дальнейшем используется для распознавания и классификации новых образов объектов. Принцип распознания основан на пороговом резонансе изображения объекта внимания в оперативной памяти и шаблона отличительных черт в долговременной памяти.
Параллельно тому, как обрабатывается информация об объекте внимания, происходит обработка данных о потенциальных объектах внимания, с целью возможного переключения на них фокуса внимания. Определяются направление перемещения, углы, скорости, расстояния от объекта внимания до потенциальных объектов внимания. Затем эта информация используется для выбора очередного объекта внимания. Переключение внимания на новые объекты осуществляется по установленным приоритетам (например, по степени угрозы).
Любая оптическая система воспринимает не реальные координаты точек, а угол, под которым на нее падает свет от этой точки. Поэтому положение объекта изначально задано тремя углами: ©2, 0^ и 0. Их значения очевидным образом пересчитываются из относительного положения точки на изображении и углов обзора сенсора (рис. 2).
Рис. 2. Сенсорная система координат
236
После чего осуществляем переход от этих углов к декартовым координатам. Для этого требуется знать базу системы - Ь.
Переход может быть осуществлен по следующим формулам:
Ь
У =------------,
х = у • ^ - 2 = у • гф1 + ^
z = у • гф.
После того как определены все координаты объекта в разные моменты времени, можно определить его скорость и ускорение по конечно -разностным формулам:
У
= *2 - х1 У = у2 - У1 У = ‘2 - 21
1х і ’ К1У і ' і
У1 Ч У1х2 + У1у2 + У1‘
2
где Хр Ур 2^ - координаты объекта в сенсорной системе координат на
первом кадре, ^*2, У2,22^ - координаты объекта в сенсорной системе координат на втором кадре, і - интервал времени смены кадров, У^ - начальная скорость.
>'2х ■ ^ '%=аир,. г2, -
і У і і
У2 Ч У2 х2 + У2 у 2 + У2 2
2
где *2,У2,‘2J - координаты объекта в сенсорной системе координат на
втором кадре, ^Х3, У3, ‘з ^ - координаты объекта в сенсорной системе координат на третьем кадре, і - интервал времени смены кадров, - конеч-
ная скорость:
У _ х3 - х1 У _ Уз - У1 У _ 23 - 21
у Срх і ’ у СРУ і ’ у ср‘ і ’
У =лІУ 2 і у 2 і у у ср Vу срх у срУ у ср‘
няя скорость объекта.
Теперь определим ускорение:
г, ггы объекта в сенсорной системе координат на
п - координаты объекта в сенсорной системе ко-
ординат на втором кадре; ^Х3, У3, ‘3^ - координаты объекта в сенсорной
системе координат на третьем кадре; г - интервал времени смены кадров; а - ускорение объекта.
После того, как вся необходимая информация об объекте становится известной, то есть объект распознан, она используется системой планирования действий и навигации.
Для проверки работоспособности системы была разработана и построена компьютерная модель, разработаны необходимые алгоритмы, реализующие функциональный состав программного комплекса.
В качестве чувствительных элементов системы искусственного зрения были использованы две видеокамеры, обеспечивающие частоту съемки 20 кадров/сек, с помощью которых фиксировались характеристики объектов окружающей среды. Видеокамеры были закреплены на расстоянии Ь (0,065 м) относительно друг друга (база системы). С помощью этой установки был получен видеопоток, который использовался комплексом программных средств первичной обработки изображений в реальном времени. В роли движущихся объектов использовались предметы прямоугольной, шаровой и треугольной форм.
В экспериментах фиксировались форма и размеры объектов, расстояние до объекта, их пространственные координаты, временные характеристики (скорость, ускорение).
Вычисление точечных скоростей и ускорений объектов базировалось на установлении поточечного соответствия изображений, отвечающих последовательным моментам времени, и производилось в системе на основе разработанного алгоритма в реальном времени.
В экспериментах прослеживалась зависимость между количеством повторов подачи наблюдаемых объектов и вероятностью его узнавания. На используемых объектах узнаваемость составила 94 %.
В целом опытная компьютерная модель СИЗ оказалась способна определять геометрические размеры внешних объектов, их пространственные координаты, относительное расположение, а также связывать световые характеристики со свойствами объектов при построении их целостных образов.
Уже достигнутые характеристики СИЗ позволяют ей вести наблюдение за динамическими объектами, находящимися в поле зрения системы.
Таким образом, предложенный в данной работе принципиально новый подход к построению архитектуры и алгоритмов функционирования СИЗ, основанный на законе сохранения двойственности, может быть использован при создании перспективных 3D-ceHCopHbix систем для автономных самоорганизующихся объектов.
Список литературы
1. Марр Д. Зрение. Информационный подход к изучению представления и обработки зрительных образов: пер. с англ. / под ред. С. Б. Гуревича. М.: Радио и связь, 1987, 587 с.
2. Фишер Р. От поверхностей к объектам. Машинное зрение и анализ трехмерных сцен: пер. с англ. М.: Радио и связь, 1993, 288 с.
3. Ким Н. В, Степанова Н. В. Слежение за несколькими подвижными целями на основе информационного подхода. URL: http://www.gisa.ru/3793.html
4. Осипов А. А., Морзеев Ю. В., Мурынин А. Б. Использование анизотропных свойств изображения для определения пространственной ориентации головы в задачах распознавания лица //СПИРИТ Корп./ . URL: http://www.spiritcorp.com
5. Мурынин А. Б. Автоматическая система распознавания личности по стереоизображениям // Известия РАН. Теория и системы управления. 1999. № 1. С.106-114.
6. Семенчев Е. А., Фатуев В. А. Формирование структуры и системных целей самоорганизующихся систем на основе метода декомпозиции по двойственным парам// Труды VIII Международной конференции SIPRO-09 «Идентификация систем и задачи управления»/ Институт проблем управления им. В. А. Трапезникова РАН. М., 2009. С. 299-311.
E. Semenchev
STRUCTURALLY FUNCTIONAL ASPECTS IN 3D-SYSTEM OF ARTIFICIAL SIGHT CONSTRUCTED ON THE BASIS OF THE LAW OF PRESERVATION OF DUAL RELATIONS
Limitation of widely used approaches to construction of systems of artificial sight at measurement of existential characteristics and properties of external objects is marked. For overcoming of restrictions of existing systems it is offered and the approach to the organisation of system of artificial sight on the basis of the law ofpreservation of a duality - a universal way of construction of all systems of live organisms is investigated.
Key words: artificial sight, independent devices and systems, volume perception.
Получено 09.02.10