КОНФИГУРАЦИОННЫЙ МЕХАНИЗМ РАЗЛИЧЕНИЯ ИЗОБРАЖЕНИЙ*
Ю.А. Чудина
Кафедра социальной и дифференциальной психологии Российский университет дружбы народов ул. Миклухо-Маклая, 6, Москва, Россия, 117198
В работе рассматривается механизм различения К-образных фигур. Геометрическое пространство, полученное методом многомерного шкалирования субъективных различий между изображениями, анализировали в терминах сферической модели различения стимулов. Анализ показал, что различение К-образных фигур осуществляется четырехканальной нейронной сетью, детектирующей конфигурационные характеристики стимулов.
Ключевые слова: многомерное шкалирование, субъективные оценки попарных различий, различение двумерных изображений, двухканальный модуль, сферическая модель различения стимулов.
Зрительное распознавание контурных изображений осуществляется набором двухканальных модулей путем выделения конфигурационных характеристик стимулов. Двухканальный модуль представлен парой оппонентных нейронных каналов, которые реагируют на существенный сенсорный признак [2; 3; 6]. Распознавание совокупности сенсорных характеристик изображения формирует функциональное взаимодействие двухканальных модулей, которые объединяются в многоканальную нейронную сеть. В рамках сферической модели различения стимулов, такая многоканальная сеть может быть рассмотрена в виде гиперсферы в многомерном евклидовом пространстве [1; 8; 11; 14]. Взаимодействие двухка-нальных модулей, распознающих конфигурационные признаки, осуществляется путем аддитивного объединения [5; 6]. Это подтверждают многочисленные исследования распознавания конфигурационных характеристик изображения [4; 5; 7], которые являются элементами «зрительного алфавита» [6; 7] и позволяют контурную спецификацию видимой сцены [9].
В настоящей работе представлены результаты экспериментального исследования зрительного различения изображений из линий. В качестве стимулов использовали К-образные фигуры, являющиеся элементами контурного изображения, которые рассматриваются как базовые признаки видимой сцены в рамках концепции машинного зрения [9]. Субъективные оценки различий между стимулами обрабатывали методом многомерного шкалирования [8; 10; 12] и анализировали в терминах сферической модели различения стимулов Е.Н. Соколова и Ч.А. Измайлова [1; 3; 10; 11; 12].
Испытуемые. В эксперименте приняли участие шесть здоровых испытуемых в возрасте 20—30 лет, среди которых было четыре женщины и двое мужчин.
Стимулы. В качестве стимулов использовали К-образные фигуры (рис. 1), которые представлены тремя линиями: одна линия-граница и две линии-стрелки.
* Работа поддержана грантами РГНФ № 10-06-00302а и РФФИ № 10-06-00438а.
Длина линии-стрелки в 2 раза меньше длины линии-границы. Середина линии-границы соответствовала центру экрана, из которого выходили линии-стрелки. Наклон всей фигуры менялся: он соответствовал вертикальной ориентации (рис. 1, 1—10-й стимулы) и отклонению от нее вправо (рис. 1, 11—20-й стимулы) и влево (рис. 1, 21—30-й стимулы) на 45 град. Линии-стрелки были по-разному ориентированы относительно друг друга и линии-границы. Всего использовали 30 изображений, которые имели в основном несимметричную конфигурацию.
Рис. 1. К-образные фигуры, используемые в качестве стимулов (номера стимулов обозначены цифрами)
Процедура предъявления стимулов. Стимулы изображались на экране компьютера белыми линиями на темном фоне. Они предъявлялись парами, и испытуемые оценивали различия между каждой парой изображений по 9-балльной шкале, где 1 соответствовало минимальное раличие между стимулами, 9 — максимальное различие, а остальные значения использовали для промежуточных оценок, которые фиксировались в памяти компьютера путем нажатия на соответствующую
цифровую клавишу. Пара стимулов одновременно предъявлялась на экране в течение 0,5 сек., затем во время предъявления темного фона (0,5 сек.) испытуемый давал числовой ответ. Каждого испытуемого просили сравнить по 435 пар стимулов из расчета п(п - 1)/2, где п = 30 при условии исключения одинаковых стимулов. Каждая пара стимулов предъявлялась на экране компьютера по 2 раза. Пары стимулов предъявлялись в квазислучайном порядке.
Для каждого испытуемого была получена треугольная матрица попарных субъективных различий между стимулами, элементом которой была средняя оценка по двум предъявлениям каждой пары изображений. После проверки матриц всех испытуемых на коррелированность их усреднили и получили матрицу усредненных по 12 предъявлениям субъективных различий между К-образными фигурами (рис. 2).
Рис. 2. Матрица усредненных субъективных различий между К-образными фигурами (Номера строк и столбцов матрицы соответствуют номерам стимулов на рис. 1)
Обработка результатов. Итоговую матрицу обработали неметрическим методом многомерного шкалирования по алгоритму Гутмана [8; 12]. В результате
было построено геометрическое пространство К-образных фигур. Для выявления структуры полученного пространства необходимо определить его минимальную размерность и сферичность [12]. Для определения минимальной размерности используют два показателя: «стресс» (5), являющийся мерой различия между исходными и полученными в результате шкалирования данными, и коэффициент корреляции (г) — величина сходства между исходными и обработанными данными. Минимальная размерность соответствует минимальному стрессу при максимальном значении коэффициента корреляции.
Таблица 1
Показатели пространственной модели попарных различий между К-образными фигурами
Показатель Размерность пространства (количество осей)
1 2 3 4 5 6
Стресс, в 0,55 0,32 0,21 0,15 0,12 0,10
Коэффициент корреляции, г 0,18 0,45 0,59 0,71 0,76 0,79
Средний радиус — 1,42 1,77 2,01 2,36 2,5
Стандартное отклонение — 0,48 0,30 0,18 0,17 0,16
Коэффициент вариации, % — 33,96 16,97 8,95 7,20 6,40
В табл. 1 представлены показатели стресса и коэффициента корреляции. Для полученного пространства оптимальным является четырехмерное решение. При пяти- и шестимерном решении значения данных показателей изменяются незначительно. Содержательная интерпретация осей как дополнительное подтверждение правильности выбора минимальной размерности [10; 12] будет приведена ниже. Оценка сферичности осуществлялась на основе коэффициента вариации, который определяет отклонения экспериментальных данных от уравнения сферы и не должен превышать 14%. Из табл. 1 видно, что при четырехмерном решении коэффициент вариации достаточно мал, что указывает на сферичность полученного пространства. На основе формальных критериев можно говорить о том, что четырехмерная сфера является моделью различения К-образных фигур.
Сферическая модель различения К-образных фигур. Полученное пространство проинтерпретируем в терминах сферической модели различения стимулов Е.Н. Соколова, Ч.А. Измайлова [1; 14]. Согласно этой модели каждая значимая для распознавания физическая характеристика стимулов анализируется в зрительной системе двухканальным модулем [2; 3; 6]. Математически двухканальный модуль представлен двумя декартовыми координатами и одной сферической координатой двумерной евклидовой плоскости [10; 11]. Различение стимулов с несколькими физическими характеристиками осуществляется набором двухканаль-ных модулей [3], в результате взаимодействия образующих многоканальную сеть, соответствующую гиперсфере в евклидовом пространстве.
Сферическая модель различения К-образных фигур имеет четыре декартовые и не менее двух сферических координат. На рис. 3 изображена проекция точек-стимулов на плоскость двух первых координат. Число возле каждой точки соответствует номеру стимула на рис. 1. Все точки расположились в двух верхних квадрантах плоскости. Они распологаются последовательно в зависимости от ве-
личины угла стимула, образованного линией-границей и биссектрисой угла между линиями-стрелками. Примеры К-образных фигур изображены рядом с соответствующими точками. На рис. 4 изображен график зависимости первой сферической координаты данного пространства от величины угла стимула, которая соответствует интервалу от 0 до п. Первая сферическая координата вычислялась как горизонтальный угол радиус-вектора каждой точки по часовой стрелке. График на рис. 4 демонстрирует практически линейную зависимость между величиной горизонтального угла точки и величиной угла стимула.
Рис. 3. Проекция точек-стимулов на горизонтальную плоскость четырехмерного конфигурационного пространства
Рис. 4. График зависимости первой сферической координаты пространства от величины угла стимула
Следовательно, величина угла стимула является сенсорной характеристикой, определяющей зрительное различение К-образных фигур. Две декартовы координаты этой плоскости соответствуют двухканальному модулю зрительной системы, детектирующему величину угла между линиями фигуры. Первый канал, соответствующий первой оси (Х1) четырехмерного пространства, реагирует максимальным возбуждением на фигуры, наклон которых соответствует 45 град. вправо от вертикали (положительный полюс оси) и максимально тормозится на предъявление фигуры, имеющей наклон влево от вертикали на 45 град. (отрицательный полюс оси). Х1 можно обозначить как ось наклона. Второй канал, соответствующий второй оси (Х2), максимально активируется на предъявление фигур расположенных вертикально (положительный полюс оси). Отрицательный полюс второй оси редуцирован, возможно, в связи с отсутствием стимулов, имеющих горизонтальную ориентацию. Вторую ось обозначим как ось вертикальности по аналогии с пространством линий и углов [4; 7].
Проекция точек на вертикальную плоскость трехмерного пространства, образованную третьей и четвертой осями, показана на рис. 5. Вторая сферическая координата связана с ориентацией биссектрисы стимула, которая вычислялась как ориентация биссектрисы угла между линиями-стрелками относительно линии-границы, что отражает график на рис. 6. Ориентация биссектрисы стимула изменялась в пределах от 0 до п. Различение К-образных фигур осуществляется также на основе анализа изменений ориентации стимула с помощью отдельного двухка-нального модуля, образованного третьим и четвертым каналами. Третий нейронный канал, соответствующий третьей оси (Х3), максимально активируется на предъявление фигуры с острым углом между линиями-стрелками (положительный полюс) и максимально тормозится предъявлением изображений с тупым углом между линиями-стрелками. Следовательно, третий канал кодирует величину угла.
Четвертый нейронный канал (ось Х4) максимально активируется фигурами с линиями-стрелками, расположенными в верхней части фигуры, и максимально тормозится фигурами с линиями-стрелками, расположенными в нижней части фигуры. Следовательно, четвертый канал кодирует расположение угла, образованного линиями-стрелками, в верхней или нижней части фигуры.
Согласно сферической модели различения стимулов [1—3; 11; 14] четырехмерная модель характеризуется тремя сферическими координатами. Выше мы рассмотрели первую и вторую сферические координаты. Для рассмотрения третьей сферической координаты построили двухмерное подпространство.
На рис. 7 изображена проекция точек-стимулов на плоскость двухмерного подпространства. Оси этого подпространства являются производными от осей четырехмерного пространства К-образных фигур. Они вычислялись по следующим формулам:
где хГ и х2" — оси двухмерного подпространства, а Х1, Х2, Х3 и Х4 — оси четырехмерного пространства К-образных фигур.
хГ = (Х12 + Х22)1/2, х2х = (Х32 + Х42)1/2,
(1) (2)
Рис. 5. Проекция точек-стимулов на вертикальную плоскость четырехмерного конфигурационного пространства
Рис. 6. График зависимости второй сферической координаты пространства от ориентации биссектрисы фигуры
Рис. 7. Проекция точек-стимулов на плоскость двухмерного подпространства
На рис. 7 видно, что все точки-стимулы занимают правый верхний квадрант плоскости, подобно конфигурации точек в сферической модели цветового зрения [1; 11]. В полученном нами пространстве К-образных фигур третью сферическую координату можно обозначить как степень близости линий-стрелок к вертикально-горизонтальной (прямой крест) и диагонально-диагональной (наклонный крест) ориентации. Точки-стимулы располагаются в зависимости от близости составляющих их линий к базовым ориентациям. Предположительно третья сферическая координата связана с активацией детекторов «узлов» [13].
В данной работе на основе интерпретации экспериментальных данных в терминах сферической модели различения стимулов Е.Н. Соколова и Ч.А. Измайлова была построена модель различения К-образных фигур. Эта модель отражает конфигурационный механизм распознавания, так как различение К-образных фигур является результатом анализа величины угла и его ориентации.
ЛИТЕРАТУРА
[1] Измайлов Ч.А. Сферическая модель цветоразличения. — М.: Изд-во МГУ, 1980.
[2] Измайлов Ч.А., Зимачев М.М. Детекция бимодальных стимулов в сетчатке лягушки // Журнал ВНД. — 2007. — Т. 57. — № 1. — С. 105—120.
[3] Измайлов Ч.А., Исайчев С.А., Шехтер Е.Д. Двухканальная модель различения сигналов в сенсорных системах // Вестник МГУ. Сер. 14. Психология. — 1998. — Вып. 3. — С. 29—40.
[4] Измайлов Ч.А., Соколов Е.Н., Коршунова С.Г., Чудина Ю.А. Геометрическая модель различения ориентаций линии, основанная на субъективных оценках и зрительных вызванных потенциалах // Журнал ВНД. — 2004. — Т. 54. — № 2. — С. 267—279.
[5] Измайлов Ч.А., Соколов Е.Н., Едренкин И.В. Интегрирование простых признаков стимула в нейронных сетях зрительной системы // Нейрокомпьютеры: разработка, применение. — 2008. — № 5—6. — С. 34—46.
[6] Измайлов Ч.А., Черноризов А. М. Язык восприятия и мозг // Психология (журнал Высшей школы экономики). — 2005. — Т.2. — № 4. — С. 22—52.
[7] Измайлов Ч.А., Чудина Ю.А. Конфигурационные и категориальные характеристики зрительного восприятия схематических фигур // Вестник РУДН. Серия «Психология и педагогика». — 2004. — № 2. — С. 210—228.
[8] Терехина А.Ю. Анализ данных методом многомерного шкалирования. — М.: Наука, 1985.
[9] Уолд Д. Интерпретация контурных рисунков, изображающих сцены с тенями // Психология машинного зрения / Под ред. П.П. Уинстона. — М.: Мир, 1978. — С. 30—93.
[10] Фомин С.В., Соколов Е.Н., Вайткявичус Г.Г. Искусственные органы чувств. — Л.: Наука, 1979.
[11] Izmailov Ch.A., Sokolov E.N. Spherical model of color and brightness discrimination // Psychological Science. — 1991. — V. 2. — Р. 249—259.
[12] Shepard R.N. Towards a universal law of generalization for psychological space // Science. — 1987. — V. 237. — P. 1317—1323.
[13] Shevelev I.A., Lazareva N.A., Sharaev G.A. //Interrelation of tuning characteristics to bar, cross and corner in striate neurons // Neuroscience. — 1999. — V. 88. — P. 17—25.
[14] Sokolov E.N. Model of cognitive processes // Advances in Psychological Science / Eds. M. Sagaurin, T. Craik. — V. 2. — Sussecs, UK: Psychol Press, 1998. — P. 355—378.
CONFIGURATIONAL MECHANISM OF VISUAL DISCRIMINATION
Yu.A. Chudina
The Chair of Social and Differential Psychology Peoples' Friendship University of Russia
Miklukho-Maklaya str., 6, Moscow, Russia, 117198
The visual discrimination system of K-shaped figures is described in the article. We explored our constructed space of the K-shaped figures by means of the terms of Sokolov and Izmailov's spherical model of differentiating stimuli. The comparative analysis demonstrated that the K-shaped figures were recognized with a four-channel neuron network detecting the configurative features of the stimuli.
Key words: multidimensional scaling, subjective estimations of pairwise differences, recognition of two-dimensional images, two-channel module, spherical model of differentiating stimuli.