Научная статья на тему 'Змінна роздільна здатність у зоровому сприйнятті та обробленні зображень'

Змінна роздільна здатність у зоровому сприйнятті та обробленні зображень Текст научной статьи по специальности «Математика»

CC BY
377
17
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ПЕРЕМЕННАЯ РАЗРЕШАЮЩАЯ СПОСОБНОСТЬ / ЗРИТЕЛЬНОЕ ВОСПРИЯТИЕ / ЗРИТЕЛЬНАЯ СИСТЕМА / ВИЗУАЛЬНАЯ ИНФОРМАЦИЯ / ОБРАБОТКА ИЗОБРАЖЕНИЙ / MULTIRESOLUTION / VISUAL PERCEPTION / VISUAL SYSTEM / VISUAL INFORMATION / IMAGE PROCESSING

Аннотация научной статьи по математике, автор научной работы — Шарипанов А. В., Калмиков В. Г.

Уже существуют методы для обработки изображений, использующие разные значения разрешающей способности, известные под общим названием «coarse-to-fine». Идея этих методов заключается в том, что исходный набор данных просматривается при разной разрешающей способности для исключения неподходящих или нерелевантных областей изображения на ранних стадиях обработки. Результат, полученный при «грубой» разрешающей способности, используется как начальное приближение на следующем шаге при увеличенной разрешающей способности. Тогда вычислительно-затратная часть алгоритма будет применена на последнем шаге к меньшему объему данных. Один из вариантов такого подхода использование модификации известного алгоритма, которая реализует подход «coarse-to-fine» и пригодна для решения конкретного класса задач. В то же время большое количество задач распознавания изображений, имеющих сложность NP или вообще не решаемых с помощью традиционных методов, решаются в зрительной системе моментально, а задачи, связанные с обработкой видеоряда, в режиме реального времени. В частности, сегментация изображения происходит на подсознательном уровне, мгновенно и без видимых усилий, даже при значительном количестве помех в поле зрения. Поэтому естественным будет обратить внимание на процессы, которые сопровождают зрительное восприятие, а именно на последовательное изменение разрешающей способности в зрительной системе во время зрительного акта, от низкой до максимально возможной. В статье предложен обзор современного состояния по направлениям изучения и использования переменной разрешающей способности в каждой из указанных дисциплин. Лучшее понимание природы зрительного восприятия должно стать следующим шагом к разработке новых эффективных методов обработки визуальной информации в информационных системах.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

There exist image processing methods known as «coarse-to-fine» that use different image resolutions. The idea of these methods is lies in the fact that the initial data set considered with different resolution to exclude inappropriate or irrelevant parts of image on earlier stages of processing. Result that obtained for «coarse» resolution is used as initial approximation for processing with subsequent resolution. In that case the computationally-intensive part of algorithm will be applied to reduced amount of data on the final stage of processing. One of the variants of this approach is to use a coarse-to-fine modification of known algorithm, suitable for solving the particular class of problems. At the same time many image recognition tasks that have NP computational complexity or can’t be addressed at all with traditional methods are solved by visual system in no moment and tasks of video stream processing are solved in real time. In particular image segmentation happens on subconscious level, in less than no moment, without tangible effort even with large amount of noise in field of view. So it is natural to pay attention to processes that accompany visual perception, namely on sequential resolution changes in visual system during visual act from lowest resolution to highest possible. In this article we propose a review of state of the art in studying and using of variable resolution in domains of scientific activity mentioned above. Better understanding of visual perception nature should be the next step towards developing of new effective methods for visual information processing in information systems.

Текст научной работы на тему «Змінна роздільна здатність у зоровому сприйнятті та обробленні зображень»

УДК 004.02

А.В. ШАРИПАНОВ*, В.Г. КАЛМИКОВ*

ЗМ1ННА РОЗД1ЛЬНА ЗДАТН1СТЬ У ЗОРОВОМУ СПРИЙНЯТТ1 ТА ОБРОБЛЕНН1 ЗОБРАЖЕНЬ

1нститут проблем математичних машин i систем НАН Украши, м. Кшв, Украша_

Анотаця. Вже ¡снуютъ методи для обробки зображень, що використовують pi3Hi значення роз-дтъног здатностi, вiдомi nid загалъною назвою «coarse-to-fine». 1дея цих методiв полягае в тому, що початковий набiр даних переглядаетъся з рiзною роздтъною здаттстю для виключення невiд-nовiдних або нерелевантних областей зображення на рантх стадiях обробки. Резулътат, отри-маний при «грубт» роздтънт здатностi, використовуетъся як початкове наближення на наступ-ному кроц при збтъшетй роздшънт здатностi. Тодi розрахунково-складну частину алгоритму буде застосовано на останнъому кроц до меншого об 'ему даних. Один iз варiантiв такого тдходу - використання модифiкацií вiдомого алгоритму, яка реалiзуе niдхiд «coarse-to-fine» та придатна для розв 'язання конкретного класу задач. У той же час велика кшъюстъ задач розтзнавання зо-браженъ, яю маютъ складтстъ NP чи взагалi не можутъ бутирозв'язат за допомогою традицт-них методiв, розв'язуютъся у зоровт системi людини миттево, а задачi, пов'язат з обробкою вiдеоряду, у режимi реалъного часу. Зокрема, сегментащя зображення вiдбуваетъся на niдсвiдо-мому рiвнi, дуже швидко та без жодних вiдчутних зусилъ, навiтъ при значтй кiлъкостi завад у nолi зору. Тому природним буде звернути увагу на процеси, як супроводжуютъ зорове сприйнят-тя, а саме - на по^довну змту роздiлъноí здатностi зоровоí системи тд час зорового акту, вiд низъmi до максималъно можливог'. У статтi запропоновано огляд сучасного стану за напрямами вивчення та застосування змiнноí роздiлъноí здатностi в кожнт з означених дисциплт. Краще розумтня природи зорового сприйняття мае стати наступним кроком до розроблення нових ефе-ктивних методiв обробки вiзуалъноí тформацп в тформацтних системах.

Ключов1 слова: змтна роздшъна здаттстъ, зорове сприйняття, зорова система, вiзуалъна тфор-мащя, обробка зображенъ.

Аннотация. Уже существуют методы для обработки изображений, исполъзующие разные значения разрешающей способности, известные под общим названием «coarse-to-fine». Идея этих методов заключается в том, что исходный набор данных просматривается при разной разрешающей способности для исключения неподходящих или нерелевантных областей изображения на ранних стадиях обработки. Резулътат, полученный при «грубой» разрешающей способности, ис-полъзуется как началъное приближение на следующем шаге при увеличенной разрешающей способности. Тогда вычислителъно-затратная частъ алгоритма будет применена на последнем шаге к менъшему объему данных. Один из вариантов такого подхода - исполъзование модификации известного алгоритма, которая реализует подход «coarse-to-fine» и пригодна для решения конкретного класса задач. В то же время болъшое количество задач распознавания изображений, имеющих сложностъ NP или вообще не решаемых с помощъю традиционных методов, решаются в зрителъной системе моменталъно, а задачи, связанные с обработкой видеоряда, в режиме реалъного времени. В частности, сегментация изображения происходит на подсознателъном уровне, мгновенно и без видимых усилий, даже при значителъном количестве помех в поле зрения. Поэтому естественным будет обратитъ внимание на процессы, которые сопровождают зрителъное восприятие, а именно - на последователъное изменение разрешающей способности в зрителъной системе во время зрителъного акта, от низкой до максималъно возможной. В статъе предложен обзор современного состояния по направлениям изучения и исполъзования переменной разрешающей способности в каждой из указанных дисциплин. Лучшее понимание природы зрителъного восприятия должно статъ следующим шагом к разработке новых эффективных методов обработки визуалъной информации в информационных системах.

Ключевые слова: переменная разрешающая способностъ, зрителъное восприятие, зрителъная система, визуалъная информация, обработка изображений.

© Шарипанов А.В., Калмиков В.Г., 2018

ISSN 1028-9763. Математичш машини i системи, 2018, № 3

Abstract. There exist image processing methods known as «coarse-to-fine» that use different image resolutions. The idea of these methods is lies in the fact that the initial data set considered with different resolution to exclude inappropriate or irrelevant parts of image on earlier stages of processing. Result that obtained for «coarse» resolution is used as initial approximation for processing with subsequent resolution. In that case the computationally-intensive part of algorithm will be applied to reduced amount of data on the final stage ofprocessing. One of the variants of this approach is to use a coarse-to-fine modification of known algorithm, suitable for solving the particular class of problems. At the same time many image recognition tasks that have NP computational complexity or can't be addressed at all with traditional methods are solved by visual system in no moment and tasks of video stream processing are solved in real time. In particular image segmentation happens on subconscious level, in less than no moment, without tangible effort even with large amount of noise in field of view. So it is natural to pay attention to processes that accompany visual perception, namely on sequential resolution changes in visual system during visual act from lowest resolution to highest possible. In this article we propose a review of state of the art in studying and using of variable resolution in domains of scientific activity mentioned above. Better understanding of visual perception nature should be the next step towards developing of new effective methods for visual information processing in information systems.

Keywords: multiresolution, visual perception, visual system, visual information, image processing.

1. Вступ

Пщ роздшьною здатшстю зображення (сигналу) розумшть кшьюсть елементив растрового зображення (сигналу) на одиницю площi (одиницю довжини). Значення роздшьноТ здатно-CTi, зазвичай, визначають штуТтивно, зважаючи на задачу, яка мае бути виршена стосовно растрового зображення (сигналу).

Дослщження в нейрофiзiологii зорового сприйняття та створення шформацшних технологий для обробки вiзуальноi шформацп пов'язаш областями дiяльностi людини. Дшсно, об'ектом дослщження для кожног з цих дисциплш е зорове сприйняття. Для фiзiо-логи зору це зорове сприйняття людини та тварин, у той час як для комп'ютерних наук це створення та налагодження засобiв техшчного (комп'ютерного) зору. Прогрес в однш з областей мав би впливати на прогрес в шшш. На жаль, обмшу результатами, як такого, не вщбуваеться. Можливо, через слабку взаемод^ мiж спещалютами, що е представниками рiзних наук, та через вщмшшсть методiв, що зазвичай ними використовуються.

Вперше змiнна роздшьна здатнiсть (динамiчнi властивостi рецептивних полiв ней-ронiв зоровог системи [1]) була дослщжена у зоровiй системi вищих тварин (кiшок).

У той же час е досить багато прикладiв щодо оброблення зображень (сигналiв) з ви-користанням декiлькох значень роздшьних здатностей при обробленнi одного й того ж зображення.

Далi детально розглянуто змiнну роздiльну здатнiсть зорового сприйняття вищих тварин (юшок), що принципово не вiдрiзняеться вiд людського, а також приклади оброблення зображень (сигналiв), що використовують декшька значень роздшьноТ здатностi.

2. Змшна роздiльна здатнiсть у зоров1й ^creMi людини 2.1. Будова зоровоТ системи

Зорова система [2, 3] мютить в собi такi органи (рис. 1): очi (1), на спгавщ (2), де проекту-ються лiвi i правi половини полiв зору, зоровi нерви (3),окорушiйнi нерви (4), хiазм (5), зоровий тракт (6), бiчне колiнчасте ядро (7), верхш бугри чотиригорбу (8), неспецифiчний зоровий шлях (9), зорова кора головного мозку (10).

У атювщ кожного ока вщбуваеться перетворення оптичних сигналiв в електричш, а також первинна обробка вiзуальноi шформацп. У хiазмi вщбуваеться подш нервових шля-хiв, що зiставляються до лiвоi й правог частин поля зору кожного ока.

Бiчне колшчасте ядро являе собою парний шаруватий орган. Для виконання функцп керування окорушiйними м'язами з метою сумщення сигналiв зображень, сформованих в обох очах, у бiчному колшчастому ядрi вiдбуваеться видiлення певних ознак, наприклад, контрастних перепадiв яскравостi на зображенш. На пiдставi сигналiв про щ перепади для рiзних очей у шарах бiчного колiнчастого ядра виробляються сигнали, що надходять у чет-верогорб, де, у свою чергу, формуються сигнали до очних м'яз1в.

З бiчного колiнчастого ядра сигнали про вiзуальну iнформацiю надходять у стриар-ну кору головного мозку, де вщбуваеться видiлення основних ознак, що ставляться до спо-стережуваного зображення - сегментащя зображення на об'екти.

Будову ока схематично представлено на рис. 2. Склера е зовшшньою оболонкою ока, всередиш яко'1 перебувае судинна оболонка. В заднш частинi ока, навпроти криштали-ка, розташована сiткiвка. Склера мае бший колiр з молочним вщливом, крiм передньо'1 й частини, яка прозора й називаеться роговицею. Через роговицю свггло надходить в око. Судинна оболонка - середнш шар - мютить кровоноснi судини, по яких кров надходить для живлення ока. Прямо тд роговицею судинна оболонка переходить у райдужну оболо-нку, яка й визначае тшр очей. У центрi й перебувае зшиця. Функцiя ще'1' оболонки - об-межувати надходження свiтла в око при його високш яскравосп. Це досягаеться за допо-могою звуження зiницi при високiй осв^леносп й розширення при низькiй. За райдужною оболонкою розташований кришталик, схожий на двоопуклу лшзу. Свiтло, що проходить через зшицю, вловлюеться й фокусуеться ним на сггювщ.

Отювка перетворюе свiтло в сигнали нейрошв у широкому дiапазонi iнтенсивностi з дiапазону хвиль «видимого» свiтла й забезпечуе роздшьну здатнiсть, достатню, щоб вирь знити окремi об'екти завтовшки з волос людини з кшькох метрiв [3]. Сiткiвка - це частина мозку, пов'язана з ним за допомогою зорового нерва. Подiбно багатьом шшим структурам центрально'!' нервовоi системи, сiткiвка мае форму пластинки товщиною приблизно у чверть мшметра. Вона складаеться з трьох шарiв тiл нервових клiтин, роздiлених двома шарами синапа в, утворених аксонами й дендритами цих кл1тин.

Рисунок 1 [2] - Зорова система

Рисунок 2 [2] - Схема будови ока: 1 - вшкове тшо, 2 - задня камера, 3 - райдужна оболонка, 4 -кришталик, 5 - роговиця, 6 - вшкове тшо, 7 -верхнш прямий м'яз, 8 - судинна оболонка, 9 -штювка, 10 - скловидне тшо, 11 - зоровий нерв

Шар кл^ин на заднш поверхш атювки мютить свiтлочутливi рецептори - палички й колбочки. Чисельшсть паличок значно бшьша, шж чисельнiсть колбочок. Вони вщповь дальнi за наше зорове сприйняття при слабкому освiтленнi й вщключаються при яскраво-

му осв^ленш. Колбочки не реагують на слабке св^ло, але вiдповiдальнi за здатшсть бачи-ти тонкi деталi та за сприйняття кольорiв. У самому цен^ сiткiвки, де здатшсть нашого зору розрiзняти тонкi деталi максимальна, е тiльки колбочки. Цю, позбавлену паличок зону дiаметром приблизно швмшметра, називають центральною ямкою. Колбочки е по всш сiткiвцi, але найбшьш щiльно упакованi саме в центральны ямцi.

Оскiльки палички й колбочки розташоваш на заднiй поверхш сiткiвки (рис. 3), св^-ло, що надходить до ока, проходить до них через два шших шари клiтин. Можливою причиною такого розташування е те, що за рецепторами перебувае шар клггин iз вмiщенням чорного пiгменту - меланшу. Меланiн поглинае свiтло, яке пройшло через сiткiвку, не да-ючи йому вiдбиватися у зворотному напрямку i розсiюватися в середиш ока, що створило б паразитне засвiчення. Шари перед рецепторами досить прозорi i практично не попршу-ють чiткiсть. Однак у центральны частинi сiткiвки два переднi шари змщеш до перифери, оголивши центральш колбочки так, що вони виявилися на самш поверхнi. маленьке пог-либлення, що утворюеться, i е центральна ямка.

2.2. Нейрони та 1х рецептивш поля

Середнiй шар сiткiвки, що передуе паличкам та колбочкам вщносно падаючого свiтла, мю-тить нейрони трьох типiв: бшолярш, горизонтальнi та амакриновi клiтини. Бшолярш кль тини мають входи вщ рецепторiв, як показано на рис. 3, i передають сигнали безпосеред-ньо ганглiозним клiтинам. Горизонтальнi кл^ини з'еднують рецептори й бiполярнi кл^ини порiвняно довгими зв'язками, що йдуть паралельно шарам атювки; подiбним способом амакриновi клiтини зв'язують бiполярнi кл^ини з ганглiозними.

Шар нейронiв на переднш сторонi сiткiвки мiстить ганглюзш клiтини, аксони яких проходять по поверхш атювки, збираються в пучок у слшо'1" плями й залишають око, утво-рюючи зоровий нерв. У кожшм оцi близько 125 мшьйошв паличок i колбочок i близько 1 мiльйона ганглiозних кл^ин. Сигнали вiд фоторецепторiв надходять до бшолярних i далi до ганглюзних клiтин, мiж рецепторами й бшолярами можуть бути включенi ще й горизо-нтальнi клiтини, а мiж бiполярами й ганглiозними клiтинами - амакриновi клiтини (рис. 3). Загальна площа, яку займають рецептори, пов'язаш з однiею ганглiозною клiтиною, стано-

вить усього близько квадратного мшметра. Ця зона е рецептивним полем гангль озно'1' кл^ини - частиною сiткiвки, свiтлова стимуля-цiя яко'1' може впливати на стан i вихiднi сигнали дано'1' ганглюзно'1' клiтини. Кож-ний рецептор може бути пов'язаний з декшькома ганглiозними клiтинами. Рецептивнi поля ганглюзних кл^ин мають форму кола. Рецептивш поля сусь дшх ганглiозних клiтин перетинаються [3].

Св^ло мае пройти через шари ганглюзних, бшолярних та амакринових кл^ин перш шж досягне паличок та колбочок.

По аналоги з ганглiозними кл^инами, якi (опосередковано) зв'язанi з рецепторами, сукупшсть сигналiв, що пiдходять до нейрона вщ нейронiв попереднього шару, називають

Рисунок 3 [3] - Вщносне розташування трьох шар1в штювки в середиш ока

рецептивним полем даного нейрона. Зважаючи на те, що геометричш вщношення вщносно с1тк1вки в наступних шарах 61чного колiнчастого ядра зберiгаються, рецептивнi поля ней-рон1в 61чного колiнчастого ядра також мають форму кола. Центральна частина рецептив-них пол1в називаеться зоною збудження, перифершна частина (кшьце навкруги центрально'!' частини) - зоною гальмування (рис. 4). При пред'явленш св1тлового стимулу на зону збудження рецептивного поля нейрона генеруеться певна кшкють !мпульав. Чим бшьше стимул, тим 61льшу к1лк1сть !мпульав буде сгенеровано. Якщо розм1р св1тлового стимулу перевищить дiаметр зони збудження, ствпадаючи з частиною зони гальмування, кшьюсть 1мпульс1в буде зменшуватися.

На рис. 5 л!воруч: чотири записи вщповщей типово!' ганглюзно!' кл1тини з оп-центром (видае 1мпульси при вплив! св1тлового стимулу на зону збудження рецептивного поля). Кожний запис отриманий при одиночному розгорненш променя осцилографа трива-л1стю 2,5 секунди. Через настшьки повiльне розгорнення висхщна й спадна фази 1мпульсу зливаються, так що кожний 1мпульс мае вигляд одше!' вертикально! лшп. Л1воруч показанi стимули. Верхнiй запис - стан спокою (стимулу немае): 1мпульси виникають рщко й бiльш-менш випадково. Три нижш записи - реакцп на невелику (оптимально! величини) пляму, на велику пляму, що покривае центр i перифер^ рецептивного поля, i на кiльце, що покривае тшьки периферiю. Праворуч: реакцii ганглюзно! кл1тини з off-центром (видае 1мпульси при вплив1 св1тлового стимулу на зону гальмування рецептивного поля) на такий же вд61р стимул1в.

Збудження гальмування

Св1тлов1 стимули

п - кшьюсть !мпульс!в у в!дпо-в1д1 на стимул даного дiаметра; ё0 - дiаметр зони збудження; В0 - дiаметр зони гальмування 1, 2 - графши реакцiй нейронiв р1ЗНИХ ТИП1В

Рисунок 4 [1] - Реакщя нейрона на стимули р1ЗНИХ РОЗМ1Р1В

Стимул Стимул

Рисунок 5 [3] - Реакцп' ганглюзних кттин з оп- i о£Г-центрами на стимули

2.3. Зоровий акт та динампчш властивост рецептивних пол1в нейрон1в

Важливе вiдкриття було зроблено у 70-х роках минулого сторiччя - змiна зон збудження рецептивних полiв пiд час зорового акту, що означае динамiчну змшу роздшьно'1 здатностi в зоровш системi.

Зорова система людини працюе у режимi послiдовних зорових акпв. Зоровий акт тривае приблизно 150 мс. Шсля чого вiдбуваеться саккада - посмикування окорушшних м'язiв, в результат чого зображення на атювщ змiщуеться i починаеться наступний зоро-вий акт.

У результат дослiджень розмiрiв зон збудження рецептивних полiв було встанов-лено [1], що 1'х розмiри не залишаються постiйними впродовж зорового акту. Шзшше це явище було знов дослщжене та пiдтверджене вже на сучасному рiвнi [4]. Дослщження цих явищ виконувалися на юшках, зорова система яких у цш частиш не суттево вiдрiзняеться вщ зорово'1 системи людини.

Один iз методiв визначення просторових характеристик рецептивного поля, що мае форму кола за допомогою св^лових плям iз рiзною площею, полягае в тому, що, як вщомо з [5], при збшьшенш дiаметра свiтлового стимулу, центр якого ствпадае з центром рецептивного поля, вщповщь нейрона - кшьюсть iмпульсiв - спочатку збшьшуеться (рис. 4), а потсм зменшуеться. У вiдповiдностi з цим [6], дiаметром зони збудження рецептивних полiв, що мають форму кола, вважають найменший дiаметр стимулу, при реакци на який кшьюсть iмпульсiв у вiдповiдi нейрона мае максимальне значення. Дiаметром рецептивного поля , якому ставиться у вщповщшсть дiаметр зони гальмування, вважають найменший дiаметр стимулу, при збшьшенш якого не вщбуваються змши у вiдповiдях нейрона.

Однак за такими вщповщями безпосередньо можна визначити лише одне значення дiаметра зони збудження рецептивного поля (<30 ) . Це значення не вщображае змш розмiру зони збудження пщ час ди стимулу. З метою отримання кшьюсного опису змш розмiрiв зони збудження рецептивного поля з плином часу, тобто знаходження у впорядкованш

послщовносп ¡нтервал1в часу At = (А/,,А/2,..., А/;,...) вщ початку ди стимулу 1 визначення залежносп б/0 = /'(/), був застосований метод часових зр\з\в [1]. Цей метод базуеться на доволi обгрунтованому припущеннi, що якщо пщ час зорового акту дiаметр зони збудження змшюеться, то максимальна кшьюсть iмпульсiв у вiдповiдi нейрона припадае на той штервал часу, для якого дiаметр зони збудження та дiаметр стимулу спiвпадають або вщ-рiзняються один вiд одного незначною мiрою.

Метод часових зрiзiв для побудови залежностi кiлькостi iмпульсiв у вiдповiдi нейрона пщ час дii свiтлового стимулу полягае у наступному.

Постстимульш пстограми (ПСГ) вщповщей нейрона на стимули р1зноТ площ1 роз-бивають на деилька иосл1довних часових 1нтервал1в Аt (що дор1внювали 7,5 або 15 мс) та знаходять кшьюсть iмпульсiв у кожному часовому iнтервалi (рис. 6). У вщповщносп з означенням дiаметр зони збудження дорiвнюе найменшому дiаметру стимулу, при якому досягаеться максимум кшькосп вiдповiдей нейрона. Метод часових зрiзiв дозволяе також визначити i номер часового iнтервалу, на якому цей максимум досягаеться. Чим бшьший дiаметр стимулу, тим рашше досягаеться максимум. Це дозволяе зробити висновок про те, що дiаметр зони збудження рецептивного поля, яке мае форму кола пщ час зорового акту, змшюеться з плином часу, вщ максимального значення до мшмального.

Якщо на початку зорового акту розмiр рецептивного поля мае максимальне значення, то наприкшщ зорового акту вш зменшуеться до мшмально можливого. У випадку ган-глюзно'1 клiтини це 1-2 рецептори.

Стимули рiзних роз-мiрiв

N° ПСГ 6

Залежшсть вщповщ! нейрона вщ часу дп стимулу та динам1чш властивосп рецептивного поля нейрона 61чного колш-частого ядра юшки дослщжено у [4]. Ре-цептивне поле подразнювалося за допомо-гою св1тлових стимул1в упродовж 400500 мс. Просторов! параметри рецептивного поля оцшювалися за просторовими штегральними кривими, що визначалися для послщовних часових штервал1в по 5мс на протяз! всього часу пред'явлення стимулу. Таким чином, було можливо досль дити динам1чш характеристики властиво-стей вщповщей у под1бних до природних умов станах та за допомогою метод1в, що не розглядають систему, яка моделюеться, як лшшну.

Отримаш результати показали ви-ражен! змши у структур! рецептивного поля тд час пред'явлення стимулу. На початку спостереження нейрони мали ве-лику зону з6удження рецептивного поля. Центральна частина рецептивного поля швидко зменшувалася до мш!мального розм1ру, що спостершалося приблизно через 70 мс вщ моменту пред'явлення стимулу, тсля чого спостершалося незна-чне збшьшення !! розм1ру. Таким чином, максимальна просторова роздшьна здат-

Рисунок 6 [1] - Обробка вщповщей нейрона на стимули рiзних розмiрiв методом часових зрiзiв. На осi п для кожно! ПСГ вiдкладена кiлькiсть iмпульсiв у вiдповiдному часовому iнтервалi Д^. Максимальна кiлькiсть iмпульсiв вiдповiдае рiв-ностi розмiрiв зони збудження i стимулу; а -змша розмiрiв зони збудження нейрона тд час зорового акту

шсть досягалася за невеликий пром1жок часу тсля пред'явлення стимулу. Автори наголо-шують на узгодженост! !х результат ¿з гшотезою про те, що пщ час пред'явлення св1тло-вого стимулу сильний початковий сигнал вщ нейрошв мютить просторово «грубе» повь домлення до зорово! кори, який поступово змшюеться слабюшим, але таким, що мютить бшьш точну просторову шформащю.

Була перев1рена гшотеза про те, що стимул малого д1аметра спочатку активуе бага-то нейрошв, але бшьшють з них - лише тимчасово (рис. 7). Моделювалися умови, коли стимул випадав ¿з зон збудження рецептивних пол1в нейрошв пщ час !! зменшення. Для вах трьох розташувань стимулу вщносно центру рецептивного поля спостершався початковий тимчасовий вщгук, але наступна стшка частина вщповщ!, яка мае виникати при зна-ходженн! стимулу малого розм1ру у центр! зони збудження мшмального д1аметра, у цьому випадку була вщсутня.

Також у [4] було встановлено, що схожi змши просторових характеристик спостерь галися ! для рецептивних пол1в нейрошв б1чного колшчастого ядра.

Таким чином, можна вважати, що для зорово! системи юнуе максимальна роздшьна здатнють, яка визначаеться кшьюстю рецептор1в у центральнш частин! рецептивного поля ! змшювана тд час зорового акту змшна роздшьна здатшсть, що визначаеться поточним значенням розм1ру зони збудження рецептивного поля нейрона.

Рисунок 7 [4] - Великий початковий po3Mip зон збудження рецептивних полiв передбачае, що кiлькiсть активованих нейрошв зменшуеться пiд час моделювання. A: схематичне подання гiпотези. B-D: стимул, що пред'являеться в межах рецептивного поля, але за межами мшмального розмiру зони збудження спочатку швидко видае вiдповiдь, яка зни-кае при подальшому зменшеннi зони збудження рецептивного поля до мшмальних розмiрiв. Побудованi лише вiдповiдi для перших 150 мс з 500мс штервалу моделювання. Пунктирна лiнiя перед початком пред'явлення стимулу показуе рiвень спонтанно! активность Ширина стовпчика пстограми вщповщае iнтервалу 5 мс. Для кожного розмщення було виконано 100 випробувань

3. Змшна роздшьна здатнiсть у системах техшчного (комп'ютерного) зору

3.1. Приклади впливу роздшьноТ здатностi на результати обробки зображень

Зазвичай вважаеться [7], що вихщне зображення для подальшо! обробки подано у аналого-вiй формi. Як правило, розглядаеться зображення, що обмежено прямокутником (полем зору), який мае придатш для обробки розмiри. Зображення мае повшстю вмщуватися у цьому прямокутнику та заповнювати його, якщо це можливо.

Обробка починаеться з дискретизацп поля зору та квантування яскравосп за рiвня-ми, що вiдповiдають кольорам у палiтрi зображення (пiвтони, RGB та ш.). Наступнi пара-метри системи комп'ютерного зору обираються iз практичних мiркувань: роздiльна здат-шсть - множина дискретних елементiв зображення (пiкселiв, зазвичай мають квадратну форму), яю можна розмiстити в одинищ довжини (дюймi, сантиметрi) та, вщповщно, роз-мiр зображення у ткселях; множина рiвнiв яскравостi, що е областю визначення функцп яскравостi для представлення кожного з кольорiв.

Вважаеться, що обрана роздшьна здатнiсть системи комп'ютерного зору якнайкра-ще тдходить для класу зображень, якi необхщно обробляти. Тобто непотрiбнi деталi не будуть вщображеш з надзвичайно великою роздшьною здатнiстю (як-то спотворенi зава-дами контури об'ектiв) та суш^ деталi об'ектiв не зникнуть через дуже низьку роздшьну здатнiсть. До функцп квантування та множини рiвнiв яскравостi для подання кольорiв зображення висуваються такi ж самi вимоги: можливiсть вiдобразити суттевi деталi об'ектiв.

Таким чином, зображення може бути подане як двовимiрний масив V(M, N), що мютить M рядкiв та N стовпчиюв. Кожний елемент v(m, n) цього масиву вiдповiдае або яскравосп пiкселя з координатами (m, n) для пiвтонового зображення, або значенням яскравосп базових кольорiв (наприклад, червоного, зеленого, синього) для кольорового зображення. Цей масив може розглядатися як матриця або вектор у залежносп вщ обраних математичних методiв.

Розроблено та устшно застосовуеться велика кiлькiсть методiв i алгоритмiв для об-робки зображень, що спираються на векторне або матричне представлення зображення.

Бшьшють цих метод1в може бути устшно застосована для обробки твтонових зображень, якщо для класу зображень, що розглядаються, були вдало обраш параметри дискретизацй та квантування. Однак необхщно наголосити на обмеженнях такого тдходу. Наприклад, для визначення м1ри схожосп двох зображень, як /(V , V) 1з використанням метод1в ста-тистичного розтзнавання [8], використовуються значення яскравостей ус1х тксел1в, що належать до зображення. Але ж зазвичай тксел1 зображення вщносяться або до об'екта, або до фону. Тобто результат розтзнавання залежить не тшьки вщ значень яскравосп тк-сел1в об'екта штересу, а й вщ значень яскравосп тксел1в фону, що у багатьох випадках не прийнятно.

Розглянемо зображення, що мютять довшьний текст на однотонному фош та на фо-ш деяко! довшьно! реш1тки (рис. 8) [9]. Текст на рис. 8 а може бути розтзнаний як статис-тичними, так 1 структурними методами розтзнавання. Розтзнавання тексту на рис. 8 б е складшшою задачею. Якщо спробувати застосувати статистичш методи, результат обчис-лення схожосп 1з еталонним зображенням буде спотворений через наявшсть тксел1в зображення реш1тки 1з кольором об'екта у пол1 фону. Також взаемне розташування тексту та реш1тки може змшюватися п1сля застосування до зображення операцш дискретизац1! та квантування. При застосуванш до зображень, як на рис. 8 б, структурних метод1в замють контур1в об'ект1в будуть вид1лен1 контури кл1тин реш1тки. Схожу картину можна спостер1-гати, коли накладена на текст реш1тка мае кол1р фону (рис. 9). У даному випадку при застосуванш статистичних метод1в розтзнавання результат обчислення схожосп буде також спотворено через наявнють в пол1 зображення тксел1в, що належать до об'екта, але мають кол1р фону. Знову ж, не гарантуеться однакове взаемне розташування тексту 1 реш1тки тс-ля накладення на зображення решггки та застосування до зображення операцш дискретизацй й квантування. При спроб1 застосувати структурш методи розтзнавання до зображень на рис. 9, будуть отримаш так1 ж сам1 результати, як 1 для рис. 8 б: будуть видшеш контури кл1тин реш1тки.

Задача розтзнавання тексту з накладеною на нього довшьною реш1ткою може роз-глядатися як окремий випадок розтзнавання текстур. Але обчислювальна складшсть ме-тод1в розп1знавання текстур зазвичай значно перевищуе складшсть метод1в розп1знавання тексту. Тому !х застосування унеможливлюеться або взагал1 виключаеться для розв'язання вказаних вище задач.

А65Н7

а) б)

Рисунок 8 [9] - Приклади зображень, що мютять довшьний текст: а) однорщний фон;

б) фон мютить прямокутну решiтку

а) б)

Рисунок 9 [9] - Реш^ка, що мае колiр фону, накладена випадковим образом на зображення тексту: а) лшн решiтки на зображеннях; б) мають рiзну товщину

У зоровому сприйнятт1 людини вс1 чотири наведет задач1 розп1знавання розв'язуються непом1тно, без видимих зусиль, судячи з усього, на тдсвщомому р1вн1, у

той час, як сучасш засоби обробки вiзуальноi шформацп впевнено справляються лише з розтзнаванням задач, подiбних до рис. 8 а.

Як було показано вище, тд час одного акту зорового сприйняття в зоровш системi людини зображення обробляеться зi змiнною роздiльною здатнiстю. Можливо припустити, що саме спостереження посшдовносп зображень з рiзною роздiльною здатнiстю на початку зорового акту робить можливим цшсне вiзуальне сприйняття символiв на довiльному фонi. Тодi можливо припустити, що якщо деяка програма розтзнавання текстiв успiшно впораеться з розтзнаванням зображення на рис. 10 а зi зменшеною роздiльною здатшстю, то вона також успiшно впораеться з розтзнаванням зображень з такою ж самою, зменшеною, роздшьною здатшстю, що наведет на рис. 8 б, 9 а, 9 б. Для перевiрки цього твер-дження можна провести простий експеримент iз вщомою програмою розтзнавання текспв FineReader.

Вихщний набiр даних складаеться з чотирьох зображень (рис. 8 а, 8 б, 9 а, 9 б). Роз-мiр кожного зображення складае 900х280 пiкселiв, при роздшьнш здатностi 72х72 пiкселi на дюйм. Довшьна комбiнацiя символiв «А65Н7» була обрана спецiально, щоб виключити вплив на результат розтзнавання використання словниюв.

Текст на рис. 8 а був устшно розпiзнаний. Розтзнавання шших трьох зображень дало вщмову вiд розпiзнавання через неможливiсть визначити об'ект на зображенш. Зображення на рис. 10 вщповщають зображенням на рис. 8, 9, що дискретизоваш зi зменшеною у шють разiв роздiльною здатнiстю. На вах цих зображеннях рядок тексту був устшно розтзнаний.

Проведений експеримент показуе, що поняття оптимально! роздшьно! здатностi може бути застосоване не лише до всього зображення, а й до кожного об'екта на ньому. У цьому випадку достатньо було просто зменшити роздшьну здатшсть зображень, щоб розв'язати задачу, яку шакше неможливо було виршити традицшними методами. Тобто, при розглянутш зменшенш роздшьнш здатносп зображень шформацп про форму об'екпв у полi зору достатньо для прийняття ршення. У той самий час завади з великою просторо-вою частотою (решгтки) майже непомiтнi i не впливають на прийняття ршення.

А65Н7 А65Н7

а)

в) г)

Рисунок 10 [9] - Зображення з рис. 8 (а, б) та рис. 9 (в, г) при зменшенш у 6 разiв роздшьнш

здатносп при дискретизацп

Природним чином розгляд зображень при рiзнiй роздшьнш здатносп застосовуеть-ся тд час фотозйомки бюлопчних об'ектiв iз використанням звичайного св^лового мiкро-скопа, тут дослвдники стикаються з обмеженням глибини рiзкостi, яке не дозволяе отрима-ти чiтке зображення на одному зшмку. Якщо зразок товщий за максимальну глибину рiз-костi, дшянки поверхнi об'екта за межами фокально! площини будуть розфокусоваш. Для подолання цих обмежень зйомка зразка повторюеться багато разiв водночас зi змшою гли-

бини р1зкосп вздовж оптично! вю1. Це дае послщовшсть зображень, де р1зш частини зразка з'являються 1 виходять 1з фокуса - р1зш частини зображення з'являються у пол1 спостере-ження з р1зним ступенем розмиття. Для отримано! посшдовносп зображень за допомогою вейвлет-перетворення виконуеться процедура вщновлення, щоб отримати едине р1зке зображення [10]. Таким чином, використання посшдовносп зображень з р1зним ступенем розмиття окремих областей (розгляд областей зображення при р1знш роздшьнш здатносп) е ще одним прикладом задач1, що шакше не може бути розв'язана за допомогою юнуючих метод1в.

3.2. Неявне використання р1зни\ роздшьних здатностей у системах обробки зображень

В експерименп, який було описано вище, зменшення роздшьно! здатносп пщ час дискре-тизаци зображення призводить до розмиття кшцевого зображення. Система обробки зображень мае обробляти зображення, спотвореш завадами. У найпроспшому випадку це зображення обробляеться за допомогою фшьтра Гауса з метою усунення небажаних деталей, алгоритм обробки застосовуеться до розмитого зображення. Саме така попередня об-робка е, наприклад, складовою частиною широковживаного [11-13] методу Канш [14] для видшення контур1в на зображенш. Для вихщного зображення

V = {у(т,п) | т = \,М;п = 1, /V} виконують операщю розмиття зображення, використовуючи фшьтр Гауса для зниження р1вня завад, виключення небажаних деталей 1 елеменпв тексту-ри зображення:

g(m, п) = 0<Т* п),

де (1а - фшьтр Гауса для значения дисперсп сг^(т,п) - елемент «розмитого» зображення

К-

Обчислюють частков1 значення град1енпв для горизонтального (т, п) 1 вертикального (т, п) напрямюв на розмитому зображенш %(т, п), використовуючи, наприклад, оператор Собеля, щоб отримати значення загального град1ента М(т,п) 1 його напрямку 0{т,п) як

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

м (т п) = п)+:%:(1т п),

За значеннями М(т, п), з використанням порога Т, який мае бути пвдбраний так, щоб ус1 контурш елементи були видшеш, у той час, як бшьшють завад була б придушена, отримують значення Мг (т, п) :

ГМ (т,п) if М(т,п)>Т Мт(т,п) = <

Т [ 0 if М(т,п) < Т

Для пщвищення якосп роботи методу використовують два пороги Т 1 Т , причому Тх<Тг. Якщо шксель у(т,п) з1 значениям Тх <Мт(т,п) <Т2 мае в напрямку град1ента в(т,п) два сусщш шксел1, для кожного з яких МТ(т,п) > Т2, його значення як контурного елемента збер1гаеться, а якщо ш, то прир1внюеться до 0.

Ус ненульов1 елементи об'еднують, щоб вийшов замкнений контур об'екта, для чо-го використовуеться спещальний алгоритм.

У метод1 Канш змшна роздшьна здатшсть використовуеться у неявному випщщ, оскшьки оператор пщбирае стушнь розмиття <т, але це робиться, виходячи з його суб'ективних мiркувань стосовно характеру завад.

Недолши методу Канш:

- результатом роботи алгоритму е контур у виглядi послiдовностi пiкселiв, але шк-сель е двовимiрним утворенням, у той час, як контур уявляеться як лшя, зокрема, ламана лшя без товщини;

- оскшьки модель зображення при застосуванш методу Канш не використовуеться, то метод не може автоматично розрiзнити контури об'екпв та контури, що належать до текстури фону;

- результат роботи алгоритму Канш залежить вщ змшного параметра фшьтра Гауса и , який мае значення дисперси (рис. 11). У першоджерелi не надано жодних рекомендацш стосовно вибору значення цього параметра.

З метою придушення завад у вихщному сигналi можуть бути застосоваш й iншi фь льтри, але результат буде також залежати вщ розмiру апертури фiльтра, який, у свою черту, е невщомим параметром.

а=1 (5=2 ст=3

Рисунок 11 - Застосування методу Канш для видшення контур1в на зображенш при р1зних

значеннях параметра сг

3.3. Використання змшноТ роздшьноТ здатност1 для зменшення обчислювальноТ скла-дност1 алгоритм1в

Зменшення роздшьно'1 здатносп широко використовуеться для зменшення обчислювально'1 складностi алгоритмiв обробки, розпiзнавання зображень та пщвищення 1'х швидкодп.

Наприклад, у [15] модель еталошв, яка складаеться з окремих частин, поеднаних не жорсткими зв'язками, розглядаеться з рiзною роздшьною здатнiстю. Сформульовано алгоритм переходу вщ низько'1' роздшьно'1' здатностi до високо!. Метод обробки, що пропону-еться, заснований на спостереженш, що пошук вiдповiдностей частини зображення етало-на е найбшьш обчислювально-витратною операцiею у порiвняннi з виявленням суттевих частин та розрахунком 1'х оптимально'1' конф^рацп. Мiнiмiзацiя кшькосп операцiй порiв-няння частин еталошв iз зображенням тягне за собою прискорення операцп виявлення. Починаючи з найменшо'1' роздшьно'1 здатностi, еталони порiвнюються з зображенням. Вщ-бираються лише найбшьш ймовiрнi 1'х розташування. Попм знайденi локально оптимальнi розташування рекурсивно розповсюджуються на частини моделi з бшьшою роздiльною здатнiстю. За допомогою рекурсивного видалення невiдповiдних розташувань з простору пошуку множина можливих розташувань зменшуеться так, що при максимальнш роздшь-нiй здатностi потрiбно виконати лише декшька порiвнянь еталонiв iз зображенням. Запро-понований метод дозволяе отримати десятикратне прискорення обчислень у порiвняннi зi стандартним методом динамiчного програмування.

Алгоритм, що розглядасться у [16], використовуе подiбну iдею виключення великих областей i3 простору rinoTe3 на раншх стадiях розпiзнавання, однак для кожно! роздшьно! здатностi використовуеться послiдовнiсть детекторiв об'екпв. Результатом роботи детектора е кiлькiсна оцiнка областi, що розглядалася. Ршення щодо застосування наступних детекторiв з послiдовностi до ше! областi приймаеться на пiдставi порiвняння отримано! ильмсно! оцiнки з певним порогом. Область буде розглянуто при наступнш роздшьнш здатностi, якщо ïï кiлькiснi оцiнки вiд кожного детектора перевищили вiдповiднi пороговi значення. Вс пороги встановлюються автоматично, на пiдставi вiрогiднiсних оцiнок.

У [17] розглядаеться застосування стратеги coarse-to-fine до задачi кластеризаци траекторiй руху транспортних засобiв. Bихiднi траектори об'еднуються у «грубЬ» кластери. До кожного «грубого» кластера входять траектори з приблизно однаковим напрямом, але з рiзними характеристиками розташування. Для подальшо! точно! кластеризаци використовуеться перерахування множини точок траектори з застосуванням евклщово!' вщсташ як мiри близькостi.

При розтзнаванш облич процедура «coarse-to-fine» може бути реалiзована шляхом застосування рiзних методiв розпiзнавання для скорочення кiлькостi кандидапв на кожному кроцi.

У [18] процес прийняття рiшення мае декшька стадiй: 1) оцiнка приналежносп одному з усiх можливих класiв (one-against-all of SVM); 2) визначення приналежносп кожного кандидата одному з пари клаав (one-against-one of SVM); 3) алгоритм Eigenface; 4) метод RANSAC. Стади 1) та 2) використовують характеристики усього зображення обличчя, отримаш з дискретного косинусного перетворення. На стади 3) розглядаються проекци зображень облич у проспр характеристик. Проспр облич визначаеться власними векторами множини облич та на пiдставi шформаци про штенсившсть зображення обличчя. Метод RANSAC застосовуеться на останнш стади, де просторова шформашя, отримана за допомогою методiв ешполярно! геометри iз зображення, що перевiряеться, порiвнюеться з двома еталонними зображеннями i обираеться зображення з найбiльшим значенням подiб-ностi та з найкоротшою вiдстанню до вiдповiдних характерних точок.

Задача встановлення вщповщносп мiж ткселями двох зображень облич людини (знаходження розмiтки) [19] ефективно розв'язуеться за допомогою побудови «каскадiв» розмiток. В одному каскадi розмiри всiх зображень зменшуються вдвiчi i будуеться нова розмгтка. Пiсля цього визначаеться початкове наближення для вихщно!' розмiтки на тдс-тавi ново'1 розмiтки й виконуеться пошук поля руху вщносно цього початкового наближення, але з меншою кiлькiстю мiток. При використанш одного «каскаду» алгоритм розв'язання задачi виконуеться у вiсiм разiв швидше, зберiгаючи при цьому точшсть знаходження поля руху для двох зображень. Хоч автор i описуе цей метод як певний шженер-ний прийом, але сшд зауважити, що фактично тут використовуеться обробка зображення зi змшною роздшьною здатшстю, оскшьки в межах одного «каскаду» зображення обличчя розглядаеться зi зменшеною вдвiчi роздiльною здатнiстю, а отримана для зображень зi зменшеною роздiльною здатнiстю розмiтка використовуеться як початкове наближення при пошуку розм^ки для зображень зi збiльшеною роздшьною здатшстю.

Динамiчне програмування дуже часто використовуеться у задачах розшзнавання мови, розшзнавання символiв, пошуку вiдповiдностi за шаблоном для об'екпв, що можуть деформуватися, ввдстеження дороги. Однак постановки таких задач дуже часто призводять до простору сташв величезних розмiрiв, через що розрахунки можуть стати нездшсненни-ми, навт iз використанням динамiчного програмування.

Для подолання такого роду перешкод у [20] пропонуеться використовувати динамь чне програмування coarse-to-fine (CFDP). Основна щея цього шдходу - сформувати посль довнiсть грубих наближень вихiдного графа динамiчного програмування шляхом об'еднання сташв графа у «над стани». Для кожно'1 грубо! апроксимаци оптимальний шлях

розраховуеться з «оптимютичними» вагами дужок м1ж надстанами. Надстани вздовж цього оптимального шляху переглядаються, 1 процес повторюеться знову, доки не буде знайдено доказово оптимальний глобальний шлях. У багатьох випадках глобальний оптимум дося-гаеться з1 значно меншими витратами на розрахунки, шж при прямому використанш ди-нам1чного програмування. Запропонований алгоритм особливо добре пщходить для задач з великим простором сташв. Вщповщно до [21], швидкють алгоритму CFDP залежить вщ структури об'еднання 1 вщ природи задача У найшпшому випадку CFDP дозволяе отримати значне скорочення обчислень у пор1внянш з1 звичайним методом динам1чного програмування; у найпршому випадку вш фактично буде працювати повшьшше.

Метою застосування метод1в з1 змшною роздшьною здатшстю у розглянутих вище випадках е визначення частин вихщного зображення або частин вихщного набору даних, що мютять шформащю, яка здаеться корисною для розв'язання поставлено! задач!. Склад-ш розрахунки виконуються лише над цими частинами. При цьому природ! мехашзму змь ни роздшьно! здатност!, що використовуеться у кожному конкретному випадку, не нада-еться значення.

Зауважимо, що велика кшьюсть задач розтзнавання зображень, яю мають склад-шсть КР чи взагал! не можуть бути розв'язаш за допомогою традицшних метод1в, розв'язуються у зоровш систем! людини моментально, а задач!, що пов'язаш з обробкою вщеоряду, у режим! реального часу. Тому природним буде звернення до результапв ви-вчення процеав у зоровш систем! людини, що отримаш у нейроф1зюлоги для створення нових метод1в та алгоритм1в обробки в1зуально! шформацп.

У попередн! роки досл1дники вже намагалися просунутися у цьому напрям!, використовуючи актуальш на той час результати з нейроф!зюлогл зору.

Наприклад, чутлив! до напряму руху стимулу кл1тини зорово! системи примапв по-казують наявн1сть певного д1апазону просторових розм1р1в, зокрема, якщо розм1ри рецеп-тивних пол1в пор1внюються м1ж р1зними д1лянками кори, такими як первинна зорова кора та середня частина скронево! частки [22]. З урахуванням цього, у [23] дослщжено, як ште-грування шформацп про рух об'екта по вс1х просторових масштабах може допомогти пок-ращити оцшку оптичного потоку. Було запропоновано адаптивний, багатомасштабний метод, де масштаб дискретизацй обираеться локально, вщповщно до оцшки вщносно! по-милки визначення швидкосп щодо властивостей зображення. Було показано, що запропонований метод дае суттево кращ1 оц1нки оптичного потоку, шж традиц1йн1 алгоритми, при незначному збшьшенш витрат на розрахунки. На думку автор1в, це е важливим з огляду на велику кшькють 1терацш, необх1дних для релаксацшних алгоритм1в та дивовижно! швид-косп, з якою людина може надшно оц1нити швидк1сть руху. На засадах цього пщходу у [24] представлено двор1вневу багатомасштабну адаптивну нейромережеву модель обраху-вання параметр1в руху в середнш частин1 скронево! частки примат1в. На першому етап1 локальн1 швидкосп вим1рюються при багатьох просторових роздшьних здатностях, тсля чого поле оптичного потоку обраховуеться мережею чутливих до напряму нейрошв при багатьох просторових роздшьних здатностях. При виникненш конфл1кт1в м1ж сигналами в1д кл1тин при р1зних розд1льних здатностях застосовуеться схема ветування соагее-1;о-Г1пе, зг1дно з якою перевагу мають сигнали вщ кл1тин на «груб1ших» розд1льних здатностях. Подальш1 експерименти з моделювання властивостей некласичного рецептивного поля виявилися цшком узгодженими з результатами, що були отримаш у нейроф1зюлогп. Також було запропоноване нове пояснення феномена захоплення руху з застосуванням стратеги розв'язання конфл1кт1в соагее-1о-Гте при розгляд1 шформацп з р1зних вхщних канал1в.

4. Висновки

Таким чином, у результат проведеного аналiзу поточного стану речей в областях нейрофь зюлоги та створення систем комп'ютерного зору встановлено, що в системах комп'ютерного зору обробка вiзуальноi шформаци з використанням рiзних роздiльних здатностей використовуеться спонтанно, як певний шженерний прийом. У той самий час нейрофiзiологiчнi дослщження свiдчать про наявнiсть механiзмiв обробки вiзуальноi шформаци зi змшною роздiльною здатнiстю в зоровiй системi людини.

З розглянутих прикладiв видно, що велика кшьюсть задач розтзнавання зображень, якi мають складнiсть NP чи взагалi не можуть бути розв'язаш за допомогою традицiйних методiв, розв'язуються у зоровiй системi людини моментально, а задач^ що пов'язат з обробкою вiдеоряду - у режимi реального часу. При цьому вибiр вщповщно!' роздшьно!' здатностi суттево впливае на результат розпiзнавання зображень.

Тому юнуе необхiднiсть розробки нових методiв та алгоритмiв, що поеднують отриманi у нейрофiзiолоrii результати вивчення процеав, якi пов'язанi зi змшою роздшь-но'1 здатностi у зоровш системi людини, з iснуючими методами i алгоритмами обробки зображень для 1'х подальшого використання в задачах розпiзнавання зображень на основi сегментаци спотворених завадами зображень та сигналiв при вiдсутностi апрюрно!' шформаци про характер завад.

СПИСОК ДЖЕРЕЛ

1. Подвигни Н.Ф. Динамические свойства нейронных структур зрительной системы. Ленинград: Наука, 1979. 158 с.

2. Ерошевский Т.И. и др. Глазные болезни: учебное пособие. М.: «Лидер М», 2008. 316 с.

3. Hubel H.D. Eye, brain and vision. New York: Scientific American Library, Distributed by W.H. Freeman, 1988. 240 p.

4. Ruksenas O., Bulatov A., Heggelund P. Dynamics of Spatial Resolution of Single Units in the Lateral Geniculate Nucleus of Cat During Brief Visual Stimulation. JNeurophysiol. 2007. N 97. P. 1445-1456.

5. Barlow H.B. Summation and inhibition in the frog's retina. J. Phisiol. 1953. Vol. 119. P. 69-88.

6. Глезер В.Д. Механизмы опознания зрительных образов. Л.: Наука, 1966. 204 с.

7. Павлидис Т. Алгоритмы машинной графики и обработки изображений. М.: Радио и связь, 1986. 400 с.

8. Шлезингер М., Главач В. Десять лекций по статистическому и структурному распознаванию. Кив: Наукова думка, 2004. 535 с.

9. Sharypanov A., Antoniouk A., Kalmykov V. Joint study of visual perception mechanism and computer vision systems that use coarse-to-fine approach for data processing. Information content & processing. 2014. Vol. 1, N 3. P. 287-300.

10. Forster B., Van De Ville D., Berent J., Sage D., Unser M.. Complex Wavelets for Extended Depth-of-Field: A New Method for the Fusion of Multichannel Microscopy Images. Microsc. Res. Tech. September 2004. Vol. 65, N 1-2. P. 33-42.

11. Grigorescu C. et al. Contour Detection Based on Nonclassical Receptive Field Inhibition. IEEE Transactions On Image Processing. 2003. Vol. 12, N 7. P. 729-739.

12. Ярмшко А.В. Використання методiв вiзуалiзацii у дiагностицi та управлшш електронно-променевим мшрообробленням оптичних матерiалiв. В1сник Чершггвського державного техно-лог1чногоушверситету. 2013. № 2 (65). С. 156-161.

13. Костенко В.В., Лавренюк 1.В., Пономарьов В.М. Дослщження можливостей ефективного використання методiв розтзнавання для обробки фотозображень автомобшьних номерних знаюв. В1сник АМСУ. Техтчт науки. 2014. N 1 (51). С. 48-56.

14. Canny J.F. A computational approach to edge detection. IEEE Trans. Pattern Anal. Machine Intell. 1986. Vol. PAMI-8, N 6. P. 679-698.

15. Pedersoli M., Vedaldi A., Gonzalez J. A Coarse-to-fine approach for fast deformable object detection. CVPR. 2011. June. P. 1353-1360.

16. Moreels P., Perona P. Probabilistic Coarse-To-Fine Object Recognition. Technical report. Pasadena: California Institute of Technology, 2005. 49 p.

17. Li X., Hu W., Hu W. A Coarse-to-Fine Strategy for Vehicle Motion Trajectory Clustering. Proceedings of the 18th International Conference on Pattern Recognition (ICPR'06) Year. 2006. Vol. 1. P. 591— 594.

18. Lee J.-D., Kuo C.-H. A Multi-Stage Classifier for Face Recognition Undertaken by Coarse-to-fine Strategy, State of the Art in Face Recognition. Tech. 2009. URL: http://www.intechopen.com/books/state of the art in face recognition/a multistage classifier for face _recognition_undertaken_by_coarse-to-fine_strategy.

19. Тищенко М.А. Тривимiрна реконструкщя людського обличчя в задачах щентифшаци особи: дис. ... канд. техн. наук. Ки!в: Мiжнародний науково-навчальний центр шформацшних технологш та систем, 2012. 120 с.

20. Raphael C. Coarse-to-Fine Dynamic Programming. IEEE Transactions on Pattern Analysis and Machine Intelligence. 2001. Vol. 23. Р. 1379-1390.

21. Lucena O.B. Dynamic Programming, Tree-width and Computation on Graphical Models: PhD thesis. Division of Applied Mathematics. Providence: Brown University, 2002. 85 p.

22. Maunsell J.H.R., Van Essen D.C. Functional properties of neurons in middle temporal visual area of the macaque monkey. I. Selectivity for stimulus direction, speed and orientation. J. Neurophysiol. 1983. Vol. 49. P. 1127-1147.

23. Battiti R., Amaldi E., Koch C. Computing Optical Flow Across Multiple Scales: An Adaptive Coarse-to-Fine Strategy. International Journal of Computer Vision. 1991. Vol. 6, N 2. P. 133-145.

24. Wang H.T., Mathur B., Koch C. A Multiscale Adaptive Network Model of Motion Computation in Primates. Advances in Neural Information Processing Systems. 1990. Vol 3. P. 349-355.

Стаття надтшла до редакцп 17.05.2018

i Надоели баннеры? Вы всегда можете отключить рекламу.