Разработка системы видеораспознавания графических образов на основе мультиагентных рекурсивных когнитивных архитектур

Пшенокова И.А.; Денисенко В.А.; Сундуков З.А.; Макоева Д.Г.; Нагоева О.В.; Бова В.В.

И.А. Пшенокова1, В.А. Денисенко1, З.А. Сундуков1, Д.Г. Макоева1, О.В.

1 2 Нагоева , В. В. Бова

1 Федеральное государственное бюджетное учреждение науки Институт

информатики и проблем регионального управления Кабардино-Балкарского научного

центра РАН

2Южный федеральный университет, Ростов-на-Дон

Аннотация: В работе рассматривается вопрос создания системы распознавания графических объектов в видеопотоке на основе мультиагентных рекурсивных когнитивных архитектур. Предложена структура системы, иерархия агентов и их взаимодействие. В статье приведено описание разработанного протокола обмена сообщениями между подсистемой кодирования информации полученной с устройств ввода видеосигнала и ядром мультиагентной рекурсивной когнитивной архитектуры. Ключевые слова: мультиагентная система, когнитивная архитектура, агент, распознавание образов, видеораспознавание, многомодальные данные, искусственный интеллект.

Введение

Теория распознавания образа - раздел информатики и смежных дисциплин, развивающий основы и методы классификации и идентификации предметов, явлений, процессов, сигналов, ситуаций и т. п. объектов, которые характеризуются конечным набором некоторых свойств и признаков [1].

Задача распознавания графических образов является классической задачей теории информатики, и в настоящий момент можно выделить два основных направления [2]:

• Изучение способностей к распознаванию, которыми обладают живые существа, объяснение и моделирование их;

• Развитие теории и методов построения устройств, предназначенных для решения отдельных задач в прикладных целях.

В статье рассматриваются вопросы построения системы распознавания использующей первое направление к теории распознавания графических

образов, и ее применение в коллаборативных робототехнических системах

[3].

Постановка задачи

Дано множество М объектов ы. Объекты задаются значениями некоторых признаков*;^ = 1, ..,Ы, наборы которых одинаковы для всех объектов. Совокупность признаковобъекта ы определяет некоторым образом его описание =

Значения признаков могут быть как числовыми, так и перечислимыми.

На всём множестве М существует разбиение на подмножества (классы объектов):

т

м = у п

¿=о

Задача распознавания состоит в том, чтобы для каждого данного объекта ы по егоописанию /(^)и априорной (обучающей) информации /0 вычислить значенияпредикатов

= 1,..,т

Для описания невозможности распознавания объектов предикаты Р^заменяютсявеличинамиа^ е (0, {ш е е П),).

Таким образом, для рассматриваемого объекта ю необходимо вычислить егоинформационный вектор — (_а1(ы),а1(ы>),...,а1т(ы>))

Процедура, строящая информационный вектор а(ш)в данном случае выражаеталгоритм принятия решения об отнесении объекта ы к тому или иному классу иназывается «решающей функцией».

Архитектура системы и принципы работы

Разработанная программная система основывается на теории мультиагентных рекурсивных когнитивных архитектур [4, 5, 6]. В

программном комплексе можно выбелить несколько подсистем (агентов) взаимодействующих друг с другом посредством сообщений:

• подсистема предобработки видео сигналов;

• ядро мультиагентной системы;

• подсистема вывода.

Подсистема предобработки видео сигналов реализована с использованием библиотеки ОрепСУ, и решает следующие задачи: захват видео с подключенных устройств;

• поиск объектов на изображении;

• построение контуров объектов, их локализация и определение дополнительны характеристик;

• передача информации в ядро мультиагентной рекурсивной когнитивной архитектуры.

Подсистема предобработки изображения, как и ядро мультиагентной рекурсивной когнитивной архитектуры, реализованы в виде сетевых сервисов взаимодействующих посредством сообщений. Сообщение представляет собой 1БОК документ структура которого представлена на рис. 1.

"Data": {

"Image1': "binary data of image",

"Objects": [

{

"Color": {"B": 255, "G": 255, "R": 255 },

"Form": "linework of object",

"Place": "binary data of object location11

}

L

"Size": {

"Height": 100, "TotalSize": 18066, "Width": 100

}

"Operation": "sendVideo"

Рис. 1.-JSON документ описывающий структуру сообщения между подсистемой предобработки видеосигнала и ядром мультиагентной рекурсивной когнитивной архитектуры.

Сообщение содержит 2 обязательных поля: ОретЫопи Data. В поле Operation указывается информация, позволяющая определить назначение передаваемого сообщения и воспринимается системой как заголовок сообщения. Поле Data содержит информацию которой обмениваются подсистемы между собой - тело сообщения.

При поступлении сообщения от подсистемы предобработки видеосигнала в ядро мультиагентной системы, для каждой входной сигнатуры определяется агент, отвечающий за эту сигнатуру. В случае отсутствия в системе агента распознающего такую сигнатуру, создается новый агент, в базу знаний которого закладывается набор правил, позволяющих ему распознавать эту сигнатуру.

Агенты, распознавшие входные сигнатуры различных модальностей, формируют сообщения отсылают их агентам следующего слоя, распознающим объекты по набору признаков. В том случае, если в системе присутствует агент-объект, распознающий сообщения от агентов-признаков,

система считает, что распознавание объекта выполнено. Если ни один агент-объект не распознал входную ситуацию, то создается новый агент в базе знаний которого записаны правила позволяющие идентифицировать объект по указанному набору сообщений от агентов-признаков.

Заключение

В статье приведено описание системы распознавания графических образов на основе мультиагентных рекурсивных когнитивных архитектур, применение которой возможно в системах технического зрения различных робототехнических систем. Предложенный подход позволяет расслоить информацию об объектах на несколько модальностей и для идентификации объектов использовать систему баз знаний агентов, каждый из которых отвечает за конкретное значение некоторой модальности или объект, описываемый комбинацией этих модальностей.

Благодарности

Работа выполнена при поддержке грантов:

1. Грант РФФИ, проект № 15-01-05844 «Разработка методов интеллектуального принятия решений на основе самоорганизации нейроподобных мультиагентных рекурсивных когнитивных архитектур»;

2. Грант РФФИ, проект № 5-07-08309 «Мультиагентное когнитивное моделирование и исследование многомодальных знаний в интеллектуальных системах».

Литература

1. Вапник В. Н., Червоненкис А. Я. Теория распознавания образов. М.: Наука, 1974.с.16-17.

2. Горелик А.Л., Скрипкин В.А. Методы распознавания. 4 изд. М.: Высшаяшкола, 2004.с.22-23.

3. Anchokov M., Denisenko V., Nagoev Z., Sundukov Z., Tazhev B. Interactive collaborative robotics and natural language interface based on multiagent Recursive cognitive architectures // First International Conference, ICR 2016 . Budapest, Hungary: 2016.pp.107-112.

4. Пшенокова И.А., Денисенко В.А., Нагоева О.В., Токмакова Д.Г., Сундуков З.А. Представление знаний в системах искусственного интеллекта на основе принципов онтонейроморфогенеза и мультиагентного моделирования // Известия Кабардино-Балкарского научного центра РАН. 2015. №6-2. с.158-165.

5. Денисенко В.А., Анчеков М.И., Кармоков М.М., Сундуков З.А. Разработка компьютерной модели мультиагентной когнитивной архитектуры // Известия Кабардино-Балкарского научного центра РАН. 2015. №6-2. с.61-65.

6. Денисенко В.А., Пшенокова И.А., Хамуков А.К. Нейрофизиологические алгоритмы зрительного анализатора головного мозга // Известия Кабардино-Балкарского научного центра РАН. 2015. №6-2. с. 6672.

7. Романов Д.Е. Нейронные сети обратного распространения ошибки// Инженерный вестник Дона, 2009, №3. URL: ivdon.ru/magazine/archive/n3y2009/143.

8. Артемьев И.С. , Лебедев А.И., Долгий А.И., Хатламаджиян А.Е. , Меерович В.Д. Метод блочного оптического распознавания инвентарных номеров железнодорожных подвижных единиц на основе комитетной нейроиммунной модели классификации// Инженерный вестник Дона, 2016, №4. URL: ivdon.ru/ru/magazine/archive/n1y2014/2259.

9. Lee, SW. Integrated segmentation and recognition of handwritten numerals with cascadeneural network / SW Lee, SY Kim // Systems, Man, and Cybernetics, Part C: Applications and Reviews, pp. 285-290, 1999.

10. Hastie T., Tibshirani R., Friedman J., The elements of statistical learning: Datamining, inference, andprediction. Springer, 2001- 533 p.

References

1. Vapnik V. N., Chervonenkis A. Ya. Teoriya raspoznavaniya obrazov. [Theory of image recognition]. M.: Nauka, 1974. pp.16-17.

2. Gorelik A.L., Skripkin V.A. Metody raspoznavaniya. [Methods of recognition]. 4 izd. M.: Vysshaya shkola, 2004. pp.22-23.

3. Anchokov M., Denisenko V., Nagoev Z., Sundukov Z., Tazhev B. Interactive collaborative robotics and natural language interface based on multiagent Recursive cognitive architectures First International Conference, ICR 2016. Budapest, Hungary: 2016. pp.107-112.

4. Pshenokova I.A., Denisenko V.A., Nagoeva O.V., Tokmakova D.G., Sundukov Z.A. Izvestiya Kabardino-Balkarskogo nauchnogo tsentra RAN. 2015. №6-2. pp.158-165.

5. Denisenko V.A., Anchekov M.I., Karmokov M.M., Sundukov Z.A. Izvestiya Kabardino-Balkarskogo nauchnogo tsentra RAN. 2015. №6-2. pp.61-65.

6. Denisenko V.A., Pshenokova I. A., Khamukov A.K. Izvestiya Kabardino-Balkarskogo nauchnogo tsentra RAN. 2015. №6-2. pp.66-72.

7. Romanov D.E. Inzenernyj vestnik Dona (Rus), 2009, №3. URL: ivdon.ru/magazine/archive/n3y2009/143.

8. Artem'ev I.S. , Lebedev A.I., Dolgiy A.I., Khatlamadzhiyan A.E. , Meerovich V.D. Inzenernyj vestnik Dona (Rus), 2016, №4. URL: ivdon.ru/ru/magazine/archive/n1y2014/2259.

9. Lee, SW. Integrated segmentation and recognition of handwritten numerals with cascade neural network. SW Lee, SY Kim. Systems, Man, and Cybernetics, Part C: Applications and Reviews, pp.285-290, 1999.

10. Hastie T., Tibshirani R., Friedman J., The elements of statistical learning: Data mining, inference, and prediction. Springer, 2001- 533 p.

Й Инженерный вестник Дона, №4 (2016) ivdon.ru/ru/magazine/arcliive/n4y2016/3911

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Пшенокова И. А., Денисенко В. А., Сундуков З. А., Макоева Д. Г., Нагоева О. В.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Пшенокова И. А., Денисенко В. А., Сундуков З. А., Макоева Д. Г., Нагоева О. В.

Development of the system videoraspoznavaniya graphic images based on multi-agent recursive cognitive architectures

Текст научной работы на тему «Разработка системы видеораспознавания графических образов на основе мультиагентных рекурсивных когнитивных архитектур»