Разработка системы видеораспознавания графических образов на основе мультиагентных рекурсивных когнитивных архитектур
И.А. Пшенокова1, В.А. Денисенко1, З.А. Сундуков1, Д.Г. Макоева1, О.В.
1 2 Нагоева , В. В. Бова
1 Федеральное государственное бюджетное учреждение науки Институт
информатики и проблем регионального управления Кабардино-Балкарского научного
центра РАН
2Южный федеральный университет, Ростов-на-Дон
Аннотация: В работе рассматривается вопрос создания системы распознавания графических объектов в видеопотоке на основе мультиагентных рекурсивных когнитивных архитектур. Предложена структура системы, иерархия агентов и их взаимодействие. В статье приведено описание разработанного протокола обмена сообщениями между подсистемой кодирования информации полученной с устройств ввода видеосигнала и ядром мультиагентной рекурсивной когнитивной архитектуры. Ключевые слова: мультиагентная система, когнитивная архитектура, агент, распознавание образов, видеораспознавание, многомодальные данные, искусственный интеллект.
Введение
Теория распознавания образа - раздел информатики и смежных дисциплин, развивающий основы и методы классификации и идентификации предметов, явлений, процессов, сигналов, ситуаций и т. п. объектов, которые характеризуются конечным набором некоторых свойств и признаков [1].
Задача распознавания графических образов является классической задачей теории информатики, и в настоящий момент можно выделить два основных направления [2]:
• Изучение способностей к распознаванию, которыми обладают живые существа, объяснение и моделирование их;
• Развитие теории и методов построения устройств, предназначенных для решения отдельных задач в прикладных целях.
В статье рассматриваются вопросы построения системы распознавания использующей первое направление к теории распознавания графических
образов, и ее применение в коллаборативных робототехнических системах
[3].
Постановка задачи
Дано множество М объектов ы. Объекты задаются значениями некоторых признаков*;^ = 1, ..,Ы, наборы которых одинаковы для всех объектов. Совокупность признаковобъекта ы определяет некоторым образом его описание =
Значения признаков могут быть как числовыми, так и перечислимыми.
На всём множестве М существует разбиение на подмножества (классы объектов):
т
м = у п
¿=о
Задача распознавания состоит в том, чтобы для каждого данного объекта ы по егоописанию /(^)и априорной (обучающей) информации /0 вычислить значенияпредикатов
= 1,..,т
Для описания невозможности распознавания объектов предикаты Р^заменяютсявеличинамиа^ е (0, {ш е е П),).
Таким образом, для рассматриваемого объекта ю необходимо вычислить егоинформационный вектор — (_а1(ы),а1(ы>),...,а1т(ы>))
Процедура, строящая информационный вектор а(ш)в данном случае выражаеталгоритм принятия решения об отнесении объекта ы к тому или иному классу иназывается «решающей функцией».
Архитектура системы и принципы работы
Разработанная программная система основывается на теории мультиагентных рекурсивных когнитивных архитектур [4, 5, 6]. В
программном комплексе можно выбелить несколько подсистем (агентов) взаимодействующих друг с другом посредством сообщений:
• подсистема предобработки видео сигналов;
• ядро мультиагентной системы;
• подсистема вывода.
Подсистема предобработки видео сигналов реализована с использованием библиотеки ОрепСУ, и решает следующие задачи: захват видео с подключенных устройств;
• поиск объектов на изображении;
• построение контуров объектов, их локализация и определение дополнительны характеристик;
• передача информации в ядро мультиагентной рекурсивной когнитивной архитектуры.
Подсистема предобработки изображения, как и ядро мультиагентной рекурсивной когнитивной архитектуры, реализованы в виде сетевых сервисов взаимодействующих посредством сообщений. Сообщение представляет собой 1БОК документ структура которого представлена на рис. 1.
"Data": {
"Image1': "binary data of image",
"Objects": [
{
"Color": {"B": 255, "G": 255, "R": 255 },
"Form": "linework of object",
"Place": "binary data of object location11
}
L
"Size": {
"Height": 100, "TotalSize": 18066, "Width": 100
}
"Operation": "sendVideo"
Рис. 1.-JSON документ описывающий структуру сообщения между подсистемой предобработки видеосигнала и ядром мультиагентной рекурсивной когнитивной архитектуры.
Сообщение содержит 2 обязательных поля: ОретЫопи Data. В поле Operation указывается информация, позволяющая определить назначение передаваемого сообщения и воспринимается системой как заголовок сообщения. Поле Data содержит информацию которой обмениваются подсистемы между собой - тело сообщения.
При поступлении сообщения от подсистемы предобработки видеосигнала в ядро мультиагентной системы, для каждой входной сигнатуры определяется агент, отвечающий за эту сигнатуру. В случае отсутствия в системе агента распознающего такую сигнатуру, создается новый агент, в базу знаний которого закладывается набор правил, позволяющих ему распознавать эту сигнатуру.
Агенты, распознавшие входные сигнатуры различных модальностей, формируют сообщения отсылают их агентам следующего слоя, распознающим объекты по набору признаков. В том случае, если в системе присутствует агент-объект, распознающий сообщения от агентов-признаков,
система считает, что распознавание объекта выполнено. Если ни один агент-объект не распознал входную ситуацию, то создается новый агент в базе знаний которого записаны правила позволяющие идентифицировать объект по указанному набору сообщений от агентов-признаков.
Заключение
В статье приведено описание системы распознавания графических образов на основе мультиагентных рекурсивных когнитивных архитектур, применение которой возможно в системах технического зрения различных робототехнических систем. Предложенный подход позволяет расслоить информацию об объектах на несколько модальностей и для идентификации объектов использовать систему баз знаний агентов, каждый из которых отвечает за конкретное значение некоторой модальности или объект, описываемый комбинацией этих модальностей.
Благодарности
Работа выполнена при поддержке грантов:
1. Грант РФФИ, проект № 15-01-05844 «Разработка методов интеллектуального принятия решений на основе самоорганизации нейроподобных мультиагентных рекурсивных когнитивных архитектур»;
2. Грант РФФИ, проект № 5-07-08309 «Мультиагентное когнитивное моделирование и исследование многомодальных знаний в интеллектуальных системах».
Литература
1. Вапник В. Н., Червоненкис А. Я. Теория распознавания образов. М.: Наука, 1974.с.16-17.
2. Горелик А.Л., Скрипкин В.А. Методы распознавания. 4 изд. М.: Высшаяшкола, 2004.с.22-23.
3. Anchokov M., Denisenko V., Nagoev Z., Sundukov Z., Tazhev B. Interactive collaborative robotics and natural language interface based on multiagent Recursive cognitive architectures // First International Conference, ICR 2016 . Budapest, Hungary: 2016.pp.107-112.
4. Пшенокова И.А., Денисенко В.А., Нагоева О.В., Токмакова Д.Г., Сундуков З.А. Представление знаний в системах искусственного интеллекта на основе принципов онтонейроморфогенеза и мультиагентного моделирования // Известия Кабардино-Балкарского научного центра РАН. 2015. №6-2. с.158-165.
5. Денисенко В.А., Анчеков М.И., Кармоков М.М., Сундуков З.А. Разработка компьютерной модели мультиагентной когнитивной архитектуры // Известия Кабардино-Балкарского научного центра РАН. 2015. №6-2. с.61-65.
6. Денисенко В.А., Пшенокова И.А., Хамуков А.К. Нейрофизиологические алгоритмы зрительного анализатора головного мозга // Известия Кабардино-Балкарского научного центра РАН. 2015. №6-2. с. 6672.
7. Романов Д.Е. Нейронные сети обратного распространения ошибки// Инженерный вестник Дона, 2009, №3. URL: ivdon.ru/magazine/archive/n3y2009/143.
8. Артемьев И.С. , Лебедев А.И., Долгий А.И., Хатламаджиян А.Е. , Меерович В.Д. Метод блочного оптического распознавания инвентарных номеров железнодорожных подвижных единиц на основе комитетной нейроиммунной модели классификации// Инженерный вестник Дона, 2016, №4. URL: ivdon.ru/ru/magazine/archive/n1y2014/2259.
9. Lee, SW. Integrated segmentation and recognition of handwritten numerals with cascadeneural network / SW Lee, SY Kim // Systems, Man, and Cybernetics, Part C: Applications and Reviews, pp. 285-290, 1999.
10. Hastie T., Tibshirani R., Friedman J., The elements of statistical learning: Datamining, inference, andprediction. Springer, 2001- 533 p.
References
1. Vapnik V. N., Chervonenkis A. Ya. Teoriya raspoznavaniya obrazov. [Theory of image recognition]. M.: Nauka, 1974. pp.16-17.
2. Gorelik A.L., Skripkin V.A. Metody raspoznavaniya. [Methods of recognition]. 4 izd. M.: Vysshaya shkola, 2004. pp.22-23.
3. Anchokov M., Denisenko V., Nagoev Z., Sundukov Z., Tazhev B. Interactive collaborative robotics and natural language interface based on multiagent Recursive cognitive architectures First International Conference, ICR 2016. Budapest, Hungary: 2016. pp.107-112.
4. Pshenokova I.A., Denisenko V.A., Nagoeva O.V., Tokmakova D.G., Sundukov Z.A. Izvestiya Kabardino-Balkarskogo nauchnogo tsentra RAN. 2015. №6-2. pp.158-165.
5. Denisenko V.A., Anchekov M.I., Karmokov M.M., Sundukov Z.A. Izvestiya Kabardino-Balkarskogo nauchnogo tsentra RAN. 2015. №6-2. pp.61-65.
6. Denisenko V.A., Pshenokova I. A., Khamukov A.K. Izvestiya Kabardino-Balkarskogo nauchnogo tsentra RAN. 2015. №6-2. pp.66-72.
7. Romanov D.E. Inzenernyj vestnik Dona (Rus), 2009, №3. URL: ivdon.ru/magazine/archive/n3y2009/143.
8. Artem'ev I.S. , Lebedev A.I., Dolgiy A.I., Khatlamadzhiyan A.E. , Meerovich V.D. Inzenernyj vestnik Dona (Rus), 2016, №4. URL: ivdon.ru/ru/magazine/archive/n1y2014/2259.
9. Lee, SW. Integrated segmentation and recognition of handwritten numerals with cascade neural network. SW Lee, SY Kim. Systems, Man, and Cybernetics, Part C: Applications and Reviews, pp.285-290, 1999.
10. Hastie T., Tibshirani R., Friedman J., The elements of statistical learning: Data mining, inference, and prediction. Springer, 2001- 533 p.
Й Инженерный вестник Дона, №4 (2016) ivdon.ru/ru/magazine/arcliive/n4y2016/3911