Научная статья на тему 'Информационная система автоматического описания сцен по видеоизображениям'

Информационная система автоматического описания сцен по видеоизображениям Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
162
56
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
АГЕНТЫ / НЕЧЕТКАЯ КЛАССИФИКАЦИЯ / AGENTS / FUZZY CLASSIFICATION

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Сергеев Николай Евгеньевич, Целых Юлия Александровна

Рассматриваются алгоритмические основы и технологию работы системы видеоаналитики, решающей задачу автоматического описания сцен по видеоизображению. Для извлечения данных из видеопотоков предложен подход на основе виртуальных агентов слежения. Полученные неточные данные посредством нечеткой классификации приобретают вид лингвистического описания, которое синхронизируется с видеозаписью для последующей автоматизированной обработки.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

INFORMATION SYSTEM OF AUTOMATIC IDENTIFICATION OF SCENES USING VIDEO IMAGES

We consider algorithmic foundations and technologies of video analytics system that tackles a problem of automatic identification of scenes using video images. To mine data from video streams, we suggest an approach based on virtual surveillance agents. Imprecise data we obtain during fuzzy classification gets a linguistic description that is synchronize with a video record for future automatic processing.

Текст научной работы на тему «Информационная система автоматического описания сцен по видеоизображениям»

Как видно из примера, при данном виде роста графов получившиеся графы сохраняют такое свойство, как древовидность, центр для всех этих графов тот же, числовые характеристики, такие как диаметр, радиус и др., достаточно легко просчитываются.

Внешний рост удобен тем, что мы легко можем менять начальные характеристики и быстро прогнозировать изменения. При этом он наиболее похож на рост деревьев в природе. Однако имеются проблемы с построением графа подобной структуры.

БИБЛИОГРАФИЧЕСКИЙ СПИСОК

1. БержК. Теория графов и ее применение: Пер. с франц. - М.: Иностранной литературы, 1962. - С. 131-138, 165-173.

2. Мелихов А.Н., Берштейн Л.С. Конечные четкие и расплывчатые множества. Часть 1. -Таганрог, ТРТИ, 1980.

Погибельский Александр Юрьевич

Технологический институт федерального государственного образовательного учреждения высшего профессионального образования «Южный федеральный университет» в г. Таганроге E-mail: [email protected]

347928, г. Таганрог, пер. Некрасовский, 44, моб. 8-908-514-95-37 Аспирант.

Pogibelskiy Aleksandr Yur’evich

Taganrog Institute of Technology - Federal State-Owned Educational Establishment of Higher Vocational Education «Southern Federal University»

E-mail: [email protected]

44, Nekrasovskiy, Taganrog, 347928, Russia, cell: 8-908-514-95-37 Post-graduate student.

УДК 681.3

Н.Е. Сергеев, Ю.А. Целых

ИНФОРМАЦИОННАЯ СИСТЕМА АВТОМАТИЧЕСКОГО ОПИСАНИЯ СЦЕН ПО ВИДЕОИЗОБРАЖЕНИЯМ

Рассматриваются алгоритмические основы и технологию работы системы видеоаналитики, решающей задачу автоматического описания сцен по видеоизображению. Для извлечения данных из видеопотоков предложен подход на основе виртуальных агентов слежения. Полученные неточные данные посредством нечеткой классификации приобретают вид лингвистического описания, которое синхронизируется с видеозаписью для последующей автоматизированной обработки.

Агенты, нечеткая классификация.

N.E. Sergeev, J.A. Tselykh

INFORMATION SYSTEM OF AUTOMATIC IDENTIFICATION OF SCENES USING VIDEO IMAGES

We consider algorithmic foundations and technologies of video analytics system that tackles a problem of automatic identification of scenes using video images. To mine data from video streams, we suggest an approach based on virtual surveillance agents.

Imprecise data we obtain during fuzzy classification gets a linguistic description that is synchronize with a video record for future automatic processing.

Agents, fuzzy classification.

По прогнозам специалистов, мировой рынок средств видеонаблюдения в 2010 г. составит 8 млрд долл. [1]. Взрывной рост объемов видеоинформации, нуждающейся в быстром и тщательном анализе, обусловливает актуальность развития методов и алгоритмов интеллектуальной обработки видеоизображений. Причём анализа требуют как видеопотоки реального времени, так и содержимое видеоархивов. Современные средства видеоаналитики должны совмещать в себе высокую эффективность оперативного видеоконтроля, комплексный анализ сцены и расширенные возможности автоматической индексации потока видеоизображений.

Современные достижения теории распознавания образов не совсем подходят для таких задач в силу больших затрат вычислительных ресурсов и особенно времени. Основная задача в нашем случае состоит в выделении простых признаков и получении их значений достаточных для описания сцен по видео- и фотоизображениям. Для получения значений таких признаков разработаны алгоритмы локальной обработки видеокадров, которые назовём «виртуальными сенсорами» (ВС). С использованием ВС можно значительно сократить объём обрабатываемой видеоинформации. Однако в связи с этим возникает задача управления ВС для определения актуальных областей видеокадра. «Виртуальный сенсор» вместе с алгоритмом управления представляет собой виртуальный агент слежения [2]. Таким образом, средой агента является адресное пространство видеокадра. Рецепторами агента являются контрольные интервалы, расположенные вокруг наблюдаемой части объекта [3]. Агент имеет два типа эффекторов. Одни обеспечивают перемещение самого агента по адресному пространству видеокадра и перемещение контрольных интервалов, другие сообщают текущие координаты объекта слежения.

Рис. 1. Классификация двигательных действий человека

Рассмотрим используемый подход к описанию двигательных действий человека. Нас будут интересовать следующие элементарные двигательные действия:

принятие и смена позы (стоять, сидеть, лежать); перемещение в пространстве (ходьба, бег, прыжки); действия с предметом (взять, переместить, опустить) и т.д. Обобщенную классификацию двигательных действий по М.В. Гамезо и И.А. До-машенко представим в виде схемы на рис. 1.

Рис. 2. Схема анализа изменения положения тела

Анализ сцен начинается с выделения отдельных стационарных и движущихся объектов. В общем случае с каждым изображением объекта производится следующая последовательность действий: нахождение контура объекта, размещение характеризующих отрезков, нахождение контролируемых областей или точек, замена изображения объекта «изображением фантома», привязка «фантома» к изображению, отслеживание изменения положения таких отрезков, отслеживание изменений положения контрольных областей и точек, приближенные геометрические измерения положения отрезков на предметных шкалах, фазификация данных измерений, нечеткая классификация стационарного положения «фантома», нечеткая классификация изменения положения объектов, нечеткая классификация сцен, кодирование

описания, привязка описания к последовательности кадров видеоизображения, «реагирование» на ситуацию (например, привлечение внимания оператора).

Для упрощения представления методов анализа изображения по месту локализации агентов слежения размещаются маркеры и производится замена изображения объекта упрощенным макетом-фантомом. Места примерного расположения маркеров - кисти рук, плечевые и локтевые суставы, голова, суставы ног, ступни ног. На начальной фазе мониторинга объекта решается задача первоначального размещения агентов.

Распознавать изменение положения тела предлагается на основе анализа двух кадров видеоизображения. Причем расстояние между видеокадрами выбирается в зависимости от скорости предыдущих перемещений наблюдаемых элементов видеоизображения. Пример анализа изменений положения человека представлен на рис. 2.__________

А

___і

■М

__* Ь

Рис. 3. Изменение значения функции принадлежности при различных углах сгиба

При практическом использовании ВС неизбежны сложности, связанные с недоопределенностью (неточностью, неоднозначностью) и переопределенностью (противоречивостью) знаний. Для получения практически полезных результирующих значений классификации каждый признак будем описывать соответствующей лингвистической переменной. На рис. 3 представлены видеокадры реального изображения, соответствующие изображения упрощенного макета-фантома и значения функции принадлежности «ИЗГИБ ПРАВОЙ РУКИ (ПРОФИЛЬ)» на предметной шкале угла сгиба. Анализ видеоизображений будем производить с по-

мощью маркеров. Так, если необходимо проанализировать движение руки, то маркеры прикрепляются к плечу, локтю, запястью и к пальцам.

Для заключения о положении объекта необходима информация от нескольких разных маркеров. При этом некоторые из них могут не оказывать влияния на результат, а другие будут крайне важны.

Описание положения объекта на нижнем кадре (рис. 4) может выглядеть следующим образом:

ОБЪЕКТ СТОИТ ПРЯМО (Наклон туловища={ <1.0/МАЛЫЙ>, <0.0/СРЕДНИЙ>, <0.0/БОЛЬШОЙ>, }),

ПРАВАЯ РУКА ПРЯМАЯ (Изгиб правой руки ={ <1.0/МАЛЫЙ>, <0.0/СРЕДНИЙ>, <0.0/СИЛЬНЫЙ>, }),

ЛЕВАЯ РУКА СЛЕГКА СОГНУТА (Изгиб левой руки ={ <0.16/МАЛЫЙ>, <0.83/СРЕДНИЙ>, <0.0/СИЛЬНЫЙ>, },

ПРАВАЯ НОГА ПРЯМАЯ (Изгиб правой ноги ={ <1.0/МАЛЫЙ>, <0.0/СРЕДНИЙ>, <0.0/СИЛЬНЫЙ>, }),

ЛЕВАЯ НОГА ИЗОГНУТА (Изгиб правой руки ={ <0.0/МАЛЫЙ>,

<1.0/СРЕДНИЙ>, <0.0/СИЛЬНЫЙ>}).

Описание действия объекта по двум видеокадрам в случае непосредственного измерения значений углов выглядит следующим образом: ОБЪЕКТ остался СТОЯТЬ ПРЯМО (Измение наклона туловища={ <1.0/МАЛОЕ>, <0.0/СРЕДНЕЕ>, <0.0/БОЛЬШОЕ>, }),

ПРАВАЯ РУКА осталась ВЫПРЯМЛЕННОЙ И ОПУШЕННОЙ (ПРАВАЯ РУКА была ПРЯМОЙ и Изменение изгиба правой руки ={ <1.0/МАЛОЕ>, <0.0/СРЕДНее>, <0.0/СИЛЬНОЕ>, }),

ЛЕВУЮ РУКУ согнул (ЛЕВАЯ РУКА была ПРЯМОЙ и Изменение изгиба левой руки ={ <0.1/МАЛЫЙ>, <0.9/СРЕДНИЙ>, <0.0/СИЛЬНЫЙ>, },

ПРАВАЯ НОГА осталась ПРЯМОЙ (ПРАВАЯ НОГА была ПРЯМОЙ и Изменение изгиба правой ноги ={ <1.0/МАЛОЕ>, <0.0/СРЕДНЕЕ>, <0.0/СИЛЬНОЕ>, }),

ЛЕВУЮ НОГУ согнул (ЛЕВАЯ НОГА была ПРЯМОЙ и Изменение изгиба левой ноги ={ <0.0/МАЛОЕ>, <1.0/СРЕДНЕЕ>, <0.0/СИЛЬНОЕ>}).

В целях простоты представления приводится пример для лингвистических переменных с тремя аналогичными термами, изменение шрифта в пределах представленных высказываний и даже одного имени лингвистической переменной или терма носит смысловое значение и используется при последующем кодировании извлеченных описаний.

Описание перемещений наблюдаемых элементов объектов может производиться либо на основе непосредственных измерений на предметной шкале значений скоростей перемещений, либо с применением трёх уровней фазификафии [3] к значениям полученным на предметной шкале координат положений маркеров.

Полученное (извлеченное) описание перед архивированием или связыванием с видеокадрами подвергается кодированию. Кодирование заключается в нахождении маршрута от корней к терминальным вершинам (листьям) в графах (деревьях) положений объектов, перемещений объектов и графе сцен. Такие графы составлены на основе классификации двигательных действий и сцен. Окончанием маршрута является вершина, которая соответствует данному положению, перемещению или

сцене. Кодом или индексом видеокадра или последовательности видеокадров является перечисление числовых обозначений вершин маршрута.

Лингв. переменная \значения функ. принадлежности Д1 Д2 д3 Угол

Наклон туловища 1 0 0 177

Изгиб правой руки 1 0 0 152

Изгиб левой руки 0.73 0.27 0 142

Изгиб правой ноги 1 0 0 163

Изгиб левой ноги 1 0 0 161

Лингв. переменная \значения функ. принадлежности Д1 Д2 д3 Угол

Наклон туловища 1 0 0 174

Изгиб правой руки 1 0 0 155

Изгиб левой руки 0.16 0.83 0 125

Изгиб правой ноги 1 0 0 178

Изгиб левой ноги 0 1 0 116

Рис. 4. Объект: а) стоит прямо; б) согнуты левый локоть, колено и стопа

Полученые индексы могут в дальнейшем использоваться для поиска видео-фагментов, инфомирования должностных лиц, управления техническими средствами или для дальнейшей обработки в интересах поддержки принятия решений.

БИБЛИОГРАФИЧЕСКИИ СПИСОК

1. Юдинцев В.А. Роль видеоаналитики для систем наблюдения // Системы безопасности. 2008. - № 3.

2. Тарасов В.Б. От многоагентных систем к интеллектуальным организациям: философия, психология, информатика. - М.: Эдиториал УРСС, 2002. - 352 с.

3. Сергеев Н.Е. Нечеткие модели инструментальных двигательных действий оператора. -Ростов-на-Дону: Изд-во Рост. ун-та, 2004. - 136 с.

Сергеев Николай Евгеньевич

Технологический институт федерального государственного образовательного учреждения высшего профессионального образования «Южный федеральный университет» в г. Таганроге E-mail: [email protected]

347928, г. Таганрог, пер. Некрасовский, 44, тел. 31-22-41 Начальник военной кафедры.

Целых Юлия Александровна E-mail:[email protected] моб. 9І8-520-34-79 Аспирант

Sergeev Nikolay Evgenievich

Taganrog Institute of Technology - Federal State-Owned Educational Establishment of Higher Vocational Education «Southern Federal University»

E-mail: [email protected]

44, Nekrasovskiy, Taganrog, 347928, Russia, phone: 31-22-41 Professor.

Tselykh Julia Alexandrovna

E-mail: [email protected] cell: 918-520-34-79 The post-graduate student

i Надоели баннеры? Вы всегда можете отключить рекламу.