Научная статья на тему 'Математическое моделирование и оценка параметров видеоинформационной системы наблюдения на транспорте'

Математическое моделирование и оценка параметров видеоинформационной системы наблюдения на транспорте Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
140
41
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ / ПРОСТРАНСТВЕННО-РЕКУРСИВНЫЙ МЕТОД / ПОЛИГОН / РАЗБИЕНИЕ ИЗОБРАЖЕНИЯ / MATHEMATICAL MODELING / SPACE-RECURSIVE METHOD / POLYGON AND SPLITTING OF THE IMAGE

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Костикова Елена Валентиновна

Рассмотрено математическое моделирование и оценка эффективности алгоритмов сжатия и восстановления изображений на основе пространственно-рекурсивного метода. Разработаны математическая модель и структуры видеоданных системы. Получены оптимальные значения параметров видеоинформационной системы.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Костикова Елена Валентиновна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Mathematical modeling and estimation of efficiency of the algorithms of image compression and restoration on the basis of a spatially-recursive method are considered. Mathematical model and structures of videodata system are developed. Optimum values of the parameters of video information system are received.

Текст научной работы на тему «Математическое моделирование и оценка параметров видеоинформационной системы наблюдения на транспорте»

УКД 621.397.13 Е. В. Костикова,

аспирант,

СПГУВК

МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ И ОЦЕНКА ПАРАМЕТРОВ ВИДЕОИНФОРМАЦИОННОЙ СИСТЕМЫ НАБЛЮДЕНИЯ НА ТРАНСПОРТЕ MATHEMATICAL MODELLING AND ESTIMATION OF PARAMETERS OF VIDEOINFORMATION SYSTEM OF SUPERVISION ON TRANSPORT

Рассмотрено математическое моделирование и оценка эффективности алгоритмов сжатия и восстановления изображений на основе пространственно-рекурсивного метода. Разработаны математическая модель и структуры видеоданных системы. Получены оптимальные значения параметров видео-информационной системы.

Mathematical modeling and estimation of efficiency of the algorithms of image compression and restoration on the basis of a spatially-recursive method are considered. Mathematical model and structures of videodata system are developed. Optimum values of the parameters of video information system are received.

Ключевые слова: математическое моделирование, пространственно-рекурсивный метод, полигон, разбиение изображения.

Key words: mathematical modeling, space-recursive method, polygon and splitting of the image.

И ОСТ сложности антропогенных систем обострил проблему эффективного взаимодействия человека с машиной. Возникла острая необходимость создания эффективного для пользователя интерфейса.

В широком толковании этого понятия пользовательский интерфейс должен обеспечивать в конечном счете безопасную эксплуатацию систем, в том числе на транспорте, сбережение материальных, людских и прочих ресурсов. К одному из фундаментальных направлений развития пользовательского интерфейса принадлежит аппаратная реализация системных функций, ранее выполнявшихся человеком, чему в немалой степени способствует состояние современной электронной базы, характеризуемое высоким уровнем интеграции электронных компонент на одном кристалле.

Системы с развитым уровнем внутренней интерпретации организационных и управляющих функций человека принято называть интеллектуальными. При этом их важнейшим атрибутом являются системы искусственного зрения (СИЗ), в анализе развития которых можно выделить системные аспекты. Одним из главных системных аспектов является тенденция приближения средств обработки видеоинформации к источнику ее возникновения, обусловленная интенсивным развитием микроэлектронной элементной базы. Лучше других продвинулись в этом направлении робототехника и беспилотные летательные аппараты.

Обработка изображений с целью их распознавания является одной из центральных и практически важных задач при создании систем искусственного интеллекта для решения задач обеспечения безопасности и контроля над объектами, в том числе на транспорте.

Актуальность выбранной темы научных исследований объясняется ее отношением к проблемам мониторинга и визуального наблюдения за объектами транспортных процессов, а также формированием баз видеоданных и знаний об объектах транспортных систем.

В настоящий момент с появлением новой элементной базы в виде систем на кристалле и современных САПР на ее основе открылись новые возможности создания видеоинформационных систем (ВИС) обработки изображений. Сняты многие ограничения по сложности для проектирования ВИС, что должно способствовать решению основных задач хранения и передачи видеоданных техническими системами [1; 2]. В сложившейся ситуации актуальным является поиск новых

Выпуск 3

Выпуск 3

подходов и способов в обработке изображений, которые, с одной стороны, соответствовали бы особенностям восприятия видеоданных человеком, а с другой — были бы естественными для ЭВМ [3; 4, с. 38-43].

В работах [5, с. 88-92; 6, с. 36-40] предложены метод и алгоритмы для кодирования изображений с применением пирамидально-рекурсивного метода кодирования, в основе которого лежит принцип рекурсивного разбиения изображения с целью представления в виде структурированной совокупности семантически значимых единиц или опорных точек (ОТ) и правил их взаимосвязей (соединения). Причем выделение ОТ и разработка оптимальной структуры данных для их хранения и передачи является одной из сложнейших задач искусственного зрения [6; 7, с. 146-151].

В данной работе проводится математическое моделирование и исследование алгоритмов сжатия и восстановления изображений на основе пространственно-рекурсивного метода и построения математической модели оценки параметров ВИС.

Регулярность пирамидальных алгоритмов предопределяет их удобную структурную реализацию и эффективное использование в ВИС при хранении и передаче видеоданных, например относительную высокую степень сжатия при создании баз видеоданных и высокую производительность ВИС в процессе передачи (то есть возможность параллельной обработки) [8]. Однако возникает задача разработки математической модели для оценки оптимальных параметров ВИС: число ОТ, число уровней разбиения изображения, число полигонов и т. д.

Постановка задачи исследования. Современные мультимедийные и многомодальные подходы к подаче информации потребителю предполагают передачу текстов сообщений, сопровождаемых значительным количеством видео- и аудиоинформации. Среди этих трех видов представления информации видеоданные в наибольшей степени загружают ресурсы информационной инфраструктуры. Предлагаемый метод сжатия изображений для построения систем искусственного зрения на транспорте на основе рекурсивного разбиения и последующего выделения ОТ для представления хранения и передачи изображений является обоснованным и востребованным, однако необходимо определить эффективность такого подхода.

Каждая ОТ характеризуется своими абсолютными координатами и яркостью. При этом все ОТ равновероятно распределены в пределах всего исходного изображения. Процесс кодирования изображения представляется следующим образом: ОТ последовательно и в произвольном порядке наносятся на поле изображения; после появления очередной ОТ производится разбиение на одинаковые полигоны, если в соответствующем полигоне окажутся две опорные точки; полигон разбивается на равные части до тех пор, пока каждая опорная точка не окажется единственной в своем полигоне. Очевидно, количество возможных дроблений ограничено заданной дискретностью изображения. В итоге в завершении процесса кодирования будет получена неравномерная полигональная сетка, где одни полигоны имеют опорную точку, а другие — нет (то есть оказываются пустыми). В статье вводится новое понятие «пустой полигон», важное для достижения максимального сжатия по ОТ.

Для математического моделирования алгоритмов сжатия по ОТ введены следующие обозначения: п — число ОТ, равное числу заполненных (покрывающих ОТ) полигонов (рис. 1, а); т — максимальное число уровней разбиений, приводящее к размеру полигона в один пиксель изображения; й — число полигонов, полученных при разбиении исходного полигона; N — общее число пикселей исходного изображения. Очевидно, что N = йт, К — число бит информации, необходимое для кодирования только местоположения ОТ, V — разрядность яркости ОТ.

Требуется оценить функцию К = ^(п, й, т) и найти оптимальное число полигонов после разбиения й, минимизирующее функцию К (то есть ^^шт). В нормированных единицах искомое отношение запишется в виде: к = /(пнор, й, т), где к = К/М, пнор = п/М

Разработка математической модели. Ввиду случайного характера формирования сообщения (то есть появления опорных точек), необходимо связать количество информации с вероятностями появления каждого сообщения источника. Эту задачу решил в 1946 г. К. Шеннон при кодировании двойного источника [9].

Учитывая то обстоятельство, что все ОТ появляются независимо друг от друга и с одинаковой вероятностью, то число бит информации для кодирования местоположений ОТ в общем виде будет Imax = n-log-N [9].

Коэффициент сжатия определяется выражением

K = (n v + n logN)/(n v +B), то есть k = (n v + пнор log N)/( n^v + b), где log N — разрядность абсолютных координат ОТ, к = K/N и n = n/N, E = An/n.

i = 3 5=1/^

i = 2 S=l/<?

i= 1 5= 1/d1

X 1 2 3 4 5 6 7 8 9

Сжатое описание Прі Пр2 Прі Прі Пр3 Пр2 Пр2 Прз Пр2

Код 11 0* 11 11 10 0* 0* 10 0*

10 11 12 13 14 15 16 17

Пр2 Пр2 Прз Пр, Пр2 Пр2 Пр2 Пр3

0* 0* 10 11 0* 0* 0* 10

Рис. 1. Формирование сжатого описания: а — исходное изображение; б — сжатое описание, где * — информация о координатах ОТ в пределах полигона

а

Структура данных и способ сжатия изображений по ОТ подробно описаны в [5; 6]. Легко заметить, количество информации для хранения и передачи ОТ определяется выражением

\^пшооЕ(Е + 1Х при с/=2;

К = logd*( n m - (id) Y/rzi

нор

m - <Ш"‘) / />-^1 (2dE + d + \)/(d-i), при d >2.

1=\ V нор'

Данное выражение позволяет вычислить число бит информации, необходимое для определения местоположения ОТ в пределах исходного изображения. Однако для этого необходимо определить следующие функции:

Е = .Ди , d, m) — долю пустых полигонов по отношению к числу ОТ;

= Д(инор, d, т, I) — число заполненных полигонов различных уровней I.

Для нахождения Е и рассмотрим следующую модель. Изображение представим полем площадью 1; ОТ последовательно наносятся на поле с равной вероятностью появления в любой точке, что приводит к дроблению соответствующих полигонов, при котором появляются как заполненные, так и пустые полигоны.

Обозначим: г.. — суммарную площадь пустых полигонов /-го уровня после появления /-й

Выпуск 3

Выпуск 3

точки; Б.. — суммарную площадь заполненных полигонов уровня г после появления точки .; р.. — вероятность появления ОТ у + 1 в пустом полигоне уровня /; д.. — вероятность появления ОТ. + 1 в заполненных полигонах уровня /; X — число заполненных полигонов уровня . после появления точки у; У — число пустых полигонов уровня . после появления точки.

Поскольку площадь полигона уровня . равна 1/й, то, очевидно, ряд соотношений:

т т т т

гм + ^) = 1, Е (р л +Чл) = 1, Е2 и 2 я = . • й , УЯ=гя • ^

1=1

£=1

е=1

1=1

где у = 1, ..., и; I = 1, ..., га; г

.1

1)/й, Б = 1/й, р = (й-1)/й и д11 = Ш.

Искомые величины X г и Е для вычисления по выражению К будут:

т

Е(«нор, й, т) = , при У = и, и X, (инор, й, т, I) = 2^, где I = 1, ..., т.

После появления каждой ОТ величины р.. и д.. вычисляются по площадям г Б (рис. 2):

Р]г = г. /(1 - .(1/^)) и д. = 8 - г.. (1/ йга))/(1 - .■•1/й”).

Возможные ситуации Заполненные полигоны

1 = 3 £= Ш3

г = 2 5 = Ш:

Рис. 2. Возможные варианты появления опорных точек

В знаменателе выражений и числителе второго выражения учитываются те площади, где невозможны повторные появления ОТ из-за конечного числа пикселей на изображении.

Площади г.. и Б.. вычисляются как математическое ожидание случайных величин, принимающих значение различных площадей с соответствующими вероятностями в зависимости от появления ОТ в заполненных или пустых полигонах для всех уровней.

Рассмотрим вычисление площади г.+1 .. В зависимости от координат очередной ОТ возможны следующие ситуации (рис. 2):

1. Уменьшение площади: г . = г.. - 1/й1. Это соответствует появлению. + 1 ОТ в пустом полигоне /-го уровня; вероятность этого события р.. (цифра 1 на рис. 2);

2. Увеличение площади: г . = г.. + (й - 2)/й‘. Это соответствует появлению ОТ в заполненном полигоне более низкого уровня при условии, что ОТ вызвала цепочку дроблений до уровня I, то есть появилось й новых полигонов, из них й - 2 — пустых и два заполненных: предшествующий и текущий. + 1-й ОТ (цифра 2 на рис. 2). Пусть ОТ появилась в заполненном полигоне уровня . - 1; вероятность этого события д . _ Тогда возможны две ситуации:

— с вероятностью 1/й потребуется более одного разбиения (цифра 2' на рис. 2);

— с вероятностью 1 - 1/й потребуется одно разбиение (цифра 2 на рис. 2).

Следовательно, интересующая нас вероятность при условии появления ОТ в полигоне уровня . - 1 составит ^,.^-(1 - 1/й). Если ОТ появилась в заполненном полигоне уровня / - 2 (вероятность д,._ 2), то с вероятностью (1/й)(1/й) потребуется более двух разбиений, а с вероятностью

. . 2

1/й(1 - 1/й) — два разбиения, то есть до уровня /. Следовательно, интересующая нас вероятность составит д,._ • 1/й-(1 - 1/й). В итоге, суммируя вероятности по всем уровням, получим искомую

3 . 1

1-1 ^ ^

вероятность: ^qj (1 — —) . Если г = т, то дальнейшие разбиения невозможны.

3. Увеличение площади: г+1 . = г.. + (й - 1)/й‘ — этот случай аналогичен второму, но разница состоит в том, что цепочка разбиений не заканчивается на уровне .. Очевидно, что этот случай исключается при / = т (цифра 3 на рис. 2). Проводя аналогичные рассуждения, получим вероятность

ы ^ ^

этого случая: ;

4. Площадь сохранится: г . = г.. — эта ситуация возникает во всех остальных случаях, ее

вероятность составит: 1 - р.. - ^|<lji_( —^ , при I < т.

' 1=\ ’ ^

Суммируя произведения площадей на вероятности соответствующих, рассмотренных выше четырех возможных исходов, после элементарных преобразований получим окончательное выражение:

11,1.'^' 1 при/</и

г = г. . - р./ й + 1/й1у qii_i—ГT\к ’ И

^ ’ d }й(й-2), при i = m По аналогии проведем вычисление площади 4+ .. Возможны следующие ситуации [5; 6]:

1. Уменьшение площади: 3.+1 . = 3. - 1/й1 с вероятностью д..;

м ^ ^

2. Увеличение площади: 3.+ . = Ч+ 2/й с вероятностью ^(1-----------------) , при . > т.

1=\ ’ ^ d

е-1 ^

-г^т, при . =т;

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

1=1 “

3. Увеличение площади: 5.+1 . = 5. +1/й с вероятностью р ;

4. Площадь сохраняется: 3.+1 . = 3.. с вероятностью

1 1 ■

1----, при Кт,

d

1, при / = т.

Учет предыдущих ситуаций позволяет вычислить общую площадь:

3 3 1/2(й-1), при г<т,

3^ . = 3^.. + 1/й(р - а.) + 1/й > а.. .—г<

.+1, . . ^ V ПРИ1 = |Ц.

А окончательные рекуррентные выражения:

Г(</-1)2, если^<т! ^ , _

^ ^ + |^(^-2),если^ = т] Ы\ п л

.+1, 1 .'Л ^ ;ле~т

d-jd^

Г2(г/-Г), если^</и] гМ , ,

\2d, если £ = т\ ^

Выпуск 3

Выпуск З

Оценка оптимальных параметров ВИС. Рассмотренная математическая модель позволяет вычислить значение количества информации (к) (см. постановку задачи) по следующей схеме:

1) вычисляются числа заполненных и пустых полигонов (У 2^, при заданных I, т, й, / и у.

2) вычисляются Е и X, где I = 1, ..., т;

3) вычисляется к.

Для оценки эффективности предложенного способа кодирования информации о расположении ОТ будем сравнивать с теоретическим минимумом (рис. 3).

Рис. 3. Степени приближения к энтропии при различных значениях й

На поле изображения, содержащем N пикселей, n ОТ могут распределиться CZ =---------------

n\(N-ri)\

способами. C учетом равной вероятности распределения ОТ все комбинации независимы. Следовательно, количество информации, необходимое для кодирования любой комбинации, составит [9]:

Н = log CN = k . = -n log n - (1 - n )log(1 - n р).

0 N mm нор 0 нор v нор7 04 нор

Данное выражение позволяет вычислить эпсилон-энтропию источника Н, но ничего не говорит о способе кодирования, при котором она достигается [9]. Анализ зависимости Е(пнор) при различных d, m позволяет утверждать, что E мало зависит от m и при N = dm > 103 этой зависимостью можно пренебречь (ошибка на уровне десятых долей процента). Из графика на рис. 3 следует, что d = 3 или 4 являются оптимальными.

Заключение

В заключение следует отметить основные выводы и результаты аналитической модели, которые можно рассматривать и как основные черты описанного рекурсивного метода для представления и передачи опорных точек изображений:

— применение пирамидально-рекурсивного метода при нахождении ОТ изображения является важным подходом для построения систем искусственного зрения на транспорте;

— предложенная структура видеоданных и полученная в результате проведенного математического моделирования математическая модель для оценки параметров ВИС позволяют абстрагироваться от исходного многомерного скалярного или векторного поля, работать с плоским графом (регулярным деревом), сохраняющим в то же время все свойства многомерного поля — исходного изображения;

— оптимальным числом полигонов после разбиения при проектировании систем кодирования на основе предложенного метода кодирования по опорным точкам с равновероятным их распределением на исходных изображениях является й = 3;

— предложенный метод оказывается эффективным для класса изображений с равномерным распределением ОТ, когда количество ОТ не превышает 30 % от общего количества точек исходного изображения.

Список литературы

1. Немудров В. Г. Системы на кристалле. Проектирование и развитие / В. Г. Немудров, М. Мартин. — М.: Техносфера, 2004. — 216 с.

2. Твердотельная революция в телевидении / Ш. С. Фахми [и др.]. — М.: Радио и связь, 2006. — 350 с.

3. Зубарев Ю. Б. Видеоинформационные технологии систем связи: моногр. / Ю. Б. Зубарев, Ю. С. Сагдулаев, Т. Ю. Сагдулаев. — М.: Спутник+, 2011. — 296 с.

4. Костикова Е. В. Сопряженное проектирование на базе реконфигурируемых систем на кристалле / Е. В. Костикова, Ш. С. Фахми // Информационно-управляющие системы. — 2010. — № 3.

5. Костикова Е. В. Пространственные алгоритмы кодирования изображений / Е. В. Костикова, Е. И. Колесников // Научно-технический вестник СПбГУ ИТМО. — 2011. — № 3.

6. Костикова Е. В. Исследование рекурсивных алгоритмов сжатия и восстановления изоб-

ражений / Е. В. Костикова, Е. И. Колесников, С. С. Шагаров // Известия СПбГЭТУ «ЛЭТИ». — 2011. — 4.

7. Бабурин В. А. Рекурсивные алгоритмы анализа и представления изображений для систем мониторинга на транспорте / В. А. Бабурин, Ш. С. Фахми, Е. В. Костикова // Транспорт России: проблемы и перспективы-2011: тр. Всерос. науч.-практич. конф. — СПб.: Изд-во ИПТ РАН, 2011.

8. Александров В. В. Представление и обработка изображений. Рекурсивный подход / В. В. Александров, И. Д. Горский. — Л.: Наука, 1985.

9. Шеннон К. Работы по теории информации и кибернетике / К. Шеннон. — М.: ИЛ, 1963. —

832 с.

УДК 681.322 В. Д. Чертовской,

д-р техн. наук, профессор, СПГУВК

РЕШЕНИЕ ЗАДАЧИ ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ ПРИ ПЛАНИРОВАНИИ НА СУДОСТРОИТЕЛЬНОМ ПРЕДПРИЯТИИ SOLVING OF THE PROBLEM OF DYNAMIC PROGRAMMING WHEN PLANNING #П9_ AT THE SHIPBUILDING ENTERPRISE

Рассмотрена необходимость применения адаптивного автоматизированного управления. Сформулированы цель (назначение) адаптивных автоматизированных систем управления производством, их структура, приведено функциональное описание целенаправленных структурных элементов системы.

Выпуск 3

i Надоели баннеры? Вы всегда можете отключить рекламу.