УКД 621.397.13 Е. В. Костикова,
аспирант,
СПГУВК
МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ И ОЦЕНКА ПАРАМЕТРОВ ВИДЕОИНФОРМАЦИОННОЙ СИСТЕМЫ НАБЛЮДЕНИЯ НА ТРАНСПОРТЕ MATHEMATICAL MODELLING AND ESTIMATION OF PARAMETERS OF VIDEOINFORMATION SYSTEM OF SUPERVISION ON TRANSPORT
Рассмотрено математическое моделирование и оценка эффективности алгоритмов сжатия и восстановления изображений на основе пространственно-рекурсивного метода. Разработаны математическая модель и структуры видеоданных системы. Получены оптимальные значения параметров видео-информационной системы.
Mathematical modeling and estimation of efficiency of the algorithms of image compression and restoration on the basis of a spatially-recursive method are considered. Mathematical model and structures of videodata system are developed. Optimum values of the parameters of video information system are received.
Ключевые слова: математическое моделирование, пространственно-рекурсивный метод, полигон, разбиение изображения.
Key words: mathematical modeling, space-recursive method, polygon and splitting of the image.
И ОСТ сложности антропогенных систем обострил проблему эффективного взаимодействия человека с машиной. Возникла острая необходимость создания эффективного для пользователя интерфейса.
В широком толковании этого понятия пользовательский интерфейс должен обеспечивать в конечном счете безопасную эксплуатацию систем, в том числе на транспорте, сбережение материальных, людских и прочих ресурсов. К одному из фундаментальных направлений развития пользовательского интерфейса принадлежит аппаратная реализация системных функций, ранее выполнявшихся человеком, чему в немалой степени способствует состояние современной электронной базы, характеризуемое высоким уровнем интеграции электронных компонент на одном кристалле.
Системы с развитым уровнем внутренней интерпретации организационных и управляющих функций человека принято называть интеллектуальными. При этом их важнейшим атрибутом являются системы искусственного зрения (СИЗ), в анализе развития которых можно выделить системные аспекты. Одним из главных системных аспектов является тенденция приближения средств обработки видеоинформации к источнику ее возникновения, обусловленная интенсивным развитием микроэлектронной элементной базы. Лучше других продвинулись в этом направлении робототехника и беспилотные летательные аппараты.
Обработка изображений с целью их распознавания является одной из центральных и практически важных задач при создании систем искусственного интеллекта для решения задач обеспечения безопасности и контроля над объектами, в том числе на транспорте.
Актуальность выбранной темы научных исследований объясняется ее отношением к проблемам мониторинга и визуального наблюдения за объектами транспортных процессов, а также формированием баз видеоданных и знаний об объектах транспортных систем.
В настоящий момент с появлением новой элементной базы в виде систем на кристалле и современных САПР на ее основе открылись новые возможности создания видеоинформационных систем (ВИС) обработки изображений. Сняты многие ограничения по сложности для проектирования ВИС, что должно способствовать решению основных задач хранения и передачи видеоданных техническими системами [1; 2]. В сложившейся ситуации актуальным является поиск новых
Выпуск 3
Выпуск 3
подходов и способов в обработке изображений, которые, с одной стороны, соответствовали бы особенностям восприятия видеоданных человеком, а с другой — были бы естественными для ЭВМ [3; 4, с. 38-43].
В работах [5, с. 88-92; 6, с. 36-40] предложены метод и алгоритмы для кодирования изображений с применением пирамидально-рекурсивного метода кодирования, в основе которого лежит принцип рекурсивного разбиения изображения с целью представления в виде структурированной совокупности семантически значимых единиц или опорных точек (ОТ) и правил их взаимосвязей (соединения). Причем выделение ОТ и разработка оптимальной структуры данных для их хранения и передачи является одной из сложнейших задач искусственного зрения [6; 7, с. 146-151].
В данной работе проводится математическое моделирование и исследование алгоритмов сжатия и восстановления изображений на основе пространственно-рекурсивного метода и построения математической модели оценки параметров ВИС.
Регулярность пирамидальных алгоритмов предопределяет их удобную структурную реализацию и эффективное использование в ВИС при хранении и передаче видеоданных, например относительную высокую степень сжатия при создании баз видеоданных и высокую производительность ВИС в процессе передачи (то есть возможность параллельной обработки) [8]. Однако возникает задача разработки математической модели для оценки оптимальных параметров ВИС: число ОТ, число уровней разбиения изображения, число полигонов и т. д.
Постановка задачи исследования. Современные мультимедийные и многомодальные подходы к подаче информации потребителю предполагают передачу текстов сообщений, сопровождаемых значительным количеством видео- и аудиоинформации. Среди этих трех видов представления информации видеоданные в наибольшей степени загружают ресурсы информационной инфраструктуры. Предлагаемый метод сжатия изображений для построения систем искусственного зрения на транспорте на основе рекурсивного разбиения и последующего выделения ОТ для представления хранения и передачи изображений является обоснованным и востребованным, однако необходимо определить эффективность такого подхода.
Каждая ОТ характеризуется своими абсолютными координатами и яркостью. При этом все ОТ равновероятно распределены в пределах всего исходного изображения. Процесс кодирования изображения представляется следующим образом: ОТ последовательно и в произвольном порядке наносятся на поле изображения; после появления очередной ОТ производится разбиение на одинаковые полигоны, если в соответствующем полигоне окажутся две опорные точки; полигон разбивается на равные части до тех пор, пока каждая опорная точка не окажется единственной в своем полигоне. Очевидно, количество возможных дроблений ограничено заданной дискретностью изображения. В итоге в завершении процесса кодирования будет получена неравномерная полигональная сетка, где одни полигоны имеют опорную точку, а другие — нет (то есть оказываются пустыми). В статье вводится новое понятие «пустой полигон», важное для достижения максимального сжатия по ОТ.
Для математического моделирования алгоритмов сжатия по ОТ введены следующие обозначения: п — число ОТ, равное числу заполненных (покрывающих ОТ) полигонов (рис. 1, а); т — максимальное число уровней разбиений, приводящее к размеру полигона в один пиксель изображения; й — число полигонов, полученных при разбиении исходного полигона; N — общее число пикселей исходного изображения. Очевидно, что N = йт, К — число бит информации, необходимое для кодирования только местоположения ОТ, V — разрядность яркости ОТ.
Требуется оценить функцию К = ^(п, й, т) и найти оптимальное число полигонов после разбиения й, минимизирующее функцию К (то есть ^^шт). В нормированных единицах искомое отношение запишется в виде: к = /(пнор, й, т), где к = К/М, пнор = п/М
Разработка математической модели. Ввиду случайного характера формирования сообщения (то есть появления опорных точек), необходимо связать количество информации с вероятностями появления каждого сообщения источника. Эту задачу решил в 1946 г. К. Шеннон при кодировании двойного источника [9].
Учитывая то обстоятельство, что все ОТ появляются независимо друг от друга и с одинаковой вероятностью, то число бит информации для кодирования местоположений ОТ в общем виде будет Imax = n-log-N [9].
Коэффициент сжатия определяется выражением
K = (n v + n logN)/(n v +B), то есть k = (n v + пнор log N)/( n^v + b), где log N — разрядность абсолютных координат ОТ, к = K/N и n = n/N, E = An/n.
i = 3 5=1/^
i = 2 S=l/<?
i= 1 5= 1/d1
X 1 2 3 4 5 6 7 8 9
Сжатое описание Прі Пр2 Прі Прі Пр3 Пр2 Пр2 Прз Пр2
Код 11 0* 11 11 10 0* 0* 10 0*
10 11 12 13 14 15 16 17
Пр2 Пр2 Прз Пр, Пр2 Пр2 Пр2 Пр3
0* 0* 10 11 0* 0* 0* 10
Рис. 1. Формирование сжатого описания: а — исходное изображение; б — сжатое описание, где * — информация о координатах ОТ в пределах полигона
а
Структура данных и способ сжатия изображений по ОТ подробно описаны в [5; 6]. Легко заметить, количество информации для хранения и передачи ОТ определяется выражением
\^пшооЕ(Е + 1Х при с/=2;
К = logd*( n m - (id) Y/rzi
нор
m - <Ш"‘) / />-^1 (2dE + d + \)/(d-i), при d >2.
1=\ V нор'
Данное выражение позволяет вычислить число бит информации, необходимое для определения местоположения ОТ в пределах исходного изображения. Однако для этого необходимо определить следующие функции:
Е = .Ди , d, m) — долю пустых полигонов по отношению к числу ОТ;
= Д(инор, d, т, I) — число заполненных полигонов различных уровней I.
Для нахождения Е и рассмотрим следующую модель. Изображение представим полем площадью 1; ОТ последовательно наносятся на поле с равной вероятностью появления в любой точке, что приводит к дроблению соответствующих полигонов, при котором появляются как заполненные, так и пустые полигоны.
Обозначим: г.. — суммарную площадь пустых полигонов /-го уровня после появления /-й
Выпуск 3
Выпуск 3
точки; Б.. — суммарную площадь заполненных полигонов уровня г после появления точки .; р.. — вероятность появления ОТ у + 1 в пустом полигоне уровня /; д.. — вероятность появления ОТ. + 1 в заполненных полигонах уровня /; X — число заполненных полигонов уровня . после появления точки у; У — число пустых полигонов уровня . после появления точки.
Поскольку площадь полигона уровня . равна 1/й, то, очевидно, ряд соотношений:
т т т т
гм + ^) = 1, Е (р л +Чл) = 1, Е2 и 2 я = . • й , УЯ=гя • ^
1=1
£=1
е=1
1=1
где у = 1, ..., и; I = 1, ..., га; г
.1
1)/й, Б = 1/й, р = (й-1)/й и д11 = Ш.
Искомые величины X г и Е для вычисления по выражению К будут:
т
Е(«нор, й, т) = , при У = и, и X, (инор, й, т, I) = 2^, где I = 1, ..., т.
После появления каждой ОТ величины р.. и д.. вычисляются по площадям г Б (рис. 2):
Р]г = г. /(1 - .(1/^)) и д. = 8 - г.. (1/ йга))/(1 - .■•1/й”).
Возможные ситуации Заполненные полигоны
1 = 3 £= Ш3
г = 2 5 = Ш:
Рис. 2. Возможные варианты появления опорных точек
В знаменателе выражений и числителе второго выражения учитываются те площади, где невозможны повторные появления ОТ из-за конечного числа пикселей на изображении.
Площади г.. и Б.. вычисляются как математическое ожидание случайных величин, принимающих значение различных площадей с соответствующими вероятностями в зависимости от появления ОТ в заполненных или пустых полигонах для всех уровней.
Рассмотрим вычисление площади г.+1 .. В зависимости от координат очередной ОТ возможны следующие ситуации (рис. 2):
1. Уменьшение площади: г . = г.. - 1/й1. Это соответствует появлению. + 1 ОТ в пустом полигоне /-го уровня; вероятность этого события р.. (цифра 1 на рис. 2);
2. Увеличение площади: г . = г.. + (й - 2)/й‘. Это соответствует появлению ОТ в заполненном полигоне более низкого уровня при условии, что ОТ вызвала цепочку дроблений до уровня I, то есть появилось й новых полигонов, из них й - 2 — пустых и два заполненных: предшествующий и текущий. + 1-й ОТ (цифра 2 на рис. 2). Пусть ОТ появилась в заполненном полигоне уровня . - 1; вероятность этого события д . _ Тогда возможны две ситуации:
— с вероятностью 1/й потребуется более одного разбиения (цифра 2' на рис. 2);
— с вероятностью 1 - 1/й потребуется одно разбиение (цифра 2 на рис. 2).
Следовательно, интересующая нас вероятность при условии появления ОТ в полигоне уровня . - 1 составит ^,.^-(1 - 1/й). Если ОТ появилась в заполненном полигоне уровня / - 2 (вероятность д,._ 2), то с вероятностью (1/й)(1/й) потребуется более двух разбиений, а с вероятностью
. . 2
1/й(1 - 1/й) — два разбиения, то есть до уровня /. Следовательно, интересующая нас вероятность составит д,._ • 1/й-(1 - 1/й). В итоге, суммируя вероятности по всем уровням, получим искомую
3 . 1
1-1 ^ ^
вероятность: ^qj (1 — —) . Если г = т, то дальнейшие разбиения невозможны.
3. Увеличение площади: г+1 . = г.. + (й - 1)/й‘ — этот случай аналогичен второму, но разница состоит в том, что цепочка разбиений не заканчивается на уровне .. Очевидно, что этот случай исключается при / = т (цифра 3 на рис. 2). Проводя аналогичные рассуждения, получим вероятность
ы ^ ^
этого случая: ;
4. Площадь сохранится: г . = г.. — эта ситуация возникает во всех остальных случаях, ее
вероятность составит: 1 - р.. - ^|<lji_( —^ , при I < т.
' 1=\ ’ ^
Суммируя произведения площадей на вероятности соответствующих, рассмотренных выше четырех возможных исходов, после элементарных преобразований получим окончательное выражение:
11,1.'^' 1 при/</и
г = г. . - р./ й + 1/й1у qii_i—ГT\к ’ И
^ ’ d }й(й-2), при i = m По аналогии проведем вычисление площади 4+ .. Возможны следующие ситуации [5; 6]:
1. Уменьшение площади: 3.+1 . = 3. - 1/й1 с вероятностью д..;
м ^ ^
2. Увеличение площади: 3.+ . = Ч+ 2/й с вероятностью ^(1-----------------) , при . > т.
1=\ ’ ^ d
е-1 ^
-г^т, при . =т;
1=1 “
3. Увеличение площади: 5.+1 . = 5. +1/й с вероятностью р ;
4. Площадь сохраняется: 3.+1 . = 3.. с вероятностью
1 1 ■
1----, при Кт,
d
1, при / = т.
Учет предыдущих ситуаций позволяет вычислить общую площадь:
3 3 1/2(й-1), при г<т,
3^ . = 3^.. + 1/й(р - а.) + 1/й > а.. .—г<
.+1, . . ^ V ПРИ1 = |Ц.
А окончательные рекуррентные выражения:
Г(</-1)2, если^<т! ^ , _
^ ^ + |^(^-2),если^ = т] Ы\ п л
.+1, 1 .'Л ^ ;ле~т
d-jd^
Г2(г/-Г), если^</и] гМ , ,
\2d, если £ = т\ ^
Выпуск 3
Выпуск З
Оценка оптимальных параметров ВИС. Рассмотренная математическая модель позволяет вычислить значение количества информации (к) (см. постановку задачи) по следующей схеме:
1) вычисляются числа заполненных и пустых полигонов (У 2^, при заданных I, т, й, / и у.
2) вычисляются Е и X, где I = 1, ..., т;
3) вычисляется к.
Для оценки эффективности предложенного способа кодирования информации о расположении ОТ будем сравнивать с теоретическим минимумом (рис. 3).
Рис. 3. Степени приближения к энтропии при различных значениях й
На поле изображения, содержащем N пикселей, n ОТ могут распределиться CZ =---------------
n\(N-ri)\
способами. C учетом равной вероятности распределения ОТ все комбинации независимы. Следовательно, количество информации, необходимое для кодирования любой комбинации, составит [9]:
Н = log CN = k . = -n log n - (1 - n )log(1 - n р).
0 N mm нор 0 нор v нор7 04 нор
Данное выражение позволяет вычислить эпсилон-энтропию источника Н, но ничего не говорит о способе кодирования, при котором она достигается [9]. Анализ зависимости Е(пнор) при различных d, m позволяет утверждать, что E мало зависит от m и при N = dm > 103 этой зависимостью можно пренебречь (ошибка на уровне десятых долей процента). Из графика на рис. 3 следует, что d = 3 или 4 являются оптимальными.
Заключение
В заключение следует отметить основные выводы и результаты аналитической модели, которые можно рассматривать и как основные черты описанного рекурсивного метода для представления и передачи опорных точек изображений:
— применение пирамидально-рекурсивного метода при нахождении ОТ изображения является важным подходом для построения систем искусственного зрения на транспорте;
— предложенная структура видеоданных и полученная в результате проведенного математического моделирования математическая модель для оценки параметров ВИС позволяют абстрагироваться от исходного многомерного скалярного или векторного поля, работать с плоским графом (регулярным деревом), сохраняющим в то же время все свойства многомерного поля — исходного изображения;
— оптимальным числом полигонов после разбиения при проектировании систем кодирования на основе предложенного метода кодирования по опорным точкам с равновероятным их распределением на исходных изображениях является й = 3;
— предложенный метод оказывается эффективным для класса изображений с равномерным распределением ОТ, когда количество ОТ не превышает 30 % от общего количества точек исходного изображения.
Список литературы
1. Немудров В. Г. Системы на кристалле. Проектирование и развитие / В. Г. Немудров, М. Мартин. — М.: Техносфера, 2004. — 216 с.
2. Твердотельная революция в телевидении / Ш. С. Фахми [и др.]. — М.: Радио и связь, 2006. — 350 с.
3. Зубарев Ю. Б. Видеоинформационные технологии систем связи: моногр. / Ю. Б. Зубарев, Ю. С. Сагдулаев, Т. Ю. Сагдулаев. — М.: Спутник+, 2011. — 296 с.
4. Костикова Е. В. Сопряженное проектирование на базе реконфигурируемых систем на кристалле / Е. В. Костикова, Ш. С. Фахми // Информационно-управляющие системы. — 2010. — № 3.
5. Костикова Е. В. Пространственные алгоритмы кодирования изображений / Е. В. Костикова, Е. И. Колесников // Научно-технический вестник СПбГУ ИТМО. — 2011. — № 3.
6. Костикова Е. В. Исследование рекурсивных алгоритмов сжатия и восстановления изоб-
ражений / Е. В. Костикова, Е. И. Колесников, С. С. Шагаров // Известия СПбГЭТУ «ЛЭТИ». — 2011. — 4.
7. Бабурин В. А. Рекурсивные алгоритмы анализа и представления изображений для систем мониторинга на транспорте / В. А. Бабурин, Ш. С. Фахми, Е. В. Костикова // Транспорт России: проблемы и перспективы-2011: тр. Всерос. науч.-практич. конф. — СПб.: Изд-во ИПТ РАН, 2011.
8. Александров В. В. Представление и обработка изображений. Рекурсивный подход / В. В. Александров, И. Д. Горский. — Л.: Наука, 1985.
9. Шеннон К. Работы по теории информации и кибернетике / К. Шеннон. — М.: ИЛ, 1963. —
832 с.
УДК 681.322 В. Д. Чертовской,
д-р техн. наук, профессор, СПГУВК
РЕШЕНИЕ ЗАДАЧИ ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ ПРИ ПЛАНИРОВАНИИ НА СУДОСТРОИТЕЛЬНОМ ПРЕДПРИЯТИИ SOLVING OF THE PROBLEM OF DYNAMIC PROGRAMMING WHEN PLANNING #П9_ AT THE SHIPBUILDING ENTERPRISE
Рассмотрена необходимость применения адаптивного автоматизированного управления. Сформулированы цель (назначение) адаптивных автоматизированных систем управления производством, их структура, приведено функциональное описание целенаправленных структурных элементов системы.
Выпуск 3