УДК 004.932.2
МЕТОД СЖАТИЯ ЦИФРОВЫХ ПОЛУТОНОВЫХ ИЗОБРАЖЕНИЙ НА ОСНОВЕ ЦЕПЕЙ МАРКОВА С НЕСКОЛЬКИМИ СОСТОЯНИЯМИ
© 2014 Е. П. Петров, Н. Л. Харина, Е. Д. Ржаникова Вятский государственный университет, г. Киров
В работе представлена математическая модель (ММ) цифрового полутонового изображения (ЦПИ) на основе двумерной цепи Маркова с несколькими состояниями, исследована её адекватность реальным изображениям. На основе ММ разработан метод сжатия ЦПИ. Метод предусматривает разделение ЦПИ на разрядные двоичные изображения с последующим объединением в плоскости по два разряда. Каждая плоскость рассматривается как двумерный случайный марковский процесс с несколькими N = 4) состояниями. На основе теории условных марковских процессов осуществляется предсказание элементов плоскости. Все неверно предсказанные элементы помещаются в битовый поток и служат опорными для восстановления изображения. Для плоскостей, содержащих младшие разряды, предварительно осуществляется выделение областей, содержащих фон, близкий по структуре к белому гауссов-скому шуму (БГШ), хранение этих областей не осуществляется, они заполняются выборками БГШ при восстановлении. По своей эффективности метод не уступает известным методам сжатия, основанным на дискретно-косинусном или вейвлет-преобразовании, не содержит вычислительных операций, позволяет работать с многоразрядными изображениями (8 и более) без увеличения времени сжатия за счёт параллельной обработки плоскостей.
Математическая модель, цепь Маркова, цифровое полутоновое изображение, матрица вероятностей перехода, сжатие изображений.
Введение
Известно, что наиболее ёмким носителем информации являются изображения, однако их передача на расстояние требует большой полосы частот, что при современной перегруженности эфира практически недопустимо. Наиболее перспективным методом решения данной задачи является «сжатие» изображений за счёт сокращения статистической избыточности, присущей большинству полутоновых изображений. Сжатие позволяет уменьшить полосу частот при сохранении допустимого качества передаваемого изображения.
Проблема сокращения избыточности (сжатия) ЦПИ является актуальной, несмотря на большое количество исследователей, вовлечённых в её решение в России и за рубежом. Главные причины - повышение точности при восстановлении ЦПИ со сложными сценами, содержащими большое количество мелких деталей, имеющих часто важное значение, и минимизация объёма вычислительных ре-
сурсов на передающей стороне. Изображения, подвергнутые сжатию методами, основанными на БПФ и вейвлет-преобразованиях с отсечкой высокочастотных составляющих, принципиально не могут быть восстановлены без искажений и требуют большого количества вычислений на операцию сжатия, что не всегда допустимо в специальных приложениях обработки ЦПИ.
В работе предлагается метод внут-рикадрового предсказания (сжатия) статических цифровых полутоновых изображений, основанный на представлении разрядных ЦПИ двумерными цепями Маркова с несколькими состояниями (N > 2) .
Для построения математической модели дискретных многоуровневых импульсных сигналов можно воспользоваться методом Монте-Карло с цепями Маркова [1, 2], реализованными по алгоритмам Метрополиса [3] или Гиббса [4]. Согласно алгоритму Гиббса генерация выборки из многомерного распределения заменяется на итерацию выборок из од-
номерных распределении, что является более простой задачей построения ММ одномерных и многомерных дискретных многоуровневых случайных процессов на основе цепей Маркова с несколькими состояниями.
ММ на основе одномерной
цепи Маркова с несколькими состояниями
Для описания одномерной цепи Маркова с несколькими состояниями воспользуемся стандартным описанием [5] с заданным вектором вероятностей начальных состояний
Р = |А,р2,..., ры\\ (1)
и матрицей вероятностей переходов (МВП) из состояния М{ в состояние М у
(|, у е Ж) за один шаг вида
П =
п
п-
п
п
21
п
22
п
2К
п
п
п
(2)
удовлетворяющим условиям нормировки
N
ТА = 1; 1 е N
I=1
и согласованности
N
р> =Т рА ; 1 е
1=1
(3)
(4)
где п р - элементы транспонированной
матрицы (2).
На основе вектора (1) и МВП (2), используя метод статистических испытаний Монте-Карло с цепями Маркова [1], получен алгоритм генерации цепей Маркова с N (Ж > 2) состояниями.
Алгоритм работы ММ состоит из следующих операций.
1. В первом такте работы модели берётся случайное число 6, равномерно распределённое на интервале [0,1], и
определяется область вектора p¡ (| е N), в которую оно попадает: если
6 е р (I е N),
то марковская цепь принимает состояние д = Мi. Переход к п. 2.
2. В следующем такте работы случайное число 6 (к = 2,—, п) сравнивается
с вероятностью перехода жн . Если
6к еА,
то ¡лк = М1, иначе, если
6 епи е N, * *
то ¡лк = М*. Переход к п. 3.
3. Случайное число сравнивается
с вероятностью перехода . Если выполняется условие
6+1 еА,
то /лк+1 = М*, I = * , переход к п. 2, иначе, если
6к+1 е пг (г е N, г *
то [лк+1 = Мг, I = г, если к < п, переход к п. 2, иначе, переход к п. 4.
4. Останов.
В качестве примера приведена реализация цепи Маркова с (Ы = 4) с вектором вероятностей начальных состояний
п II 1т
Р = Pl,P2, Pз, Р4 =
и МВП вида
П =
1 4
1 4
(5)
0,6 0,1 0,1 0,2
0,05 0,8 0,07 0,08
0,03 0,03 0,9 0,04
0,05 0,1 0,1 0,75
(6)
Получена цепь Маркова, фрагмент которой имеет вид: 2221 1422213333 333344444333 3333 33221 12444221 1 13333 3 421 1 1 1 1
т
Погрешность оценки элементов МВП (6), вычисленной по реализации цепи Маркова из 30 000 состояний, не превышает 0,5 %. С увеличением статистики точность оценок МВП растёт:
П =
0,607 0,09 0,11 0,201
0,047 0,798 0,068 0,082
0,031 0,032 0,89 0,038
0,052 0,101 0,093 0,751
(7)
1П =
П11 П12 П13 П14
П21 П 22 П 23 П24
П31 П32 П33 П34
П41 П42 П43 П44
П =
ММ на основе двумерной цепи Маркова с несколькими состояниями
Наибольший интерес представляют ММ на основе двумерных цепей Маркова с несколькими состояниями, например, ММ статических ЦПИ. Для этого представим §-разрядное ЦПИ набором из g разрядных двоичных изображений (РДИ).
Будем полагать, что 1-е (I е g) РДИ представляет двумерный марковский процесс, полученный суперпозицией двух одномерных цепей Маркова с несколькими состояниями на ортогональной сетке. Пусть РДИ образует марковское случайное поле (СП) размером т х п (рис.1), представляющее двумерную цепь Маркова с N равновероятными Рг = ~(г е N)
состояниями Ы1 (г е N) с МВП от состояния М, к состоянию (s, (е N) по горизонтали и вертикали СП соответственно:
П11 П12 П13 П14
П21 П 22 П 23 П24
П31 П32 П33 П34
П41 П42 2 П43 П44
(8)
Если условная зависимость состояний определена от левого верхнего сегмента марковского СП (рис. 1), то элемент Ы1 у (г е т, у е п) СП зависит только от
элементов некоторого подмножества л1 у этого сегмента, называемого окрестностью элемента Ы1 у. Тогда лучшим образом удовлетворяющим условию каузальности является конфигурация окрестности (рис. 2)
Л *, у = {Ы, у-1, М-1, у, Ы, у} = [У1,У2,У3}. (9)
Вероятность состояния элемента у3
(рис. 2) полностью определяется его энтропией относительно состояний элементов окрестности лг у.
ч. ми2 ». М1Н - Ч,
^2,1 м22 ■■■
4-1, Ч-,, - - 4-1,
Ч-, ... м„н -
мтЛ Мта ■■■ Мт.Н
Рис. 1. Марковское случайное поле
А;
V'
V,
Рис. 2. Фрагмент области СП: V = Мг,]-{; V2 = Ыг-1,у ; V3 = Ыи; ^ = Ы-1, у-1
Выражение для энтропии состояния где п(у3 v), п(у3 \у2) - одномерные ве элемента у3 можно представить в виде
[6]:
Н (^ КП ) = Н (^ )- 1 (Ъ^Ч)
'(^3 М^3 К )
= - 1ОБ-
(10)
п
(Уз 1^1,^2 )
роятности перехода между соседними состояниями; п(у3 ¡у1,у2) - вероятность перехода в двумерной цепи Маркова.
Вероятности перехода от состояний элементов окрестности Л. , к состоянию
М1 у образуют МВП вида:
П =
Пг Па Пк Пн Жрг Па Пи Па Пи Пп П Пк Пи
П, П, Пку Пу ПА, Па Пк, П, Пу П, ПкА, Пу П, П, Па Пу
Пк Пк Пгкк Пк А П,к Пкк П1к ПАк Пкк Пкк ПАА Пк Пк П1кк П11к
Пи Па Пк1 Пи ПА Пк1 Пи Па Пкк1 ПШ Пи Па П1А1 Пп
(11)
Элементы МВП П (11) связаны с элементами МВП (8) следующими соотношениями:
1Кгг ^Пг П у Ч?П,
'Пг '
1Пк-2Пк , Пи 1Пг ?П1
Чг П
1Пг?П,г пА Ч-2па .
'п, • ч :
II и> А г • а „п А , П II з П П • а п <1.
з
где п и - элементы дополнительной матрицы 3П = 1Пх 2П', характеризующей статистическую связь элементов у3 и V'.
Соотношения (12) приведены для первых двух столбцов МВП (11), остальные вычисляются аналогично. Элементы МВП удовлетворяют условию нормировки (3) и стационарности (4). Каждой строке МВП соответствует определённое состояние элементов окрестности Л, (9).
Ниже приведён алгоритм работы ММ на основе двумерной цепи Маркова с несколькими состояниями (N > 2) .
1 2
1. По известным матрицам П и П
з
вычисляются матрицы П и П.
2. Берётся случайное число Е,ь (£ < т • п), равномерно распределённое
на интервале {0,1}.
3. Из матрицы П выбирается столбец, соответствующий значениям элементов окрестности Л. ,.
4. Число сравнивается с 0 значениями выбранного столбца МВП. Если попадает в интервал вероятности в первой строке, то элемент изображения у3 принимает значение М1 = 0, во второй строке - М2 = 1, в третьей строке - Мз = 2, в четвёртой - М4 = 3 .
5. Если £ < т • п , то переход к п. 2, иначе, переход к п. 6.
6. Останов.
В соответствии с МВП (13) по данному алгоритму получено искусственное ЦПИ (рис. 3), каждый элемент которого принимает одно из четырёх состояний.
Рис. 3. Искусственное изображение размером 1000*1000
1П =
2 П =
0,9 0,033 0,033 0,033
0,033 0,9 0,033 0,033
0,033 0,033 0,9 0,033
0,033 0,033 0,033 0,9
0,9 0,033 0,033 0,033
0,033 0,9 0,033 0,033
0,033 0,033 0,9 0,033
0,033 0,033 0,033 0,9
(13)
Метод сжатия цифровых полутоновых изображений
В качестве одного из возможных приложений ММ двумерной цепи Маркова с N > 2 приведён алгоритм, разработанный для внутрикадрового прогнозирования блоков в опорном кадре g-разрядного ЦПИ видеопоследовательности при сжатии ТВ изображений.
Представление g-разрядных ЦПИ цепями Маркова с числом состояний N > 2 позволило разработать метод сжатия ЦПИ [7], не уступающий известным методам и требующий значительно меньших вычислительных ресурсов при более высокой точности и скорости передачи ЦПИ за счёт перехода от бинарного представления пикселов ЦПИ к ^разрядному (^уровневому). В данном методе сжатия
отсутствует переход из временной области в спектральную и обратно, что характерно для известных методов. Это позволяет реализовать процедуру сжатия ЦПИ на передающей стороне минимальными вычислительными ресурсами.
Алгоритм прогнозирования блоков № 1
1. Передаваемое g-разрядное ЦПИ разбивается на I (I е g) РДИ.
2. Каждое РДИ разбивается на блоки Ы у размером ё х ё(ё = 1,16).
3. Для каждого РДИ вычисляются МВП из одного состояния блока Ыу в
другое по горизонтали 1П и вертикали 2 П (1) соответственно.
4. Исходя из МВП 1П и 2 П, вычисляется МВП (5).
5. Прогнозируется блок Ыу на основе МВП (5) и окрестности Лг у.
6. Если Ы ,, = Ы,,, то блок не пе-
и У
редаётся по каналу связи.
7. Если Ы ,, Ф Ы,,, то блок Ын пе-
и и и
редаётся по каналу связи и становится опорным для следующего соседнего элемента.
Точность предсказания составляет 100 %.
Плоскости, построенные на младших разрядах ЦПИ, представляют собой СП, близкое по структуре к СП белого гауссовского шума (БГШ), с наличием мелких деталей сцены изображения, которыми не всегда можно пренебречь. Младшие плоскости ЦПИ в соответствии с алгоритмом № 1 дают наибольшее количество передаваемых блоков, снижая эффективность сжатия ЦПИ. Для таких плоскостей разработан алгоритм № 2, который позволяет выделять и передавать мелкие детали изображения, заполняя остальное пространство БГШ на приёмной стороне.
Алгоритм прогнозирования блоков № 2
1. Передаваемое g-разрядное ЦПИ разбивается на l (l е g) РДИ.
2. Определяется длина последовательности (х) одинаковых блоков M и ( i е N ).
3. Если х>Хбгш (для БГШ ХБГШ =2 ), то блок My передается по каналу связи.
4. Если х<Хбгш , то блок My не
передаётся по каналу связи, а при восстановлении ЦПИ на приёмной стороне заменяется выборкой БГШ.
Для кодирования передаваемого потока блоков изображения по аналогии с JPEG выбран код Хаффмена. Выбор применяемого алгоритма для каждого РДИ осуществляется на основе статистических характеристик изображения.
Проведённые исследования показали, что наиболее эффективно применять
алгоритм 1 для l = 1,5 старших РДИ, а для остальных РДИ целесообразно применять алгоритм 2. Для исследований были использованы изображения, размещённые в открытом доступе сети Internet, представленные в формате JPEG, что нарушает их статистические свойства.
Для изображений, полученных с матриц ДЗЗ, сохранённые статистические характеристики позволят добиться более высокого коэффициента сжатия при малых СКО.
На рис. 4 приведены результаты сжатия реального ЦПИ (рис. 4, а) предложенным методом (рис. 4, б) и JPEG (рис.
4, в).
Для оценки эффективности методов сжатия приведен график зависимости СКО от степени сжатия для предложенного метода и JPEG (рис. 5).
Таким образом, эффективность предложенного метода сравнима с широко распространённым методом сжатия изображений JPEG по субъективным метрикам и объективным (СКО), но предло-
женный метод не имеет вычислительных операций на передающей стороне.
Рис. 4, а. Реальное ЦПИ
Рис. 4, б. Восстановленное ЦПИ (предлагаемый метод, коэффициент сжатия - 8, СКО - 10,3)
Рис. 4, в. Восстановленное ЦПИ (JPEG, коэффициент сжатия - 8, СКО - 12,1)
Исследование выполнено при поддержке Министерства образования и науки Российской Федерации, соглашение 14.В37.21.0628.
Коэфф.сжатия
--Преложенный метод -JPEG
Рис. 5
Библиографический список
1. Шведов А.С. О методах Монте-Карло с цепями Маркова // Экономический журнал ВШЭ. 2010. Т. 14, № 2. С. 227-243.
2. Куени Джон Дж., Снелл Дж. Лори, Кнепп Антони У. Счетные цепи Маркова; пер. с англ. М.: Наука, 1987. 416 с.
3. Metropolis N., Rosenbluth A.W., Rosenbluth M.N., Teller A.H., Teller E. Equation of State Calculations by Fast Computing Machines // Journal of Chemical Physics. 1953. No. 21. P. 1087-1092.
4. Gelfand A.E., Smith A.F.M. Sampling-based Approaches to Calculating Marginal Densities // Journal of the American Statistical Association. 1990. No. 85. P. 398-409.
5. Тихонов В.И., Миронов М.А.
Марковские процессы. М.: Сов. радио, 1977. 488 с.
6. Петров Е.П., Харина Н.Л., Ржаникова Е.Д. Модель цепи Маркова с несколькими состояниями // Сб. тр. X Международ. НТК «Физика и радиоэлектроника в медицине и экологии» ФРЭМЭ'2012. Книга 1. Владимир, 2012. С. 211-215.
7. Петров Е.П., Харина Н.Л., Ржаникова Е.Д. Метод сжатия цифровых полутоновых изображений на основе цепей Маркова с несколькими состояниями // Сб. науч. трудов 15 Международной конференции «Цифровая обработка сигналов и ее применение -Б8РА-2013». М.: РНТОРЭС имени А.С. Попова, 2013. С. 132-135.
Информация об авторах
Петров Евгений Петрович, доктор технических наук, профессор, заведующий кафедрой радиоэлектронных средств, Вятский государственный университет, г. Киров. E-mail: [email protected]. Область научных интересов: исследование алгоритмов и устройств цифровой фильтрации дискретных коррелированных сигналов, цифровая обработка изображений.
Харина Наталья Леонидовна, кандидат технических наук, доцент кафедры
радиоэлектронных средств, Вятский государственный университет, г. Киров. Е-mail: Natal [email protected]. Область научных интересов: многомерные марковские поля в обработке изображений.
Ржаникова Елена Дмитриевна, аспирант, Вятский государственный университет, г. Киров. E-mail: lavrova [email protected]. Область научных интересов: многомерные марковские поля в обработке изображений.
METHOD OF COMPRESSION OF DIGITAL HALFTONE IMAGES ON THE BASIS OF MARKOV CHAINS WITH SEVERAL STATES
© 2014 E. P. Petrov, N. L. Harina, E. D. Rzhanikova Vyatka State University, Kirov, Russian Federation
The paper presents a mathematical model (MM) of a digital halftone image (DHI) on the basis of a two-dimensional Markov chain with several states; its adequacy to real images is analyzed. On the basis of MM a method of DHI compression is developed. The method provides separation of DHI into binary images with subsequent combining of two digits in a plane. Each plane is considered as a two-dimensional random Markov process with several (N=4) states. On the basis of the theory of random Markov processes prediction of the plane elements is carried out. All incorrectly predicted elements are located in a bit stream and serve as a reference for the recovery of the image. Separation of areas containing background noise with a structure similar to the white gaussian noise (WGN) is carried out beforehand for the planes containing low- order bits, these areas are not stored, they are filled with WGN samples in case of restoration. The efficiencyof the method is no inferior to that of known methods of compression based on DCT or DWT, it does not involve computing operations and makes it possible to work with multidigital images (8 and more digits) without increase in the time of compression due to parallel processing of the planes.
Mathematical model, Markov chain, digital halftone image, matrix of transition probabilities, image compression.
References
1. Shvedov A.S. On Markov Chain Monte Carlo Methods // Higher School of Economics Economic Journal. 2010. V. 14, no. 2. P. 227-243. (In Russ.)
2. Kemeny J.G., Snell J.L., Knapp A.W. Denumerable Markov Chains: Trans. from Engl. Moscow: Nauka Publ., 1987. 416 p.
3. Metropolis N., Rosenbluth A.W., Rosenbluth M.N., Teller A.H., Teller E. Equation of State Calculations by Fast Computing Machines // Journal of Chemical Physics. 1953. No. 21. P.1087-1092.
4. Gelfand A.E., Smith A.F.M. Sampling-based Approaches to Calculating Marginal Densities // Journal of the American Statistical Association. 1990. No. 85. P. 398-409.
5. Tichonov V.I., Mironov M.A. Markovskie protsessy [Markov processes]. Moscow: Sov. radio Publ., 1977. 488 p.
6. Petrov E.P., Harina N.L., Rzanikova E.D. Model of Markov chain with several states // Proc. 10th Int. Conf. «Physics and radioelectronics in medicine and ecology», Book 1. Vladimir. 2012. P. 211215. (In Russ.)
7. Petrov E.P., Harina N.L., Rzanikova E.D. Method of compression of digital grayscale images on the basis of Markov's chains with several states // Proc. 10th Int. Conf. «Digital processing of signals and its application - DSPA-2013», Moscow: RNTORES imeni A.S. Popova Publ., 2013. P. 132-135. (In Russ.)
About the authors
Petrov Eugeny Petrovich, Doctor of Science (Engineering), Professor, Head of the Department of Radio Electronic Means, Vyatka State University, Kirov, Russian Federation. E-mail: [email protected]. Area of Research: algorithms and devices of digital
filtration of discrete correlated signals, digital processing of images.
Harina Natalya Leonidovna, Candidate of Science (Engineering), Associate Professor, Department of Radio Electronic Means, Vyatka State University, Kirov, Russian Federation. E-mail: NataL [email protected].
Area of Research: multidimensional Markov fields in digital image processing.
Rzhanikova Elena Dmitrievna, postgraduate student, Vyatka State University,
Kirov, Russian Federation. E-mail:
[email protected]. Area of Research:
multidimensional Markov fields in digital image processing.