Научная статья на тему 'Нейромережне ущільнення зображень із використанням їхнього поділу на фрейми'

Нейромережне ущільнення зображень із використанням їхнього поділу на фрейми Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
93
9
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
neural colour image compression / division into frames / neurolike Geometrical Transformation Machine structure

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — У В. Поліщук

Запропоновано нейромережний метод ущільнення зображень на основі скорочення довжини розрядної сітки, що використовується для представлення ортогональних компонент перетворення та забезпечує додаткове збільшення коефіцієнта компресії зі збереженням заданих показників якості. Також розвинуто та апробовано методику покращення якості відтворених зображень та показників компресії шляхом додаткового поділу зображень на фрейми. Цей метод забезпечує підвищення коефіцієнта якості зображення PSNR в середньому на 5-6 % за додаткового збільшення коефіцієнта компресії.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Neural image compression using division images into frames

Neural image compression method by reducing of a bit map lenght, which is used to represent orthogonal components of transformation, provides additional increase in compression ratio with preservation of the specified quality indicators is proposed. Also developed and tested methods for improving the quality and compression rates of the reproduced images by additional division images into frames. This method provides enhancing image quality rate PRSN by 5-6 % with increasing the compression ratio.

Текст научной работы на тему «Нейромережне ущільнення зображень із використанням їхнього поділу на фрейми»

Sokil B.I., Khytriak O.I. Inverse dynamics problem for oscillation of the

mediums which are described by perturbed Bretherton equation

It is considered the application of asymptotic method of nonlinear mechanics Krylov-Bogoliubov-Mitropol'skii to solving the inverse problems of dynamic systems, mathematical model of which is the Bretherton equation. The developed method enables effectively to determine analytical approximations resilient and disipativ forces for a case when the last are poorly nonlinear.

Keywords: nonlinear oscillation, amplitude, frequency, asymptotic method.

УДК 681.324 Астр. У.В. Полiщукí - НУ "Львiвська полтехшка "

НЕЙРОМЕРЕЖНЕ УЩ1ЛЬНЕННЯ ЗОБРАЖЕНЬ 13 ВИКОРИСТАННЯМ 1ХНЬОГО ПОД1ЛУ НА ФРЕЙМИ

Запропоновано нейромережний метод ущшьнення зображень на основi скоро-чення довжини розрядно'1 атки, що використовусться для представлення ортогональ-них компонент перетворення та забезпечуе додаткове збшьшення коефщента компресп зi збереженням заданих показникiв якостi. Також розвинуто та апробовано методику покращення якосп вiдтворених зображень та показниюв компресп шляхом додаткового подiлу зображень на фрейми. Цей метод забезпечуе тдвищення коефь цieнта якостi зображення РБКК в середньому на 5-6 % за додаткового збшьшення коефщента компресп.

Вступ. Через стр1мкий розвиток засоб1в цифровоi техшки, збшьшен-ням апаратноi складносл телекомушкацшних систем, актуальна проблема ущшьнення даних, зокрема зображень, отримала нов1 засоби i можливосп для ii реалiзацii. Зокрема, завдяки виробленню нових п1дход1в до оброблення даних завдання ущшьнення дедалi часлше почали вирiшувати на основi ви-користання математичних методiв i моделей штучного штелекту.

У цьому дослщженш наведено основи новiтнього методу ущшьнення зображень, розробленого на базi нейроподiбних структур Моделi Геометрич-них Перетворень та розглянуто методику покращення якост компресп шляхом розбиття зображення на фрейми.

У цифрових системах [4] статичне растрове зображення видаеться двовимiрним масивом точок (елеменлв зображення), що мають певш характеристики: колiр, iнтенсивнiсть кольору, просторова корелящя та iн. Елемен-ти зображення називають пiкселями. Внаслiдок цифрового оброблення зображення пiкселi представляються числами. Зображення займае набагато бшьше пам'ят порiвняно з текстовими даними. Так, невеличке зображення розмiром 500^800 пiкселiв займае бiльше 1 мБ пам'ят^ що еквiвалентно розмiру ху-дожньо!" книги з 400 сторiнками. Власне ця особливють i визначае актуаль-нiсть проблеми ущiльнення графiчних файлiв.

Як вiдомо [5], зображення можна роздшити на два основнi класи: двохрiвневi (однобiтнi зображення без пал^и) та багаторiвневi (&-б^ш, з па-лiтрою). Однобiтнi зображення - це найпрослший тип зображення, кожен шксель якого представлений одним бiтом та може приймати значення лише 1

1 Наук. KepiBHm: проф. Ю.М. Рашкевич, д-р техн. наук - НУ '^bBÎBCbKa Полiтехнiка"

(двiйкова одиниця або основний кол!р) та 0 (колiр фону). Багаторiвневi зоб-раження мютять 2к р!вшв та подшяються на декiлька типiв:

1. Haniemonoei. У натвтоновому зобpаженнi кожен шксель мае 2к значень вiд 0 до 2k-1 гpадацiй Ырого або iншого кольору. Число к пор!в-нюеться i3 pозмipом байта та доpiвнюе вiдповiдно 4, 8, 12, 16, 24 або шше кратне 4 або 8. Натвтонове зображення складаеться i3 k-бiтових шаpiв.

2. Кольорови. Пiкселi складаються i3 трьох байт. 1снуе декiлька мето-дiв задавання кольоpiв, але в кожнш i3 них колip задаеться трьома складови-ми: R (червоний; red, англ.), B (синш; blue, англ.) та G (зелений; green, англ.) Основш моделi кольоpiв: RGB, HLS, CMYK.

3. Зображення з пеперервпим топом. Забезпечуються плавш та не-пеpеpвнi переходи схожих вщтшюв вiд кольору до кольору. Кожш сусiднi пiкселi вiдpiзняються всього на одиницю, внаслiдок чого практично немож-ливо pозpiзнити !хт кольори.

4. Дискретпо-топови зображеппя. Це синтетичш зображення, отри-манi штучним шляхом. У ньому немае шумiв та сказiв натуральних зобра-жень.

5. Зображення i3 невеликою кiлькicтю кольорiв та великими четкими областями, заповнеш одним кольором. До таких належать дшова гра-фiка (дiагpами, графжи), мультиплiкативнi зображення тощо.

У цш pоботi опишемо розроблений нами ефективний метод застосу-вання нейpоподiбних структур для задач зображень без втрат, або з можли-вютю регулювання ступеня втрат шформацн. Метод, оpiентований на ущшь-нення напiвтонових та кольорових зображень, базуеться на використанш нейропод!бно1" структури моделi геометричних перетворень (МГП) в автоасо-цiативному pежимi li застосування [1]. Xi С л С "\ xi 1. Особлнвосп нейромережевого

ущшьнення зображень. Класичний нейро-мережевий метод ущшьнення зображень пе-редбачае застосування автоасощативно! нейронно! мереж1 i3 одним прихованим шаром, кшыасть нейронних елеменпв якого Zm менша, ашж кшыасть елеменпв на вход1 та

Xd v_y Xd виход1 мереж1 (ефект "звуженого горла"). Bi-

Вхщнии шар Вихщний шар Д0М0; щ0 так{ мереж1 можуть забезпечити ли-

Рис 1. Автоасоцштивпий ше лiнiйний аналiз головних компонент для багатошаровий перцептроп

^ ^ ^ задач зменшення pозмipностi даних. У цьому

випадку немае значення, що нейpоннi елементи прихованого шару можуть

мати нелшшну функцш активацii [6].

Навчання автоасощативно!" меpежi pеалiзуеться в pежимi "без суперв!зо-ра", таким чином, що кожен вхщний вектор вiдтвоpюе сам себе на виходi мереж! Оскiльки кшьюсть елементiв у прихованому шаpi менша, анiж кiлькiсть елеменпв на вход! меpежi, щеальне вiдтвоpення усiх вхiдних вектоpiв у загальному випадку не е можливим. У процес навчання алгоритм зворотного поширення похибки мш!м!зуе похибку, що може бути представлена у такому вигляда:

£ ^Щ^лЮ-4}1. (1)

Для випадку використання одного прихованого шару нейронних еле-менлв можна довести, що функцiя похибки завжди мае один глобальний мь нiмум, в якому мережа здшснюе проекцiю на M-вимiрний пiдпростiр, що охоплюе М перших головних компонент.

Як довiв Бшоп [6], нелiнiйний аналiз головних компонент реаль зуеться нейромережею, що мютить не менше трьох шарiв прихованих нейронних елемеш!в.

Рис. 2. Нейронна мережа ьз додаткови- Рис. 3. Геометрична ттерпретащя ми прихованими шарами нелШйних функщональноИпроекци для випадку елемент1в й=3 та М=2

Як i в попередньому випадку вихщш елементи мережi е лшшними, проте перший та третш прихований шари мають сигмощальш нелiнiйнi фун-кци активаци. Похибка визначаеться згiдно з (1).

Представивши мережу у виглядi двох послiдовних функцiональних проекцiй Б1 та Б2, отримаемо, що перша проекщя Б1 проектуе первиннi ё-ви-мiрнi данi на M-вимiрний шдпрослр Б, визначений активацiйними функщ-ями елемен^в у другому прихованому шарь У зв'язку iз присутнiстю нель нiйних елементiв у першому прихованому шарi це вiдображення е досить до-вiльним i нелiнiйним.

Вихщна частина мережi визначае функцiональне вщображення (про-екцiю) iз M-вимiрного простору назад у первинний d-вимiрний. На рис. 3 зображено геометричну штерпретащю для випадку ё=3 та М=2.

Функцiя Б2 проектуе iз M-вимiрного простору Б у d-вимiрний прос^р, отже, - визначае спосiб, в який прослр Б е вбудований в межах первинного Х-простору. Оскшьки проекцiя Б2 може бути нелшшна, пiдпростiр Б може бути неплоским, як показано на рис. 3. Надалi проекщя Б1 визначае проекщю точок оригiнального d-вимiрного простору в M-вимiрний пiдпростiр Б.

Незважаючи на добрi показники компреси, вадою цього шдходу вва-жають повiльне навчання для даних велико! розмiрностi, що робить його практично непридатним для завдань ущшьнення зображень i звуку.

2. Застосування автоасощативноУ нейромережi на основi Моделi Геометричних перетворень до ущшьнення зображень. Зображення, що

пройшло первинне оброблення (зафжсоване цифровою фотокамерою, вщска-новане зображення), - це двовимiрний масив двiйкових чисел, кожне з яких вщповщае конкретному пiкселю. На вхщ нейронно! мережi послiдовно пода-ються вектори даних, що вщповщають блокам зображення розмiром п*п шк-селiв (напр. 8*8, N=64). У випадку кольорового зображення, де кожен шксель видаеться 24-бiтовим числом, по 8 бгг на кожну компоненту, використо-вуеться 192 (64*3) вщповщно входiв та виходiв мережi. Кожен шксель зобра-ження представлений трьома компонентами вектора.

Використання нейронно! мережi для вирiшення будь-яких задач пе-редбачае виконання послiдовно двох еташв навчання та, вiдповiдно, викорис-тання мережг

2.1. Етап навчання мережь Подiл зображення на фрейми. Навчання мережi (покроковi перетворення вхщно! матрицi) грунтуеться на геомет-ричнш моделi та представленнi тiла шформацшного об'екта [2, 3]. Кожен вхщний вектор розглядаеться як точка у n-вимiрному просторi, де п - кшь-кiсть компонент вектора. Множина точок-реашзацш формуе тiло шформацшного об'екта (у даному випадку зображення), що моделюеться за допомо-гою нейромережi. Здiйснюеться навчання мережi шляхом покрокового проек-тування точок на нормальну гiперплощину, вимiрнiсть яко! на одиницю мен-ша анiж вимiрнiсть початкового гiпертiла.

Форма представлення векторiв-реалiзацiй вхщно! матрицi, елемента-ми яко! е значення пiкселiв xi,^, задана (2):

Хц хи ... X1N

=

x21 x22 ••• x2 N

xM 1 xM 1 ... xMN

>, i = 1,M, j = 1, N . (2)

Для шдвищення ефективност розробленого методу в цш робот! про-понуеться модифшувати алгоритм шляхом подшу зображення на фрейми, кожен з яких ущшьнюватиметься окремою нейронною мережею.

До початку застосування алгоритму, вхщне зображення подшяеться на р!вш частини (фрейми), кшьюсть яких дор!внюе 2l х 2l, де l = 0,1,2,... Кожен фрейм розглядаеться як окреме зображення, оброблення яких здшснюеться послщовно. Р!вень декомпресшних спотворень, що визна-чаеться коефщентом RSNR (англ. "peak signal to noise ratio), обчислюеться як усереднене значення коефщента для вЫх незалежних фрейм!в. Це можли-во завдяки тому, що навчання нейропод!бних структур Модел! Геометричних Перетворень е досить швидким. Для мереж з ггеративним навчанням цей метод е практично непридатним у зв'язку значними затратами часу на його реал!защю.

Отже, вводимо 2l х 2l незалежних нейронних мереж окремими наборами Головних Компонент, що отримуються внаслщок навчання.

Процедура навчання кожно! з них мютить так! кроки:

1. Обчислюемо центр ваги початкового масиву даних xi j, що пред-ставляе зображення

1 м _

= м£ xu' j =1N. (3)

2. Знаходимо рядок xcj, найближчий, згiдно з Евклщом, до центру ваги, та виконуемо центрування елеменпв масиву (3):

xCj « mini -xcrj - xUj У j, i = 1,M, j = 1, N, (4)

x1(j = x- j - xCj :k = 0. (5)

3. Знаходимо базовий рядок (найбiльш вщдалена точка вiд початку координат):

xBj) - max - jt^)2 J. (6)

4. Обчислюемо коефщент zj) - вщдаль вiд i-! точки до нормально! гiперплощини на k-му крощ ортогональних перетворень:

z?)=—1kr t( »к? х xBj >), (7)

D j=1

де D(k) - вщдаль вiд початку координат до базово! точки.

Особливiстю цього шдходу е те, що вiддаль вщ i-! точки до нормально! гшерплощини не е нормованою, отже максимально можливе значення

змiнно! дорiвнюе z}0) = 255 х Vn , де n - вимiрнiсть вектора-реалiзацi!, а мшь мальне значення вщмшне вiд нуля дорiвнюе 1. На кожному крощ перетворень дiапазон змшних zik) зменшуеться. Це надае змогу здiйснювати перет-

ворення у форматi чисел з фжсованою комою;

5. Виконуемо k-й крок ортогональних перетворень (проектування то-чок-реалiзацiй на нормальну гiперплощину):

j = xg) - XBj) х z(k), i = 1M, j = 1N , (8)

де XBj) - базовий рядок, нормований до одиничного радiуса.

Пiсля кожного кроку ортогональних перетворень вимiрнiсть гшерпо-верхнi зменшуеться на одиницю, а характеристики самого перетворення

(коефщенти zik ^) зберiгаються в пам,ятi як параметри мережi.

Навчання мережi вважаеться завершеним, якщо виконуеться умова xj" = 0 . Це означае, що всi точки-реалiзацi! спроектованi у початок координат; в шшому випадку здiйснюемо такий крок ортогоналiзацi!: k=k+1.

2.2. Етап використання нейронноУ мережi. Процедура використання кожно! мережi (вiдтворення первинних даних), що вщповщае фрейму зображення, здшснюеться у зворотнiй до алгоритму навчання послщовност^ почи-

наючи останнього кроку ортогонал!заци, внаслщок чого на виходах мереж! отримуемо масив чисел x^ j, як! вщповщають значенням елемеипв вщновле-

ного зображення.:

x1(k? = x1(k+1) + XB(k) х z(k), i = 1M, j = 1N: k = kmax, (9)

(10)

Ь J

^, j

j} x z( k >, i = x1(0)

x

i J

i ,J + xcJ •

3. Результата роботи алгоритму. На рис. 4.2, 4.3, 4.4 зображено результат виконання програми "Bitmap_coder" на тестовому зображенш "Rome" у двох режимах: без подолу зображення на фрейми та з подшом на 16 та 64 фрейми вщповщно за однаково! кшькоеп нейрошв у прихованому inapi.

Рис. 4.1 Початкове зображення "Rome", 1024*1024 ткселя

Рис. 4.2 Ыдновлене зображення "Rome", 1 фрейм, 4 нейрони, PSNR=25,3187594464021

Рис. 4.3 "Rome", 16 фреймiв, 4 нейро- Рис. 4.4 "Rome", 64 фрейми, 4 нейрони, Averaged_PSNR=25,856829730557 ни, Averaged_PSNR=28,113445086964 Висновки:

1. Аналiз результалв експерименпв довiв, що збшьшення кшькоси фреймiв призводить до покращення якост вiдновленого зображення, оскшь-ки зображення дiлиться на меншi областi, в яких збшьшуеться ймовiрнiсть появи однорiдних областей iз високою корелящею мiж пiкселями•

2. Застосування методу подшу зображення на фрейми, що реашзуеться на застосуваннi високошвидюсних ШНМ ГП, не призводить до помггного зростання часових затримок та зменшення коефiцiента ущiльнення, отже, мо-же розглядатися як важливий зашб покращення якостi цiе! процедури.

Лггература

1. Ткаченко Р.О. Вдосконалення нейромережних метод1в класифшаци в завданнях штелектуального анашзу даних за допомогою методу 1м1таци вщпалу металу / Р.О. Ткаченко, А.В. Дорошенко // Вюник Нацюнального ушверситету "Льв1вська пол^ехшка". - Сер.: Комп'ютерш системи проектування. Теор1я i практика. - 2007. - № 591. - С. 33-37.

2. Ткаченко Р.О. Нова парадигма штучних нейронних мереж прямого поширення / Р.О. Ткаченко // Вюник Державного ушверситету "Львiвська полiтехнiкам: Комп'ютерна iнженерiя та iнформацiйнi технологи. - 1999. - № 386. - С. 43-54.

3. Грицик В.В. Новi пiдходи до навчання штучних нейромереж / В.В. Грицик, Р.О. Ткаченко // Доповщ Нацюнально! академи наук Укра!ни. - 2002. - № 11. - С. 59-65.

4. Сергеенко В.С. Сжатие данных, речи, звука и изображений в телекоммуникационных системах / В.С. Сергеенко, В.В. Баринов // Издательское предприятие РадиоСофт. - М., 2009. - С. 163-173.

5. Сэломон Д. Сжатие данных, изображений и звука / Д. Сэломон // Техносфера. - М., 2004. - 346 с.

6. Christopher M. Bishop. Neural Networks for Pattern Recognition / Bishop Christopher M. // Oxford University Press (1999).

Полищук У.В. Нейросетевое сжатие изображений с использованием их разделения на фреймы

Предложен нейросетевой метод сжатия изображений на основе сокращения длины разрядной сетки, что используется для представления ортогональных компонент преобразования и обеспечивает дополнительное повышение коэффициента сжатия с сохранением заданных показателей качества. Также развита и апробирована методика улучшения качества воспроизведенных изображений и показателей сжатия путём дополнительного разделения изображений на фреймы. Данный метод обеспечивает повышение коэффициента качества изображения PSNR в среднем на 56 % при дополнительном повышении коэффициента сжатия.

Polishchuk U.V. Neural image compression using division images into

frames

Neural image compression method by reducing of a bit map lenght, which is used to represent orthogonal components of transformation, provides additional increase in compression ratio with preservation of the specified quality indicators is proposed. Also developed and tested methods for improving the quality and compression rates of the reproduced images by additional division images into frames. This method provides enhancing image quality rate PRSN by 5-6 % with increasing the compression ratio.

Keywords: neural colour image compression, division into frames, neurolike Geometrical Transformation Machine structure.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

УДК 674.02:621.923 Доц. О.А. Кйко, д-р техн. наук - НЛТУ Украти, м. Львiв

ПЕРЕВ1РКА Ш1ТАЦШНО1 МОДЕЛ1 КАЛ1БРУВАННЯ ПЛИТНИХ ДЕРЕВНИХ МАТЕР1АЛ1В НА ЧУТЛИВ1СТЬ

ДО ЗМ1НИ РОЗПОД1ЛУ

Вперше у процеа дослщження калiбрування-шлiфування плитних деревних ма-терiалiв використано принципи iмiтацiйного моделювання та перевiрено чутливють таких моделей на змшу закону розподшу вхщно! товщини оброблюваного матерiалу.

i Надоели баннеры? Вы всегда можете отключить рекламу.