Научная статья на тему 'Методика кластеризації зображень для їх компресії на основі компонентного аналізу'

Методика кластеризації зображень для їх компресії на основі компонентного аналізу Текст научной статьи по специальности «Математика»

CC BY
233
32
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
кластеризація зображень / методика стискання зображень / ПКЛ / clustering images / image compression technique / PCL

Аннотация научной статьи по математике, автор научной работы — Таянов Сергій Анатолійович, Таянов Віталій Анатолійович

Пропонується нова методика кластеризації зображень для їх подальшого адаптивного стиску. Проводиться дослідження ефективності стискання зображень шляхом використання двох різних методів кластеризації та стиску кластерів з допомогою адаптивної методики на основі перетворення Карунена-Лоєва.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Methods of image clustering for image compression on the basis of component analysis

In this paper the new methods both of the image clustering and their adaptive compression on the basis of KLT have been proposed. The effectiveness investigation of the image compression on the basis of both two different clustering methods and adaptive KLT method has been carried out. The research has showed that proposed approach gives the possibility to obtain the approximately equal given SNR value for every cluster using image reconstruction procedure. Also it gives the possibility to reach the larger value of the compression rate for the given SNR than traditional algorithms. The effectiveness of the proposed algorithm grows when one uses it for the image series compression.

Текст научной работы на тему «Методика кластеризації зображень для їх компресії на основі компонентного аналізу»

Выводы

Проведен анализ структуры области допустимых решений задачи размещения прямоугольников, выделены дополнительные особенности, на основе которых разработана модификация точного метода решения задачи, состоящая в осуществлении обхода дерева решений, которое обеспечивает пошаговый переход из точки вне области допустимых решений в граничную точку области (вершину) с последующим усеченным перебором вершин. Предложенная модификация позволяет существенно сократить число просматриваемых элементов области допустимых решений задачи. Данный подход программно реализован. В дальнейшем предусматривается проведение численных экспериментов с наборами данных практической размерности.

Список литературы: 1. Стоян Ю.Г., Яковлев С. В. Математические модели и оптимизационные методы геометрического проектирования. К.: Наук. думка, 1986. 268 с. 2. НовожиловаМ.В., ПопельнюхН.О. Розв'язання задачi ошгашзацп ресурав проекту при точних вихщних даних// Вюник ЖДТУ/ Техшчш науки. 2006. № 4 (39). С. 225-230. 3. Stoyan, Yu.G., Novozhilova, M. V. Non-guillotine placement or rectangles into a strip of given width / Pesquisa Operacional. 1999. Vol. 19, N 2. 145 p. 4. Магас С.А. Методы решения экстремальных задач размещения многоугольных геометрических объектов в полосе: Автореф. дисс. канд. физ.-мат. наук. М., 1984. 20 с. 5. Dyckhoff H, Scheithauer G, Terno J. Cutting and packing. In: Dell'Amico M, Maffioli F, Martello S (eds) Annotated bibliographies in combinatorial optimization. Wiley, Chichester, Chapt. 22, 1997. Р. 393-412. 6. ТахаХ.А.Введение в исследование операций. М.:Вильямс, 2001. 912с. 7. Петров Е.Г., Новожилова М.В., rpe6eHHÍK I.B. Методи i засоби прийняття ршень у сощально-екожмчних системах. К. : Техтка, 2003. 240с. 8. Гилл Ф., Мюррей У., Райт М. Практическая оптимизация. М.: Мир, 1985. 252с.

Поступила в редколлегию 27.11.2008 Чуб Игорь Андреевич, канд. техн. наук, доцент, докторант Университета гражданской защиты Украины. Научные интересы: математическое моделирование, прикладная геометрия, методы оптимизации. Адрес: Украина, 61023, Харьков, ул. Чернышевского, 94, тел.: 707-34-90, e-mail: [email protected]

Новожилова Марина Владимировна, д-р физ.-мат. наук, профессор, зав. кафедрой компьютерного моделирования и информационных технологий Харьковского государственного технического университета строительства и архитектуры. Адрес: Украина, 61000, Харьков, ул. Сумская, 40, тел.: 706-20-49, e-mail: [email protected].

УДК 519.677

С.А. ТАЯНОВ, В.А. ТАЯНОВ

МЕТОДИКА КЛАСТЕРИЗАЦИ ЗОБРАЖЕНЬ ДЛЯ ÏX КОМПРЕСП НА ОСНОВ1 КОМПОНЕНТНОГО АНАЛ1ЗУ

Пропонуеться нова методика кластеризаци зображень для 1х подальшого адаптивного стиску. Проводиться дослщження ефективносп стискання зображень шляхом використан-ня двох рiзних метсдав кластеризаци та стиску класт^в з допомогою адаптивно1 методики на основi перетворення Карунена-Лоева.

1. Вступ

В багатьох системах для збертання графiчноï шформацп часто виникае необхщнють стискання зображень, причому не тшьки шдивщуальних зображень, а також i ï^ груп для того, щоб отримати кращ1 ступеш компресп. Це досягаеться шляхом зменшення шформацп, що мютиться в заголовках, оскшьки ця шформащя буде спшьною для всiеï серп зображень.

Суть бшьшосп алгоршмв для стискання зображень полягае в дшенш зображення на окремi блоки (кластери) та в подальшому стисканню цих блоюв за допомогою рiзних алгоршмв. Тому перспективним е не тшьки розробка алгоршмв для стиску зображень, а й розробка нових методик кластеризаци зображень.

В данш робот пропонуеться методика кластеризаци зображень та алгоритм для покра-шення ступеня компресп зображення на основi перетворення Карунена-Лоева (ПКЛ).

Використання ПКЛ для стискання зображень е дуже ефективним, оскшьки воно мiнiмiзуе середньоквадратичну похибку при використанш часткового набору базисних функцш у

розкладу Однак використання цього алгоритму для стискання цшого зображення неефек-тивне на практищ, тому що воно вимагае збереження велико1 матрицi перетворення разом 3i стиснутими даними. Використання кластеризацп та стискання окремих кластерiв зображення на основi ПКЛ е доволi перспективним, а тому актуальним е розробка нових адаптивних алгоршмв для кластерного стиску зображень на основi ПКЛ. Застосування матрищ ПКЛ для серп зображень також тдвищить стутнь стиску для шдивщуальних зображень за рахунок спiльноï службово1 iнформацiï (матриця ПКЛ), оскiльки практичш результати [1] показують, що ефективнють ПКЛ для серiï зображень незначно зменшуеть-ся порiвняно з одним зображенням i вона е завжди бiльшою, нiж в дискретного косинусного перетворення, яке застосовуеться в багатьох алгоритмах стиску зображень.

2. Аналiз останшх дослщжень

Кластеризацiя зображення та стискання окремих кластерiв використовуеться в одному з найбшьш популярних графiчних форматiв JPEG [2] та JPEG 2000 [3]. Також використання вейвлет-перетворення та автоматичноï сегментацп дозволили створити найефектившший на сьогоднiшнiй день формат DjVu [4].

Що стосуеться стиску на основi ПКЛ, то зокрема вiдомi роботи, присвяченi компресiï спектра зображень одного розмiру на основi попередньо1' кластеризацiï, наприклад [5]. Ще одна область, де себе добре зарекомендував кластерний ПКЛ, - це область цифрового стиску вщеошформацп [6] та аудюшформацп [7]. Детальний огляд проблем кластеризацп поданий у [8] та [9].

Мета даного дослщження - розробка нових методик кластеризацп зображень для 1'х подальшого адаптивного стиску на основi ПКЛ.

3. Кластеризащя та подальше використання ПКЛ

Для зображення розмiру m х n розбиваемо матрицю на прямокутш кластери розмь ром 8 х 8 та нумеруемо злiва направо та зверху вниз. Також нумеруемо елемент кожного кластера злiва-направо та зверху вниз, тобто лiвий верхнш елемент i -го кластера буде позначатися як S;i, а правий нижнш елемент - як Sj64 .

m х n

В результатi отримуемо —— кластерiв з 64 елементiв кожний. Якщо S; - i-й кластер,

8 х 8

A - матриця зображення, A; - елемент матрищ A , тодi коварiацiйна матриця для вшх кластерiв S буде виглядати так:

mxn

8 х 8 8x8 — — т,

R = l^l Z (Si - x)(Si - x)T, (1)

mх n ;=i

_ i m n

де x =-ZZAij - середне значення матрицi A .

m ' ni=ij=i

З коварiацiйноï матрицi отримаемо матрицю власних векторiв, розв'язавши рiвняння на власш значення ^ j виду

R9j = ^ j9 j, (2)

яка складаеться з 64 власних векторiв, кожний з яких складаеться з 64 елемеш!в, тут 9j -j-й власний вектор.

Знаходимо вектор коефщенпв розкладу за власними векторами для кожного кластера:

с; = ф-V (3)

де Ф - матриця власних векторiв, яка складена з векторiв 9j.

Методика стискання зображень за допомогою ПКЛ полягае в тому, що якщо в кожному векторi с ; матрищ коефщенпв розкладу C видшити тiльки певну кiлькiсть найбшьш суттевих значень за амплiтудою i тшьки 1'х зберiгати i враховувати, то можна зменшити кiлькiсть шформацп, що зберiгаеться. Крiм того, необхщно зберiгати значення матрицi

власних векторiв. Але якщо кiлькiсть пiкселiв у зображеннi буде на декшька порядкiв бiльшою, нiж кiлькiсть значень в матрищ власних векторiв, то нею можна знехтувати при розрахунку коефщента компресп.

Для вiдновлення зображення потрiбно вiдновити кожний кластер зображення за допомо-гою зворотного ПКЛ:

= Ф'е',, (4)

де е'|, ф' - модифшоваш матриця коефiцieнтiв розкладу та матриця власних векторiв, отриманi в результат стискання (вiдкидання менш сут-тевих значень). Пiсля того з клас-терiв вiдновлюеться зображення.

Запропонований адаптивний алгоритм стиску полягае в тому, що для рiзних кластерiв вибираемо рiзну кiлькiсть коефщенлв розкладу для за-безпечення постшного заданого по кожному кластеру та певним чином обмежуемо максимальну кiлькiсть коефiцiентiв розкладу.

Блок-схема цього алгоритму наведена на рис 1. Вихщними даними алгоритму служать: заданий 8КЯ, виз-начена з (2) матриця власних век-торiв ф, матриця коефщенпв розкладу с, яка знайдена за формулою (3), розмiр матрищ зображення т х п та коефiцiент допуску d. В блоцi 3 (див. рис. 1) встановлюеться почат-кова кшьюсть коефiцiентiв розкладу для ьго кластера п=1, в блоцi 4 встановлюеться при вщновленш ь того кластера (8КЯ_ББР=0). В блощ 5 порiвнюеться заданий та

8КЯ_ББР i-го кластера при його вщновленш з допомогою п коефiцiентiв розкладу, а також перевiряеться умо-ва (5) допустимо! кшькосп ко-ефiцiентiв розкладу п < d • N, де N -середне значення кiлькостi ко-ефiцiентiв розкладу серед всiх клас-терiв, яке необхiдне для забезпечен-ня заданого SNR. Для того щоб знай-ти N , необхщно виконати весь алгоритм блок-схеми (див. рис. 1) без умо-ви (5), тобто блок 5 буде мати умову тшьки SNR_DEF > SNR .

Визначення N проводиться в блощ 13. Якщо умови в блощ 5 вико-нуються, то вибираеться наступний кластер. Якщо ж ш, то для п ко-ефщенпв розкладу формуеться матриця коефщенпв розкладу е' з матриц е та матриця власних векторiв ф' з матрицi ф (блок 6).

Рис. 1. Блок-схема адаптивного алгоритму для стискання кластер1в на основ1 ПКЛ

За формулою (4) виконусться зворотне ПКЛ для ьго кластера (блок 7), в результат якого вщновлюеться ьй кластер 8';. Далi в блощ 8 знаходиться 8КЯ_ВБР мiж оригшаль-ним кластером 8; та вщновленим 8';. Пiсля того в блощ 9 збшьшуемо кшьюсть ко-ефiцieнтiв розкладу для ьго кластера П; = П;+1 i блоки 6-9 виконуються знову. Цикл (блоки 5 -9) виконуеться до моменту досягнення заданого для ьго кластера (поки

SNR_DEF<SNR). Блоки з 3 по 9 виконуються для Bcix

m х n

KracrepiB. В блоцi 10

проводиться тдсумовування Bcix коефiцieнтiв розкладу. В блощ 12 вщбуваеться пеpехiд до наступного кластера.

На рис. 2 показаш результати моделювання залежноcтi SNR вщ коефiцieнта стиску K для piзниx значень максимально! кiлькоcтi коефщентв розкладу Nmax . Розглядаються 4

випадки: Nmax = N (d = l),Nmax = 2N (d = 2), Nmax = 1-5N (d = 1.5) та Nmax = 64 (64 -повна кшьюсть коефiцieнтiв розкладу), тобто обмеження на кшьюсть коефiцieнтiв вiдcутнe. Як видно з графша, в дiапазонi K<3.5 найбiльший SNR буде при Nmax = 2N та коли обмежень на кшьюсть коефiцieнтiв розкладу немае (Nmax = 64 ). При K > 3.5 найбiльший ефект досягаеться, коли Nmax = N, але SNR для випадюв, коли Nmax = 2N та Nmax = 1.5N , не дуже сильно вщ нього в^^зняеться. Тому найбiльш ефективний SNR на всьому дiапа-зонi буде при Nmax = 2N (d = 2).

Рис.2. Залежтсть 8КЯ в1д коефщента стиску К для р1зних значень максимально! к1лькост1

коеф1ц1ент1в розкладу Мшах На рис. 3 показано запропонований алгоритм кластеризаци зображень, який може бути застосований для стискання сери зображень. Суть алгоритму полягае в тому, що зображен-ня розбиваеться на блоки 8х8 злiва-направо, зверху-вниз, як i в попередньому випадку. Але при цьому одним кластером вважаеться 8 поряд розташованих по горизошат блоюв (в принцип можна вибирати блоки i по вертикал^. Так, для 1-го кластера номери елементв першого з восьми блоюв будуть 8;1,8;2,..8;64, для другого Si65,Si66,..Si128 i так далi, аж до останнього, як показано на рис. 3. Таким чином, загальна кшькють коефщентв для кожного кластера дорiвнюе 512.

З виразу (1) отримуемо коварiацiйну матрицю для вибраних кластерiв розмiром 512х512. Пюля того можна знайти матрицю власних векторiв ф. Якщо для стискання кластерiв

застосувати алгоритм, зображений на рис. 1, то умова (12) буде виглядати як ; ^ -щщ, а

. — 512М . вираз (13) запишеться у виглядi N =-. На рис. 4 представлеш результати моделюван-

ня залежносп SNR вщ коефiцieнта стиску K для значень максимально! кшькосп ко-ефiцieнтiв розкладу Nmax = 512 (максимальна кшьюсть коефiцieнтiв не обмежусться) та Nmax = 2N для запропонованого алгоритму кластеризацi!.

( ... .'I

Sii Sa_Sis Si«_ Sms

Si9

Si64 k>il28 £>l512 *

\ ... 7

Рис. 3. Схема запропонованого алгоритму кластеризацп зображень

Рис.4. Залежтсть SNR в1д коефщента стиску K для р1зних значень максимально!' кшькосп коефщенпв розкладу Nmax для кластер1в розм1ром 512

З рис. 4 можна побачити, що при необмеженш кiлькостi коефiцieнтiв розкладу ПКЛ та при Nmax = 2N - значення SNR при певних коефщентах K фактично збтаються. Таким чином, умову (5) в блок-схемi на рис. 1 для даного алгоритму можна не застосовувати. Якщо порiвняти результати, як наведенi на рис. 2, з результатами на рис. 4, то можна побачити, що SNR для запропонованого алгоритму кластеризацп е кращим на 10-12% для коефщенпв стиску K < 10..12 . Цей алгоритм можна застосовувати для велико! серп зображень, тому що отримуемо достатньо велику матрицю власних векторiв (512х512), яка мае збертатися разом зi стиснутими даними зневолюе кращi результати стиску порiвняно iз застосуванням традицшних кластерiв 8х8 та разом з тим збшьшення кiлькостi зображень у серп тшьки незначно погiршуе значення сигнал-шум при вщновленш, як показано в [1]. У випадку серп зображень коварiацiйна матриця знаходиться на основi кластерiв всiх зображень серп.

Висновок

Запропонована нова методика кластеризацп зображень для !х подальшого стиску та алгоритм для подальшого стиску на основi ПКЛ. Проведено дослщження ефективносп стискання зображень на основi використання двох рiзних методiв кластеризацп та адаптивно! методики на основi ПКЛ.

Дослщження показали, що запропоноваш алгоритми дозволяють досягти бшьшого коеф-iцiента компресi! для заданого SNR, шж традицiйнi алгоритми. Ефектившсть наведеного алгоритму зростае при застосуванш його для компресi! серш зображень.

Список лiтератури: 1. Lee J. Optimized quadtree for karhunen-loeve transform in multuspectral image coding", Image Processing, IEEE Transactions on 8. 1999. Р. 453-461. 2. JPEG: ITU-T Rec. T.81-ISO/IEC. No. 10918-1, "Information Technology - Digital compression and Coding og Continuous-Tone Still Images", 1993. 3. Taubman D.S. and Marcellin M.W. JPEG2000: Fundamentals, Standards and Practice. Kluwer Academic Publishers, Boston, 2002. 4. Technical Papers from AT&T Labs: Електроннш ресурс. Режим

доступу: http://djvuzone.org/techpapers/index.html. 5. Saghri J., Tescher A., and Reagan J. Principal Transform coding of multispectral imagery // Signal Processing Magazine, IEEE, pp. 32-43, 2005. 6. Z. Wen, Z. Liu, M.Cohen, J. Li, K.Zheng, andT. Huang. Low bit-rate video streaming for face-to-face teleconference // Multimedia and Expo, 2004. ICME '04. 2004 IEEE International conference, pp. 1631-1634 Vol.3, 2004. 7. Sergey Tayanov, Vitalij Tayanov. The error analysis of speech signal computer compression by Karhunen-Loeve transform // Proceedings of the XI Polish-Ukrainian Conference on "CAD in Machinery Design. Implementation and Educational Problems." 2003. Р. 113-119. 8. Jain A. and Dubes R. Algorithms for clustering Data, Prentice Hall, 1988. 9. Jain A., Murty M., andFlynn P. Data clustering: A review // ACM Computing Surweys 31, 1999.

Надшшла до редколегИ 07.12.2008 Таянов Сергш Анатолшович, канд. техн. наук, доцент кафедри АКМ НУ "Л^вська полггех-шка". Науковi тереси: обробка сигнув та зображень. Адреса: Украша, 79013, Л^в, вул. С. Бандери, 12, тел. 258-25-98, e-mail: [email protected].

Таянов В1талш Анатолшович, канд. техн. наук, наук. ствр. ФМ1 iм. Г.В. Карпенка НАН Украши. Науковi штереси: математичш методи розтзнавання обpазiв. Адреса: Украша, 79601, Л^в, вул. Наукова, 5а, тел. 229-65-30, e-mail: [email protected].

УДК 004.652.4+004.827

Н.Б. ШАХОВСЬКА, Д.1. УГРИН

ТЕХНОЛОГ1Я ETL В ШТЕГРАЦП ДАНИХ ТУРИСТИЧНОГО Б1ЗНЕСУ

Розглядаеться одна iз технологш консолщацп даних - ETL. Будуються алгоритми для piзниx еташв виконання ETL та показуються вузькi мicця ц1е! технологи.

Вступ

Дослщження штеграцп даних туристичного бiзнеcу дае змогу оцiнити розвиток техшчних заcобiв, теxнологiй, додаткiв i продукпв з метою подальшого прийняття ефективних ршень стосовно розвитку галузi. У фокус нового доcлiдження перебувае не тшьки роль штеграцп даних у проектах по створенню сховищ, але й технолопчна база керування метаданими.

Засоби ETL - це технолопя управлшня метаданими. На cьогоднi юнують два типи розв'язання ще1 задача доступ до piзниx баз даних за допомогою SQL; використання шструментв ETL, що витягують данi i помiщають !х у сховища, минувши лопку застосу-вань.

ETL оpiентована на бази даних, сховища, вприни або опеpацiйнi сховища даних та виконуе процес проектування процедур витягання, завантаження i перетворення даних (ETL - extract, transform and load). На цьому етат штеграцп виршуються проблеми cумicноcтi даних з piзниx джерел. Разом з аналiзом i cтандаpтизацiею iнфоpмацil - це один з найтрудо-мicткiшиx i вщповщальних етапiв, а також один з найбшьш витратних за часом.

1. Актуальшсть роботи

Мета роботи - штегращя у пpоcтоpi даних туристично! сфери.

Тема доcлiдження проблеми штеграцп даних в туристичному бiзнеci е актуальною, оскшьки методи iнтегpацil даних, що використовуються, не можуть до кшця pеалiзувати весь обсяг виконуваного процесу, а саме штегрують лише частину спшьних для piзниx застосувань даних.

1нтегращя даних дозволить:

- одержати повну шформацда про клiентiв;

- виконати одержання поточних фiнанcовиx даних для обов'язково1 звiтноcтi й виконання вимог законодавства;

- консолщувати поточну iнфоpмацiю з декшькох джерел.

Теxнологiя ETL в штеграцп даних виявляеться найкорисшшою в тих випадках, коли необхщно створити сховище даних, що мicтить добре документоваш i надiйнi данi для юторичного аналiзу, наприклад, для аналiзу часових pядiв або багатовимipниx запитiв. Вона

i Надоели баннеры? Вы всегда можете отключить рекламу.