------------------□ □---------------------
Розглянуті проблеми трансформації зображень, пов’язаних зі зміною частоти дискретизації. Запропоновано підхід для інтерполяції зображень, який ґрунтується на узагальненні теореми відліків. Для порівняльного аналізу зображень застосовано метрику на основі фрактальної розмірності
Ключові слова: дискретизація, інтерполяція зображень, відліки сигналу, фрактальна розмірність
□-----------------------------------□
Рассмотрены проблемы трансформации изображений, связанные со сменой частоты дискретизации. Предложен поход для интерполяции изображений, который основан на обобщении теоремы отсчетов. Для сравнительного анализа изображений использована метрика на основе фрактальной размерности
Ключевые слова: дискретизация,ин-терполяция изображений, отсчеты сигнала, фрактальная размерность ------------------□ □---------------------
УДК 004.932.2:519.6
ПЕРЕДИСКРЕТИЗАЦІЯ ЗОБРАЖЕНЬ З ЗАСТОСУВАННЯМ УЗАГАЛЬНЕНИХ РЯДІВ УІТТЕКЕРА-КОТЕЛЬНИКОВА-ШЕННОНА
В. В. Мороз
Кандидат технічних наук, доцент Професор кафедри обчислювальної математики Одеський національний університет вул. Дворянська, 2, м. Одеса, Україна, 65086 E-mail: [email protected]
1. Вступ
Сучасні цифрові технології зробили можливим використання багатовимірних сигналів в широкому діапазоні цифрової техніки: від простих датчиків, сенсорів, цифрових схем на сигнальних процесорах та програмованих користувачем вентильних матриць, до розподілених і паралельних обчислювальних кластерів. Візуальні сигнали займають особливе місце в сприйнятті інформації людиною. Зір дає змогу людині відчувати і сприймати навколишній світ, тоді як комп’ютерний зір має на меті відтворення цифрових візуальних образів - зображень, які відповідають цьому сприйняттю та їх розумінню.
Теорія, моделі та методи аналізу, обробки і розуміння зображень є основою для побудови систем телемедицини, систем військового призначення (для виявлення живої сили і транспортних засобів противника), систем наведення ракет, систем управління автономними підводними, наземними, пілотними та безпілотними підводними, наземними. Одними з найбільш поширених операцій обробки зображень в таких системах є афінні трансформації (масштабу-вання, переміщення, зсув, поворот) цифрових зображень. В залежності від сфери застосування розрізняються і вимоги, яким мають задовольняти методи реалізації афінних трансформацій (АП) - візуальна якість та обчислювальна складність.
Існуючі методи АП мають різні характеристики трансформованих зображень, які можуть суттєво різнитися. Очевидно, що в медичній сфері вирішальним чинником у виборі методів АП апріорі важливішою буде якість отриманого зображення, ніж швидкість обробки даних. Прикладом такого успішного застосування методів повороту та масштабування зображень, отриманих при обстеженні пацієнтів,
є магнітна томографія. У військовій справі, управлінні транспортними засобами швидкість обробки візуальних даних має таке ж важливе значення, як і візуальна якість. А при виборі графічних редакторів та ігровій індустрії вибір методу у значній мірі залежить від економічної складової, оскільки, чим більш вимогливою до апаратних ресурсів буде програмне забезпечення, тим вужче буде коло користувачів подібних систем. Якщо в графічних редакторах доцільно надати можливість користувачеві самому вибрати метод трансформації виходячи з параметрів його комп’ютера і вимог користувача до якості, то в іграх така можливість, як правило, відсутня, оскільки в цьому випадку вирішальне значення набуває швидкість обробки графічних даних.
Незважаючи на всю актуальність і практичне значення існуючих методів АП зображень, існує певний попит на комплексний аналіз останніх досліджень та нові дослідження з даної теми з зазначенням практичних рекомендацій.
В даній роботі пропонується новий підхід до мас-штабування статичних зображень, який також може бути успішно застосований в просторово-часовій інтерполяції в задачі стиску відео.
2. Методи трансформації зображень
Оптимальним методом АП з точки зору візуального сприйняття є такий, при якому вихідне зображення зазнає найменших змін. Але поворот графічного об’єкта на заданий кут, відмінний від значення кратного 90°, перенос на дробні частини дискретної сітки, будь-яке масштабування, як правило, призводить до погіршення його якості. Причина даного явища лежить у необхідності інтерполяції зображення - визначенні
|бГ
©
невідомих значень зображення в проміжних точках дискретної сітки.
При повороті графічного об’єкта вихідні координати точок зображення, які відповідають вузлам дискретної сітки, зміщуються відносно початкової сітки зображення, і в більшості випадків ці точки вже не лежать у вузлах піксельної решітки. У силу неціло-чисельності отриманих координат і необхідності їх приведення до цілих чисел, при найпростішій операції округлення координат «повернених» пікселів на отриманому зображенні виявляються артефакти, що представляють собою «порожнечі» - елементи зображення, що не містять графічної інформації й «накладені» пікселі (пікселі, в які записуються дані про яскравість відразу від двох пікселів оригінального зображення). Аналогічна ситуація виникає і при переносі на дрібні частини пікселя. Операція масштабування взагалі призводить до пошуку інформації про пікселі, які відсутні на початковому зображенні.
Інтерполяція інформації [1, 2] про яскравість пікселів представляє собою інструмент для компенсації виникаючих артефактів з метою приведення кінцевого зображення в максимальну відповідність вихідного зображення. Під інтерполяцією розуміється спосіб знаходження проміжних значень величини яскравості (дані про «проміжний» піксель) за наявним дискретним набором відомих значень яскравостей сусідніх пікселів. Зазвичай в результаті інтерполяції створюються проміжні значення яскравостей як зважена сума яскравостей сусідніх пікселів. Очевидно, що інтерпольовані дані будуть відрізнятися від реальних оптичних даних, отриманих за допомогою фотокамери, і якість кінцевого зображення буде залежати від типу застосованої інтерполяції, а саме - від кількості суміжних пікселів, що використовуються для одержання проміжних значень і видом функції сполучення, за допомогою якої здійснюється інтерполяція.
Загальноприйняті алгоритми інтерполяції можна поділити на дві категорії: адаптивні та неадаптивні. Адаптивні методи змінюються в залежності від предмета інтерполяції (різкі кордони, гладка текстура), тоді як неадаптивні [3] методи обробляють всі пікселі однаково. До неадаптивних методів інтерполяції відносяться:
- метод найближчого сусіда;
- білінійна інтерполяція,
- бікубічна інтерполяція,
- сплайн-інтерполяція,
- ідеалізована інтерполяція, яка ґрунтується на теоремі дискретизації.
Залежно від складності, використовується від 0 до 256 (або більше) суміжних пікселів для інтерполяції. Чим більше суміжних пікселів вони включають, тим більш точними можуть виявитися, але даний ефект досягається за рахунок значного збільшення часу обробки. Ці алгоритми можуть використовуватися як для повороту, так і для масштабування і переносу зображення.
Адаптивні алгоритми застосовуються в алгоритмах таких комерційних програмних продуктів, як Qimage, PhotoZoomPro, GenшneFractals та інших. Багато з них застосовують різні версії своїх алгоритмів (на основі попіксельного аналізу), коли виявляють наявність кордону - з метою локальної мінімізації
візуальних дефектів інтерполяції. Ці алгоритми, в першу чергу, розроблені для максимізації бездефектної детальності збільшених зображень.
3. Інтерполяція сигналів та теорема про вибірки
Традиційний підхід в цифровій обробці сигналів ґрунтується на теоремі Уіттекера-Котельникова-Шен-нона [4, 5] про вибірки, яка розв’язує задачу інтерполяції лише для відліків функції на нескінченому інтервалі часу:
^) = X £(к 'М)
sm(юN(t - к -Л^) (<вК0; - к -Л^) ,
де:
Лt = -
- інтервал дискретизації;
утал - максимальна частота, якою обмежений спектр ^);
юN = 2путах - частота Найквіста.
В частотній області для обмежених в часі < Т сигналів у випадку неперервного спектру ^у) будемо мати:
ї(у) = X ?(2лк-Лу)
зт(2пТ(у- к -Лу)) 2пТ(у- к -Лу) ,
де:
V - лінійна частота;
Лу - крок відліку частоти.
Але припущення, прийняті в теоремі Котельникова-Шеннона, не дозволяють позбутися таких недоліків, як необмеженість спектру реальних стохастич-них сигналів, складність розрахунків для відновлення функції числовими рядами, нерівномірність відліків, неможливість урахування похибки вимірювання функції в точках дискретизації та визначення статистичних характеристик похибки при дискретизації [6].
Тому в практичних задачах залишається актуальним питання розробки методів відновлення значень функції в проміжках між дискретними значеннями
- заміні безкінечного ряду скінченим.
4. Узагальнення рядів Уіттекера-Котельникова-Шеннона
На даний час існують практичні реалізації екстраполяторів різної складності: у вигляді степеневого ряду, поліноми Лагранжа, Левітана, сплайни, атомарні функції) та інші.
Розглянемо узагальнення рядів Уіттекера-Котель-никова-Шеннона на основі атомарних функцій [7]. Тоді неперервний сигнал ^) з обмеженим фінітним спектром suppf(ю) = [-О; О] може бути однозначно представлений його дискретними відліками як:
ї(х) = X і(к Л) Пsinc(
і=і (Л- а1 ^(х - к -Л)
),
за умови
к=
1
к=-
П
к
.і
6. Висновки
Даний ряд задовольняє усім вимогам теореми Уіт-текера-Котельникова-Шеннона та має кращу збіжність у випадку розривних та локальних у часі сигналів. При обчисленні застосовується скінчений добуток і тоді має місце точне розкладання [8]:
f(x) = X f(k A) Пsinc(
при
a (1 + a-N) > 2, A =
(A-ai 1)(x - k-A) п a(1+a-N)-2
),
Q
a-1
5. Порівняльний аналіз зображень різної розмірності
Оскільки при масштабуванні тим чи іншим методом нове зображення має відмінні розміри і в ньому присутня нова інформація про елементи зображення, то потрібно виявити наскільки ентропія нового зображення відповідає оригіналу.
Фрактальна розмірність означає статистичну величину, яка говорить про те наскільки повно фрактал заповнює простір, коли збільшувати його до дрібніших деталей [9]. У зображенні завжди присутні подібні елементи, такі як лінії і квадрати, що наближають його до фракталу. Тоді можливо розрахувати фрактальну розмірність початкового і вихідного зображення за допомогою методу розбивання на квадрати і об’єднати за допомогою метрики PSNR (Peak Signal-Noise Ratio). Для цього потрібно розбити зображення на блоки із принципово різними елементами і всі послідуючі операції виконувати окремо для кожної ділянки, а також отримати чорно-білу мапу зображення на основі яскравостей пікселів. Метод квадратів дозволяє підрахувати кількість подібних елементів за допомогою поділу на квадратні блоки, що накривають все зображення. Фрактальна розмірність Мінковського [10] розраховується по формулі:
D=
log N(r)
де N - кількість вікон розміру г , якими можна покрити непусті елементи фракталу.
Даний підхід дозволяє порівнювати оригінальне та масштабоване зображення без існування оригіналу зображення, яке відповідає масштабованому.
Порівняльний аналіз запропонованого методу інтерполяції зображень був апробований в задачі потокової передачі послідовності зображень для пошуку поля векторів руху.
Для уточнення поля векторів руху треба застосовувати або медіанну фільтрацію, яка зараз є одним із найбільш популярних підходів, або застосовувати глобальні методи.
Але глобальні методи мають обмеження на обчислювальну складність і тому не можуть бути застосовані там, де необхідною умовою є потокова передача та аналіз відео послідовності в режимі реального часу.
Для розв’язанні цієї дилеми пропонується застосування просторово-часової інтерполяції послідовності зображень:
1. Часова децимація послідовності, в результаті якої кількість кадрів зменшується в два рази.
2. Просторова децимація кадрів, в результаті якої кількість дискретних відліків на кадр зменшується
1
в (1-----) раз, де кг,к - коефіцієнти децимації по
кгкс
рядках та по стовпцях відповідно.
3. Обчислення поля векторів руху для кожної сусідньої пари кадрів.
Результуюче поле векторів руху в залежності від області застосування може бути отримане двома способами:
1. Інтерполяція поля векторів руху, з наступною часовою інтерполяцією послідовності зображень.
2. Часова інтерполяція послідовності зображень з наступною просторовою інтерполяцією кадрів.
При інтерполяції поля векторів враховувалася його гладкість, а для відновлення розмірів кадрів застосовувався розроблений метод просторової інтерполяції.
Даний метод ґрунтується на теоремі Парсеваля і використовує спектральну щільність енергії зображення в якості розподілу послідовності енергії як функції від частоти.
Аналіз результатів показав, що запропонований підхід суттєво зменшує похибки при обчисленні оптичного потоку в порівнянні з існуючими методами на основі погодження блоків зображення і має переваги відносно методів, що ґрунтуються на кратномасштабномувейвлетному підході. Отримані результати на тестових даних підтвердили низьку обчислювальну складність і високу якість відновленої відео послідовності.
k=
r
Література
1. Shai, Avidan. Seam Carving for Content-Aware Image Resizing [Текст] / Shai Avidan, Ariel Shamir // Proceedings of SIGGRAPH 2007. - ACM Transactions on Graphics. - Vol. 26, no. З. - 2008. - С. 16.1-16.10.
2. Leitao, J. A. Content-Adaptive Video Up-Scaling for High-Definition Displays / J.A. Leitao, M. Zhao and G. de Haan // Proceedings of the SPIE. - 200З. - Vol. 5022. - С. 612-622.
3. Turkowski, Ken. Filters for Common Resampling Tasks ^екст] / Ken Turkowski // Graphics gems I. - Academic Press Professional, Inc. - 1990. - C. 147-165.
4. Аветисян, Д. О. О представлении непрерывных функций одного класса дискретным множеством их значений [Текст] / Д.О. Аветисян // Проблемы передачи информации. - 1984. - Т. 20, Вып. З. - С. 94-96.
Е
5. Джерри, А. Дж. Теорема отсчетов Шеннона, ее различные обобщения и приложения [Текст] / Дж. Джерри // Обзор. ТИИЭР.
- 1977. - Т. 65, № 11. - С. 53-89.
6. Petre, Stoica. Spectral analysis of signals [Текст] / Petre Stoica, Randolph L. Moses. - Pearson Prentice Hall. 2005. - 452 c.
7. Кравченко, В.Ф. Лекции по теории атомарных функций и некоторым их приложеним [Текст] / В.Ф. Кравченко. — М.: Радиотехника, 2003.- 512 с.
8. Спектральные свойства атомарных функций в задачах цифровой обработки сигналов [Текст] / В. Ф. Кравченко, М. А. Баса-раб, Х. Перес-Меана // Радиотехника и электроника. - 2001. - Т.46, №5. - С. 534-552.
9. Fractals and the Fractal Dimension [Електронний ресурс] // Vanderbilt University official website. - Режим доступу: \www/ URL: http://www.vanderbilt.edu/AnS/psychology/cogsci/chaos/workshop/Fractals.html/ -22.11.2012.
10. Shezafs, N., Abramov-Segals, H., Sutskovers, I. Adaptive low complexity algorithm for image zooming at fractional scaling ratio [Електронний ресурс]// The Signal and Image processing Lab.-Режим доступу:\www/ URL:http://www-sipl.technion.ac.il/new/ Teaching/Projects/Zoom_Article.pdf/ - 10.11.2012.
-------------------□ ;--------------------—
Зусилля були спрямовані на пошук методів для ефективної та точної кластеризації великих баз даних. В основному теми дослідження зосереджені на масштабованості кластерних методів, ефективності методів кластеризації для складних форм і типів даних, багатомір-них методах кластеризації, а також методах кластеризації змішаних чисельних і категоріальних даних у великих базах даних
Ключові слова: база даних, поєднання у кластери, k-NN граф, гиперграф, сусід, багатофункціональний
□---------------------------------□
Усилия были направлены на поиск методов для эффективной и точной кластеризации больших баз данных. В основном темы исследования сосредоточены на масштабирован-ности кластерных методов, эффективности методов кластеризации для сложных форм и типов данных, многомерных методах кластеризации, а также методах кластеризации смешанных численных и категориальных данных в больших базах данных
Ключевые слова: база данных, объединение в кластеры, k-NNграф, гиперграф, сосед, многофункциональный -------------------□ □---------------------
УДК 665.9
A MULTILEVEL APPROACH TO THE DYNAMIC HIERERCHICAL CLUSTERING FOR COMPLEX TYPES OF
SHAPES
T. Shatovska
Associate Professor* E-mail: [email protected] A. Zaremskaya*
E-mail: [email protected] *Department of Software Engineering Kharkiv National University of Radioelectronics Lenina, 16, Kharkov, Ukraine, 61166
1. Introduction
The process of grouping a set of physical or abstract objects into classes of similar objects is called clustering. A cluster is a collection of data objects that are similar to one another within the same cluster and are dissimilar to the objects in other clusters. A cluster of data objects can be treated collectively as one group in many applications. Data clustering is under vigorous development. Contributing areas of research include data mining, statistics, machine learning, spatial database technology, biology, and marketing. Owing to the huge amounts of data collected in databases, cluster analysis has recently become a highly active topic in data mining research. As a branch of statistics, cluster analysis has been studied extensively for many years, focusing mainly on distance-based cluster analysis. Active themes of
research focus on the scalability of clustering methods, the effectiveness of methods for clustering complex shapes and types of data.
Chameleon is a clustering algorithm that explores dynamic modeling in hierarchical clustering. In its clustering process, two clusters are merged if the interconnectivity and closeness between two clusters are highly related to the internal interconnectivity and closeness of objects within the clusters. The merge process based on the dynamic model facilitates the discovery of natural and homogeneous clusters and applies to all types of data as long as a similarity function is specified. Chameleon is derived based on the observation of the weakness of two hierarchical clustering algorithms: CURE and ROCK. CURE and related schemes ignore information about the aggregate interconnectivity of objects in two different clusters, whereas ROCK and related
бб|...........................................................................................................................................................................................