УДК 004.932 ББК 22.183.4 К 28
Каспарьян М.С.
Кандидат физико-математических наук, сотрудник института систем обработки изображений РАН - филиала Федерального научно-исследовательского центра «Кристаллография и фотоника» РАН, Самара, e-mail: [email protected]
Алиев М.В.
Кандидат физико-математических наук, доцент, зав. кафедрой прикладной математики, информационных технологий и информационной безопасности факультета математики и компьютерных наук Адыгейского государственного университета, Майкоп, тел. (8772) 593904, e-mail: [email protected] Гиннятулин М.Н.
Студент Самарского национального исследовательского университета им. академика С.П. Королева, Самара, e-mail: [email protected]
Блочное кодирование гиперспектральных изображений с адаптивным выбором кодирующего преобразования*
(Рецензирована)
Аннотация. Описывается подход блочного кодирования гиперспектрального изображения с адаптивным выбором кодирующего преобразования. В качестве кодирующих преобразований выбраны обобщенные дискретные синус-косинусные преобразования.
Ключевые слова: сжатие гиперспектральных изображений, метод кодирования с преобразованием, трехмерное дискретное синус-косинусное преобразование, квантование.
Kasparyan M.S.
Candidate of Physics and Mathematics, Researcher of Image Processing Systems Institute - Branch of the Federal Scientific Research Centre «Crystallography and Photonics» of Russian Academy of Sciences, Samara, email: [email protected]
Aliev M.V.
Candidate of Physics and Mathematics, Associate Professor, Head of Department of Applied Mathematics, Information Technologies and Information Safety of the Mathematics and Computer Science Faculty, Adyghe State University, Maikop, ph. (8772) 593904, e-mail: [email protected] Ginnyatulin M.N.
Student of the Samara National Research University named after the Academician S.P. Korolev, Samara, e-mail: [email protected]
Block encoding hyperspectral imaging with adaptive selection of encoding transformation
Abstract. The paper describes the approach of block encoding for hyperspectral images with adaptive selection of encoding transformation. The generalized discrete sine-cosine transforms are selected as the encoding transformation.
Keywords: hyperspectral image compression, encoding method with transformation, the three-dimensional discrete sine-cosine transform, quantization.
Введение
Среди задач обработки данных особое место занимают задачи, связанные с дистанционным зондированием Земли из космоса. В последнее время наибольший интерес вызывают так называемые гиперспектральные данные (или изображения). Гиперспектральные данные - это трехмерный массив, состоящий из ряда изображений одного и того же участка земной поверхности, полученных с использованием различных спектральных фильтров.
Как правило, каждый спектральный слой в этой структуре содержит двухбайтные данные, то есть целые числа в диапазоне от 0 до 65535. Так как объем каждого гиперспектрального изображения весьма велик, то это приводит к сложностям с хранением и передачей данных об изображениях. В этой связи особенно актуальной становится задача сжатия гиперспектральных данных.
* Работа выполнена при финансовой поддержке гранта Российского фонда фундаментальных исследований № 16-31-00353 мол а.
Гиперспектральные изображения
Гиперспектральное изображение можно представить как трехмерный массив данных, который состоит из пространственной и спектральной информаций. В качестве формального представления гиперспектральной информации используем следующую формализацию. Будем считать, что / = /1 / {п1, п2, п3 )} - трехмерный массив, элементами которого являются
значения яркости в точке (п1, п2) на гиперспектарльном слое п3. При этом 0 < п <
0 < п2 < Ы2, 0 < п3 < Ы3, где Ы1, Ы2 и Ы3 — размеры гиперспектрального изображения.
Каждый гиперспектральному слою соответствует своя длина волны , / е[1, М3 ]. Каждый слой является снимком одного и того же участка местности, полученным с использованием определенного светофильтра [1].
Алгоритмы блочного кодирования изображений
Для кодирования изображений часто применяют метод кодирования с преобразованием. При применении этого метода информация разделяется на непересекающиеся блоки размером N х N. Далее данные этого блока подвергаются какому-либо преобразованию, в результате чего полностью заменяются на новые. Полученные на этом этапе данные затем используются вместо исходных.
Основная идея состоит в том, что обобщенное представление данных (полученное в результате преобразования) может быть менее коррелированным, чем изначальные данные. Благодаря этому достигается большая эффективность на этапе повторного сжатия [2, 3].
На этапе вторичного сжатия происходит сжатие выбранных коэффициентов арифметическими или статистическими алгоритмами сжатия.
На этапе декодирования (восстановления) производится процедура декодирования обобщенных координат. Далее происходит вычисление обратного преобразования, то есть по декодированным значениям обобщенных данных происходит восстановление изначальных данных.
Вышеописанная схема наглядно представлена на рисунке 1.
Рис. 1. Основные этапы сжатия изображений
Кодирующие преобразования должны удовлетворять ряду требований.
Эффективность. В результате применения преобразования основной объем информации должен быть сконцентрирован в относительно малом числе обобщенных координат. Это является решающим фактором для процедуры кодирования.
Обратимость. Преобразование должно быть обратимым, то есть позволять полностью восстановить изначальные данные.
Простота. Преобразование должно быстро вычисляться на ЭВМ.
Дискретное косинусное преобразование (ДКП) является частным случаем дискретного преобразования Фурье и удовлетворяет перечисленным выше требованиям. Благодаря тому, что в отличие от преобразования Хотеллинга (которое полностью удовлетворяет требованиям эффективности и обратимости), для него существуют быстрые алгоритмы вычисления, его используют повсеместно.
Большинство реализаций ДКП хорошо оптимизированы. Существуют реализации библиотек (для конкретных CPU) для подсчета ДКП с использованием параллельных вычислений, алгоритмов с фиксированной точкой и оптимизацией кэша. Параллельное вычисление возможно благодаря тому, что блоки, подвергающиеся преобразованию, не пересекаются, а следовательно, данные являются независимыми. Все это привело к тому, что ДКП де-факто стало стандартом для кодирования изображений и видео. В частности, в одном из наиболее популярных алгоритмов сжатия изображений JPEG используется именно ДКП.
Дискретные ортогональные преобразования
В обзорной статье С. С. Агаяна [4] обоснована необходимость рассмотрения дискретных тригонометрических ортогональных преобразований с базисными функциями вида:
hm (n ) = A (m )cos a0 (m + a1 )(n + a2 )) + B (m )sin a0 (m + a1 )(n + a2 )), (1)
где a0, a1, a2 - рациональные числа;
A (m), B (m) - коэффициенты преобразования.
В той же статье приводятся примеры коэффициентов, при которых (1) совпадает с известными унитарными преобразованиями:
1. Дискретное преобразование Фурье при (a0,a,a2 ) = (2,0, 0 ) и (A (m ), B (m)) =
2. Дискретное преобразование Хартли
пРи (a,ai,a2) = (2,0, 0) и (A(m) B(m)) = )jN'TN
3. Дискретное косинусное преобразование при (a0,a,a2 ) = (0,1,0.5) и (A (m ), B ( m )) = (A( m ) ,0 ),
где A,(m ) =
, если m = 0,
4N
[2 n
. — , если m Ф 0. VN
Стоит отметить, что классы, которые прокрывают преобразование с базисными функциями вида (1), не исчерпываются лишь описанными выше.
В работе [3] была сформулирована и доказана теорема, в которой коэффициенты в базисных функциях (1) согласуются таким образом, что преобразование на основе этих базисных функций ортогонально.
Теорема 1 (об ортогональности обобщенного синус-косинусного преобразования). Пусть
Ир (п) = А ехр ^а(р + Ь)(п + с)) + А ехр а(р + Ь)(п + с)),
НОД (#,а) = 1 и Ь е Я, тогда система функций [Ир (п^Г^ ортогональна, если коэффициенты имеют вид:
, у + 2g 1 N А2 ( Л „ „ , „
Ь = —--, с =---, при--- = ехр(утл), g, г е 2, 2аЬ £ 2,
4 (а-г) 2 2а А2 у '
с = ^, Ь = -^т, при = -1, 5, г е 2, 2аЬ е 2, 21 2к А2
с =
у + 2t 4a
A2 1
при — = exp(уж1), b = —, t g 2.
Блочное кодирование гиперспектрального изображения
Как уже было описано выше, гиперспектральное изображение можно представить в виде трехмерного куба, в то время как обычное изображение представляется плоским прямоугольником. Поэтому гиперспектральное изображение при кодировании будем разбивать не на квадраты, а на кубы. В данной работе рассматривалось два вида кубов, размеры которых 8 х 8 х 8 пикселей и 16 х16 х16 пикселей.
По пространственным координатам каждого блока бралось косинусное преобразование, а по гиперспектральному - обобщенное синус-косинусное преобразование. Таким образом, преобразование будет иметь вид
N-1N-1N-1
F ( qr )=ZZZ/ (j, k )cos p ( ) cosq ( ( ) hr (k ),
i=0 j=0 k=0
где cos (i), cosq ( j) - базисные функции ДКП;
hr (k) - базисная функция обобщенного синус-косинусного преобразования.
После перехода в частотную область блоки квантуются и, по аналогии с алгоритмом JPEG, сжимаются алгоритмом Хаффмана. Выбор базисных функций hr (k) напрямую влияет на степень сжатия.
Адаптивный выбор преобразований
Из теоремы 1 видно, что систем ортогональных функций для обобщенного синус-косинусного преобразования бесконечно много. Поэтому в работе были выбраны не абсолютно наилучшие преобразования, а преобразования, которые показали результат лучше, чем, если бы была выбрана система базисных функций ДКП по гиперспектральной координате.
В данной статье приводятся те базисные функции, которые показали лучший результат:
1. hn (n) = J— sin
P W 4ÎN
где НОД ( N ,9) = 1;
V2 (
2. hp (n) = ^= cos
p w VN
3. hn (n) = -^^sin
p w vN
18т|
N 1
1
1
Л
P + 2 Jl П 108
У3 42N
f
cos
18т|
N 1
1
1
Л
P + 2 Jl П 108
2т I
N.
18т i
N I
P + -
n + -
p+Й Jln - 9 j
, где НОД ( N ,9) = 1.
Эксперименты проводились на наборе гиперспектральных изображений [5], сделанных сканером «АутБ».
В данной статье в качестве критерия качества принято пиковое отношение сигнала к шуму, как и в работе [6]. При высоких коэффициентах сжатия рассмотренный в работе метод кодирования с трехмерным дискретным синус-косинусным преобразованием (ДСКП) обеспечивает более высокое качество восстановления, чем кодирование с трехмерным дискретным косинусным преобразованием (ДКП). На рисунке 2 приведено сравнение этих двух подходов.
Рис. 2. Качество восстановления различных алгоритмов сжатия
Следует отметить, что выбор кодирующих преобразований является индивидуальным для каждого аппарата, производящего гиперспектральную съемку земной поверхности.
Примечания:
1. Методы компьютерной обработки изображений / М.В. Гашников, Н.И. Глумов, Н.Ю. Ильясова, В.В. Мясников, С.Б. Попов, В.В. Сергеев, В.А. Сойфер, А.Г. Храмов, А.В. Чернов, В.М. Чернов, М.А. Чичева, В.А. Фурсов; под ред. В.А. Сойфера. 2-е изд., испр. М.: Физматлит, 2003. 784 с.
2. Ахмед Н., Рао К.Р. Ортогональные преобразования при обработке цифровых сигналов. М.: Связь, 1980. 248 с.
3. Каспарьян М.С. Обобщенные дискретные ортогональные синус-косинусные преобразования // Компьютерная оптика. 2014. Т. 38, № 4. C. 881885.
4. Распознавание, классификация, прогноз. Математические методы и их применение / С.С. Агаян, В.М. Антоненко, В.И. Васильев, А.В. Гончарский, Н.Г. Гуторова [и др.]; под ред. Ю.И. Журавлева. М.: Наука, 1992. Вып. 3. 320 с.
5. Hyperspectral Image Compression [Electronic resource] // NASA Information Processing Group. URL: http://compression.jpl.nasa.gov/hyperspectral/
6. Чичева М.А., Юзькив Р.Р. Сжатие гиперспектральных данных на основе кодирования с преобразованием // Компьютерная оптика. 2014. Т. 38, № 4. C. 799-803.
References:
1. Computer Image Processing: Methods and algorithms / A.V. Chernov, V.M. Chernov, M.A. Chicheva, V.A. Fursov, M.V. Gashnikov, N.I. Glumov, N.Yu. Ilyasova, A.G. Khramov, A.O. Korepanov, A.V. Kupriyanov, E.V. Myasnikov, V.V. Myasnikov, S.B. Popov, V.V. Sergeev; ed. by V.A. Soifer. VDM Verlag, 2009. 784 pp.
2. Akhmed N., Rao K.R. Orthogonal Transforms for Digital Signal Processing. M.: Svyaz, 1980. 248 pp.
3. Kasparyan M.S. Generalized discrete orthogonal sine-cosine transform // Computer Optics. 2014. Vol. 38, No. 4. P. 881-885.
4. Pattern recognition, classification, forecasting. Mathematical methods and their application / S.S. Agayan, V.M. Antonenko, V.I. Vasilyev, A.V. Goncharsky, N.G. Gutorova [et al.]; ed. by Yu.I. Zhuravlev. М.: Nauka, 1992. Iss. 3. 320 pp.
5. Hyperspectral Image Compression [Electronic resource] // NASA Information Processing Group. URL: http://compression.jpl.nasa.gov/hyperspectral/
6. Chicheva M.A., Yuzkiv R.R. Hyperspectral data compression based on transform coding method // Computer Optics. 2014. Vol. 38, No. 4. P. 799-803.