УДК 004.032.26
СТЕГАНОГРАФИЧЕСКИЕ МЕТОДЫ СОКРЫТИЯ ДАННЫХ В ЗВУКОВЫХ ФАЙЛАХ НА ОСНОВЕ ВСПЛЕСКОВЫХ ПРЕОБРАЗОВАНИЙ
© 2014, Л. С. Крыжевич1, Д. А. Белобородов2
1канд. техн. наук, ст. преподаватель каф. математического анализа
и прикладной математики e-mail: [email protected]
2аспирант каф. математического анализа и прикладной математики e-mail: [email protected]
Курский государственный университет
В статье описаны теоретические основы различных преобразований сигналов, положенные на всплесковых преобразованиях; предложена схема реализации сокрытия данных на основе всплесковых преобразований.
Ключевые слова: стеганография, всплесковое преобразование, базис Хаара, всплеск Wave, система сокрытия данных, качество данных.
Введение
Важность сокрытия данных растёт с каждым годом. Именно поэтому учёные постоянно исследуют всё новые и новые способы утаивания информации, находя и подбирая более или менее интересные и оптимальные решения. Одними из таких вариантов шифрования являются методы сокрытия данных в звуковых файлах на основе различных преобразований сигналов. Среди многих известных преобразований наиболее популярным является преобразование Фурье (ПФ) (его подробное
рассмотрение не будет затрагиваться здесь и далее по тексту в силу того, что тема ПФ весьма обширна и не является целью данной работы), но наиболее интересным -wavelet-преобразование, или всплесковое преобразование (ВП).
Именно ВП является эффективным решением, когда нам требуется временная локализация спектральных компонент. Конечно, существуют и другие методы преобразования сигналов, также выполняющие эту задачу (например, оконное ПФ, преобразование Вигнера и др.). Однако для анализа нестационарных сигналов предпочтительнее применять ВП.
Также с теорией и практическими применениями различных всплесков можно ознакомиться в работах [Чуи 2001; Яковлев 2003], а работы [Fekri et al. 2002, 1999; Oliveira et al. 2002; Phoong, Vaidyanathan 1997] достаточно подробно освещают современное состояние теории всплесков.
Теоретические основы преобразований
Математические преобразования применяются к сигналу для того, чтобы получить о нем какую-то дополнительную информацию, недоступную в исходном виде. В дальнейшем изложении сигнал во временной области будет называться «исходным», а преобразованный сигнал - трансформантой.
Большинство сигналов, встречающихся на практике, представлены во временной области, то есть сигнал есть функция времени. Таким образом, при отображении сигнала на графике одной из координат (независимой) является ось времени, а другой (зависимой) - ось амплитуд. Таким образом мы получаем амплитудно-временное представление сигнала. Для большинства приложений
ТЕХНИЧЕСКИЕ НАУКИ
обработки сигнала это представление не является наилучшим. Во многих случаях наиболее значимая информация скрыта в частотной области сигнала. Частотный спектр есть совокупность частотных (спектральных) компонент, он отображает наличие тех или иных частот в сигнале.
Как было сказано выше, кроме ПФ существует и много других часто применяемых преобразований сигнала. Примерами являются преобразование Гильберта, оконное ПФ, распределение Вигнера, преобразование Уолша, само всплесковое преобразование (ВП) и многие другие. Для каждого преобразования можно указать наиболее подходящую область применения, достоинства и недостатки, и ВП не является в этом смысле исключением.
В работе [Polikar 2007] описывается, что ВП иллюстрирует больший функционал, нежели ПФ. Всплесковое преобразование было разработано как альтернатива оконному преобразованию Фурье (ОПФ) для преодоления некоторых проблем, связанных с плохим разрешением. Говоря о ВП, будем иметь в виду следующее: пропустим сигнал через два фильтра - низкочастотный и высокочастотный (фильтры соединены параллельно):
gj (k) = Js(x) • ,k(x)dx; hj(k) = Js(x) },k(x)dx. (1)
Qj Qj
Впоследствии процедура обработки низкочастотного фильтра применяется ещё раз, при этом выход высокочастотного фильтра остаётся неизменным. Этот процесс можно представить в виде двоичного дерева, где листья и узлы соответствуют пространствам с различной частотно-временной локализацией, то есть представляют
Рис. 2. Процедура обработки сигнала
В конечном счете мы получаем множество субполосных сигналов, которое представляет наш исходный сигнал. Каждый субполосный сигнал соответствует какой-
Auditorium: электронный научный журнал Курского государственного университета. 2014. № 2
Крыжевич Л. С., Белобородов Д. А. Стеганографические методы сокрытия данных в звуковых файлах на основе всплесковых преобразований
то субполосе частот. Однако теперь и разрешение по частоте меняется от уровня к уровню. На низких частотах лучше разрешение по частоте, чем на высоких частотах. Отметим также увеличение расстояния между частотными точками с увеличением частоты. Можно построить график поверхности, отложив по одной оси время, по второй - частоту и по третьей - амплитуду. Мы можем увидеть, какие частоты присутствуют в каждый интервал времени, однако «принцип неопределённости Г ейзенберга» гласит, что нельзя одновременно измерить частоту и время с произвольно высокой точностью. Поэтому можно лишь говорить об интервале времени и о наблюдающейся в нем частотной полосе. Чем короче интервал времени, тем большую неопределенность имеет высокочастотный компонент, что обусловливает хранение в нем скрываемой информации.
Рис. 3. Частотно-временное разрешение сигнала
Одним из наиболее известных всплесковых преобразований является базис Хаара (см.: [Копенков 2008]). Всплески Хаара имеют следующий вид:
$ 1 1 n ; 2 -1;0 < x <-,
I i i i
2 1-0.5 0 0; x £ [0,1) j 0.5 ^
Рис. 4. Иллюстрация всплеска Хаара
Рекомендуется использовать симметричные нечетные всплески. Самым ярким
примером является всплеск Wave (первая производная функции Гаусса): yw = - x • e
Отметим, что всплеск должен обладать минимум двумя свойствами:
2
2
— го
2.
+ ГО
j\ft>(x x^dx
— ГО
= 1.
ТЕХНИЧЕСКИЕ НАУКИ
Структурно-функциональная организация системы скрытия информации во всплесковых коэффициентах
Примерную схему реализации алгоритма можно изобразить на следующей блок-схеме:
Начало
Z
Ввод исходного аудиофайла
7
^---------------7
f Ввод скрываемого /
/ файла /
Всплесковое разложение сигнала L
Преобразование битового потока B
Внедрение всплескового коэффициента на г-м уровне
Нет
Инкрементация г
Ж"
Инкрементация k
ajjnb] = В[/] ^
Инкрементация j
Восстановление сигнала
Ж.
Сохранение/воспроизведение аудиофайла
Выход
Auditorium: электронный научный журнал Курского государственного университета. 2014. № 2
Крыжевич Л. С., Белобородов Д. А. Стеганографические методы сокрытия данных в звуковых файлах на основе всплесковых преобразований
Описание блок-схемы
На вход алгоритма подаются 2 файла: аудиофайл (АФ) и файл со скрываемой информацией (СФ). На следующем этапе происходит параллельная обработка загруженных файлов: АФ раскладывается на n уровней всплескового разложения и выделяются наиболее значимые всплесковые коэффициенты, а одновременно с этим СФ преобразуется в битовый поток, который обозначим B. Далее. Во всплесковые коэффициенты на i-м уровне разложения АФ внедряется последовательно j-й набор бит Bj] из СФ. Внедрение проводится последовательно во все наиболее значимые всплесковые коэффициенты (||а[|| > ui) до тех пор, пока не будет исчерпана все цепочка скрываемых бит СФ.
Будем определять длину цепочки для возможности внедрения информации по формуле
l = t ■ f ,
где l - количество отсчётов в файле, f - значение дискретизации, 44 или 48 кГц соответственно, t - время аудиофайла в секундах.
Как описано ранее [Кпыжевич 2011], наименее информативной является высокочастотная часть (ВЧ) спектра, а наиболее информативной - низкочастотная (НЧ).
Этот факт обусловливает то, что с каждым следующим уровнем количество внедряемой информации уменьшается.
Проведённые эксперименты показали, что рациональным шагом является внедрять в ВЧ 2 бита, а в НЧ - 1-2 бита информации.
Наиболее выгодным является нормированный коэффициент при высоких частотах ||аг || > ui, потому в ходе цифровой обработки сигналов (ЦОС) и сжатия
информации они не подвержены преобразованиям и действию шумов.
Качество сигнала изменяется по формуле
p = 20lg& Smax - Smin # , (2)
где о - среднеквадратичное отклонение, Smax и Smin - максимальное и минимальное значение амплитуды.
В одномерном случае качество будет задаваться формулой
& #
Р = 20 lg
2 nbit i
12(x)- S(x l x=0
(3)
Здесь nbit - разрядность звукового потока (16 или 8 бит),
/ - длина дорожки звука (количество контрольных точек),
Six)
Six)
исходная аудиодорожка,
- аудиодорожка с внедрённой информацией.
Из работы [Morton, Zvorykin 1940] известно, что качество сигнала p должно быть больше 30 дБ. Вычислим из формулы (3) максимальный объём внедряемой информации в одну контрольную точку без искажения качества:
ТЕХНИЧЕСКИЕ НАУКИ
/
#
Р = 20 lg
2 nbit i
Ij Ё (S (x)- x ))2
> 30,
(4)
обозначим объём внедряемой информации за V (будем считать, что объём внедряемых бит постоянен). Тогда S(х) - S(х) = AS = 2V .
Следовательно, неравенство (4) можно записать в виде
& 2nbit i #
20lg
%
Таким образом,
ry nbit i
0 < |M| < >
и
^nbit
> 30.
\nbit-5
Vl000 Vl024 '
В результате неравенства (4) сильным условием будет |ДА| < 2nit-5
Так как |AS| = 2V, следовательно, V < nbit - 5 .
(5)
В итоге получаем, если на каждую конкретную точку отводится по 8 bit, то внедрять можно не более 2 bit, аналогично, если 16 bit, - не более 10 bit.
После внедрения информации в тестовый аудиофайл получаем показатель качества p=84,3 дБ. Так как полученное число больше 30 дБ, то это говорит о том, что внедрение информации в аудиосигнал незаметно для восприятия.
Заключение
Всплесковые преобразования - ещё молодая и малоизученная область математики, но даже сейчас уже можно видеть её развитие в недалёком будущем.
Разработанный же алгоритм сокрытия данных наверняка сможет найти своё место в сфере невоенной криптографии.
Библиографический список
Копенков В.Н. Эффективные алгоритмы локального дискретного вейвлетпреобразования с базисом Хаара // Компьютерная оптика. 2008. Вып. 32. №1. С. 78-85.
Крыжевич Л.С. Всплесковое преобразование при анализе ЭКГ для выявления болезней сердца // Актуальные проблемы и перспективы преподавания математики: сб. науч. ст. II Междунар. науч.-практ. конф., 9-10 ноября 2011 г.; Юго-Зап. гос. ун-т. Курск, 2011. С. 97-105.
Чуи Ч. Введение в вейвлеты. М., Мир, 2001. 412 с.
Яковлев А.Н. Введение в вейвлет-преобразования: учеб. пособие. Новосибирск: Изд-во НГТУ, 2003. 104 с.
Fekri F., Mersereau R.M., Schafer R.W. Theory of paraunitary filter banks over fields of characteristic two // IEEE Transactions on Information Theory. 2002. V. 48. P. 2964-2979.
Fekri F., Mersereau R.M., Schafer R.W. Theory of wavelet transform over finite fields // Proceedings of the Acoustics, Speech, and Signal Processing (ICASSP). 1999. V. 03. P.1213-1216,
Morton G.A., Zworykin V.K. Television: The Electronics of Image Transmission // New York, 1940. 646 p.
Oliveira de H.M., Falk T.H., Tavora R. Wavelet decomposition over finite fields // Journal of the Brazilian Telecom. Society. 2002. V. 17, N 1. P. 38-47. [Portuguese]
Auditorium: электронный научный журнал Курского государственного университета. 2014. № 2
Крыжевич Л. С., Белобородов Д. А. Стеганографические методы сокрытия данных в звуковых файлах на основе всплесковых преобразований
Phoong See-May, Vaidyanathan P.P. Paraunitary filter banks over finite fields // IEEE Transactions on Signal Processing. 1997. V. 45. P. 1443-1457.
Polikar R., Iowa State University. Введение в вейвлет-преобразование / пер. В.Г. Грибунин, АВТЭКС Санкт-Петербург. СПб., 2007.