УДК 621.327:681.5
МЕТОД ОБРАБОТКИ ДИНАМИЧЕСКОЙ СОСТАВЛЯЮЩЕЙ НА ОСНОВЕ ПОЗИЦИОННОГО КОДИРОВАНИЯ С АДАПТИВНЫМ ВЫБОРОМ ОСНОВАНИЯ
ЛЕКАХ А.А._________________________________
Излагается метод сжатия массивов динамической составляющей на основе одномерного позиционного кодирования с адаптивным выбором основания. Предлагается разбивку динамической составляющей на массивы осуществлять с учетом наличия информации о количестве элементов динамической составляющей. Обосновывается, что за счет позиционного кодирования объем динамической составляющей снизится на 38%. В результате предложенного кодирования массивы динамической составляющей заменяются последовательностью кодовых значений позиционных чисел с адаптивным основанием.
1. Введение
Для повышения производительности систем передачи информации необходимо применять методы обработки (кодирования) изображений, позволяющие уменьшать объем данных, но при этом сохранять информационное содержание. Решение этой задачи неразрывно связано с разработкой и применением новых методов и средств компактного представления данных, позволяющих не только сократить их объем, но и минимизировать время передачи информации по каналам связи и формирование ее графической модели в устройствах отображения в реальном масштабе времени.
Отсюда, цель исследований заключается в разработке метода сжатия массивов динамической составляющей на основе одномерного позиционного кодирования с адаптивным выбором основания.
2. Разработка метода сжатия массивов динамической составляющей
Позиционному кодированию с адаптивным выбором основания подвергаются не отдельные элементы, а их совокупности (строки). Поэтому перед началом позиционного кодирования с адаптивным выбором основания требуется из отдельных элементов сформировать массивы. Динамическая составляющая Ідин разбивается на массивы.
На время формирования массивов D влияет порядок обхода динамической составляющей. С технической точки зрения наименьшее время отображения информации на экране достигается при построчном порядке обхода динамической составляющей. Это объясняется тем, что в процессе отображения изображения оно выводится на экран по строкам (строчная развертка). Тогда при восстановлении изображения оно будет выводиться на экран по мере восстановления элемен-
тов, принадлежащих динамической составляющей. В этом случае она разбивается на блоки равных размеров.
Поэтому порядок обхода динамической составляющей предлагается организовывать по строкам в направлении слева направо. Для каждой последующей динамической составляющей Ідин процесс разбиения ее на массивы начинается сначала.
Количество элементов в динамической составляющей v дин нам известно и оно определяется как количество единичных элементов в стационарной составляющей Іст. Поэтому предлагается разбивку динамической составляющей на массивы осуществлять с учетом наличия информации о количестве ее элементов. Отсюда размер массива предлагается выбирать с учетом:
1) максимального заполнения массивов элементами динамической составляющей, т. е. в последнем массиве, сформированном для нее должно быть как можно меньше незаполненных строк;
2) того, что позиционное число и код формируются для строки массива. В этом случае необходимо обеспечить отсутствие ситуаций, приводящих к переполнению максимально допустимой длины кодового слова;
3) того, что количество потенциальной сокращаемой избыточности увеличится с ростом размера позиционного числа. Это обусловлено тем, что для большей длины блока можно выявить больше закономерностей, используемых в процессе сокращения избыточности.
В связи с этим предлагается следующая процедура определения размеров массивов, на которые разбивается динамическая составляющая:
1. Если длина допустимого кодового слова ограничена 64 битами, то в соответствии со свойствами позиционного кодирования длина строки массива динамической составляющей не должна превышать 8. С другой стороны, в соответствии с третьим требованием относительно выбора размера массива динамической составляющей длина строки не должна быть меньше 4. Поэтому на первом этапе предлагается выбирать длину строки массивов динамической составляющей равную 6, т.е.:
(nдин _ если пдин < Vдин , (1)
где v дин - количество элементов в динамической составляющей.
Тогда суммарное количество строк динамической составляющей т(^)дин при учете знания величины
определяется по формуле:
т(Х
дин
V д
[-Д^] +1, если vдИН -[-^]тдин * 0;
дин
v
дин
если v
дин п дин
- [ ]m дин = 0,(2)
дин
n
дин
V
дин
n
дин
РИ, 2013, № 2
57
где
дин
дин
количество строк динамическом состав-
ляющей, на основе которых формируются полные
массивы; vдин - [ дин ]mдин - остаточное количество
дин
строк динамической составляющей, на основе которого нельзя сформировать полный массив.
2. Суммарное количество строк разбивается на отдельные массивы. Здесь необходимо учитывать, что количество строк в массивах должно быть одинаковым. С другой стороны, на выбор количества строк в массиве влияет условие сохранения однородности свойств в локальной области по динамическим диапазонам. Это позволит выбирать адаптивное основание позиционного числа, наиболее адекватно описывающее свойство локальной области. В связи с этим предлагается количество строк в массиве выбирать
равным nдин = 6 . Тогда количество v('hk) массивов,
на которые разбивается вся динамическая составляющая, определяется по формуле:
Лдин)
ум
m(X
[-
дин
m
дин
(3)
При этом, чтобы сократить количество оснований позиционных чисел, выбираемых для каждого массива в отдельности, предлагается следующая процедура:
m(X)
[т(Х)дин ]
!- [--^]тЛ
< 3 = т^2н
m
дин
2
(4)
тогда последний полный массив заполняется оставшимися строками из неполного массива.
В противном случае, когда:
т(Х)
- [тщ=н ]т д
тд
> 4 = , (5)
то формируется неполный массив.
В общем виде схема позиционного кодирования массивов динамической составляющей с адаптивным выбором основания показана на рис.1.
Таблица О составляется из всех возможных массивов данных (в общем виде), распределенных в зависимости от значения основания, где U +1 - количество различных массивов динамической составляющей заданного размера, а u - индекс подмножества массивов динамической составляющей, удовлетворяющих значению основания ^u . Массивы динамической составляющей образуются из исходного изображения на основе функционалов фдин . Затем для полученных массивов находится основание ^u . Найденное основание служит входным параметром для считывания из таблицы О множеств Оu соответственно возможных массивов динамической составляющей. В пределах выбранных множеств О u стол-
58
бцы массивов динамической составляющей нумеруются по порядку соответственно от 0 до | Ou |. Поэтому путем сопоставления конкретных массивов динамической составляющей столбцам множеств Ou определяются соответствующие коды для позиционных чисел N(u)i.
В общем случае полный массив Du динамической составляющей имеет вид
dl,l d1,2 . .. d1,j ••• dl,n дИН
Du = di,l di,2 ... di,j ••• di,n дин
dm дин Д dm дин ,2 dmдин ,j ••• d
, (6)
где - (i; j) -й элемент массива динамической составляющей; тдин, nдин - соответственно количество строк и столбцов в массивах Du .
Необходимо заметить, что массив Du может быть заполненный не полностью.
Формирование строки массива динамической составляющей проводится с учетом сдвига на количество элементов, равное длине строки массива пдин .
На процесс разбиения динамической составляющей на массивы Du влияет максимальное значение йтах элемента Ідин и количество пдин столбцов. Это обусловлено тем, что код формируется не для отдельного элемента динамической составляющей, а для строки ее массива. Поэтому на значение кода позиционного числа N(u)i и на длину его кодограммы Li влияет адаптивное основание, которое выбирается в соответствии с йтах и количеством элементов в позиционном числе, что определяется пдин . При этом мы можем управлять только величиной пдин . Величина йтах вычисляется отдельно для каждой динамической составляющей. В связи с этим перед выбором пдин предлагается рассмотреть особенности позиционного кодирования с адаптивным выбором основания.
Первая особенность заключается в ограничении, накладываемом на длину кодограммы Li , которое отводится под позиционное число N(u)i . Выполнение этого ограничения необходимо для исключения потерь информации из-за нехватки разрядов для представления значения кода N(u)i. Для этого величина максимально возможного числа, которое может храниться в кодограмме Li разрядов, не должна превышать величины динамического диапазона d(N) значений кодов позиционных чисел, т.е.:
2Li > D(N), (7)
РИ, 2013, № 2
где 2Li - максимально возможное число, которое может храниться в кодограмме длиной L; бит.
Динамический диапазон D(N) определяется как максимально возможное значение кода позиционных чисел N(u)i для заданного значения основания Xu .
Рассмотрим пример вычисления кодов для позиционных чисел строк массива динамической составляющей.
Пример. Вычислим значения N(u)i для кодов позиционных чисел массивов Du :
Вторая особенность вызвана тем, что значения кодов N(u)i формируются для позиционных чисел равномерной длины nдин . Это обусловлено тем, что позиционное число формируется на базе элементов отдельных строк массивов динамической составляющей. Поэтому коды N(u)i будут принимать различные значения для разных строк. Отсюда для сокращения кодовой избыточности предлагается длину кодограммы L; выбирать неравномерной, т.е.:
L; = VAR . (8)
Для предложенной организации массивов Du схема вычисления позиционных чисел для строк Du,i = {di,1; di,2; "">di,j> ”di,n№H } этих массивов с учетом адаптивного выбора основания Xu задается выражениями:
D
u
10 23 30 20 18 9 . 4 10 15
Вначале определим позиционные числа для строк массива Du,i динамической составляющей. Для этого найдем основание Xu и вычислим по формуле (10) их накопленные произведения Pj . Величина основания Xu-31. Тогда весовой коэффициент P1 = 312 = 961; P2 = 311 = 31; P3 = 310 = 1. На основе этих значений по формуле (9) вычислим N(u)i для кодов позиционных чисел Du,i:
N(u)1 = 10х961 + 20х 31 + 4х 1 =10234 ;-L1~14 бит;
N(u)2 = 23х961 +18х31 +10х1=22671;-L2 =15 бит;
n дин N(u)i = £ di,jPj j=1 ; (9)
P = X(n дин - j) . rj - Au (10)
X u = max{di,j }+1 ^j<nдин 1<i<m дин (11)
где N(u)i - значение кода для i-го позиционного числа, полученного для i-й строки u-го массива динамической составляющей; Pj - весовой коэффициент j-го элемента позиционного числа; Xu - основание u-
го массива динамической составляющей.
N(u)3 = 30х961 + 9х31 +15х1=29124^L3~15 бит.
Максимально количество разрядов, затрачиваемое на представление позиционных чисел динамической составляющей, равно 15 разрядам. При этом на кодовое представление исходного фрагмента изображения (фрагмент изображения классифицируется как сильнонасыщенный деталями, имеющий различные динамические составляющие) понадобится 24 разряда. Следовательно, за счет позиционного кодирования объем динамической составляющей снизится на 38%.
Позиционные коды позволят компактно представить массивы динамической составляющей, если соответствующие максимальные значения Xu имеют ограничения, т.е. Xu <dmax, u=1, v№ . Здесь dmax - макси-
Рис. 1. Схема получения кодов - номеров для частей фрагмента изображения
N
(u)1
ч.
N
(u)l
ч.
N
(u)m „
Г
m д
РИ, 2013, № 2
59
мальное числовое значение динамической составляющей.
Таким образом, в результате предложенного кодирования массивы динамической составляющей заменяются последовательностью кодовых значений позиционных чисел с адаптивным основанием
(N(u)1,...N(u)i,...N(u)mpB}.
Рассмотрим интерпретацию предложенного кодирования.
Каждой строке массива динамической составляющей, рассматриваемой как позиционное число, соответствует один код N(u)i неравномерной длины. Тогда можно сказать, что за счет позиционного кодирования с адаптивным основанием равномерные части динамической составляющей заменяются кодограммами неравномерной длины. Поэтому всю цепь последовательных преобразований можно рассматривать как равномерное векторное квантование с последующим неравномерным распределением количества двоичных разрядов (см.рис. 1).
Обозначим данное преобразование следующим образом:
N(u)i = f рвк (Du,i; ^ u}; (12)
Li = f нрр {Nu,i; § u} = f нрр (ґрвк (Du,i; M; §u} (13)
где fрвк - функционал, задающий равное векторное квантование динамической составляющей; ґнрр -функционал, описывающий процесс распределения количества двоичных разрядов под каждый код позиционного числа.
Поскольку, с одной стороны, количество элементов в позиционном числе является равномерным, а с другой - значения их элементов имеют неравномерное распределение на натуральной оси, то код N(u)i будет неравномерным, т.е.:
N(u)i = VAR. (15)
В этом случае, если под каждый код формировать кодограмму заранее заданной равномерной длины Lc, будет образовываться кодовая избыточность Rc . Это обусловлено появлением незначимых старших разрядов кодограммы, как показано на рис.2.
—^
N(u)і
Lc
Рис. 2. Схема формирования кодовой избыточности
Кодовая избыточность определяется следующей формулой:
Rc = Lc - Li, (15)
где Li - количество разрядов на представление значения кода позиционного числа, формируемое адаптив-
но для каждой строки массива динамической составляющей Du ; Ьс - заранее выбранная равномерная длина кодограммы, не учитывающая структурные особенности массивов динамической составляющей Du .
В связи с этим, для сокращения кодовой избыточности предлагается формировать длину кодограммы, учитывая структурные особенности каждой строки Du,i массива динамической составляющей. При этом необходимо учитывать, что длина кодограммы будет неравномерной, т. е. для каждой строки массива динамической составляющей в общем случае может выполняться неравенство:
L1 ф ...Li ф ••Ьшдин . (16)
Для таких условий существуют две базовые стратегии позиционирования кодограмм сжатого представления.
Первая стратегия заключается в использовании маркерных разделителей между кодограммами. Маркерные разделители представляют собой кодовую посылку, содержание которой не может повторяться ни в одной кодограмме. С одной стороны, это позволяет обеспечить разделение кодограмм на приемной стороне, но с другой - приводит к увеличению объема сжатого представления.
Для устранения данного недостатка предлагается использовать вторую стратегию. Суть ее заключается в том, что количество разрядов под кодограмму выбирается с учетом особенностей динамических диапазонов обрабатываемых строк динамической составляющей. При этом для сокращения служебных данных предлагается использовать только ту служебную информацию, которая применялась в процессе формирования кода N(u)i .
В случае формирования кода для позиционного числа предлагается учитывать следующие их свойства.
Максимальное значение кода N(u)max позиционного числа для заданного основания ^u определяется накопленным произведением оснований его элементов, т.е.:
N(u)max =^ПдиИ - 1. (17)
Отсюда значение кода N(u)i для позиционных чисел с адаптивным основанием ^u будет ограничено следующей величиной:
N(u)i <^nдин -1. (18)
Количество двоичных разрядов Li на представление кода N(u)i по адаптивному основанию ^u будет иметь следующую верхнюю границу:
Li = [log2 N(u)i ] +1 < [log2 ^дин - 1] +1. (19)
Как следует из выражения (19), правая часть неравенства зависит от величины адаптивного основания
^u и длины строки nдин массива динамической
60
РИ, 2013, № 2
составляющей. Величина Xu используется в процессе кодирования, т.е. не является дополнительной служебной информацией, поэтому для позиционирования кодограмм позиционных чисел предполагается осуществлять распределение количества разрядов под каждую кодограмму в соответствии с неравенством (19). В этом случае длина кодограммы L; будет равна:
Li = [log2 ХПдин -1] +1, (20)
тогда 5 = Xu .
В соответствии с предложенной стратегией количество разрядов под каждую кодограмму в пределах одного массива динамической составляющей будет постоянным. Но для разных массивов динамической составляющей затраты количества разрядов под каждую кодограмму будут неравномерными. Это объясняется различиями значений оснований Xu . Поэтому предлагается принцип распределения количества разрядов под кодограмму называть локально-равномерным.
3. Выводы
1. Предложены требования относительно разбивки динамической составляющей на массивы, учитывающие, с одной стороны, необходимость дополнительного сокращения избыточности, с другой - исключение случаев переполнения кодового слова.
2. Разработан метод сжатия массивов динамической составляющей на основе одномерного позиционного кодирования с адаптивным выбором основания.
УДК004.93
МЕТОД СИНТЕЗА БАЗ ЧИСЛЕННЫХ АССОЦИАТИВНЫХ ПРАВИЛ
ОЛЕЙНИК А.А., ЗАЙКО Т.А., СУББОТИН С.А.
Решается задача построения баз численных ассоциативных правил. Разрабатывается метод синтеза баз ассоциативных правил, в котором выполняется фаззификация транзакционной базы данных, вычисляются пороговые значения поддержки, используются критерии для оценивания косвенных ассоциаций, что понижает степень участия пользователя в процессе поиска ассоциативных правил, а также позволяет извлекать не только часто встречающиеся наборы, но и редко возникающие интересные ассоциативные правила.
Введение
В настоящее время для поиска закономерностей между связанными событиями широко распространены ассоциативные правила [1].
Как правило, исследуемые объекты или процессы описываются численными признаками, поэтому для извлечения ассоциативных правил и построения на их основе баз правил необходимо численные атрибуты предварительно преобразовывать к формату, доступ-
При этом код позиционного числа формируется для отдельных строк массива динамической составляющей, а длина кодового слова выбирается неравномерной.
3. Длины кодовых слов позиционируются относительно друг друга в соответствии с известным значением длины позиционного числа и адаптивного основания.
Литература: 1. Аудиовизуальные системы связи и вещания: новые технологии третьего тысячелетия, задачи и проблемы внедрения в Украине / [О.В. Гофайзен, А.И. Ляхов, Н.К. Михалов и др.] // Праці УНДІРТ. 2000. № 3. С. 3-40. 2. Олифер В.Г. Компьютерные сети. Принципы, технологии, протоколы: Учебник для вузов / В. Г. Олифер, Н.А. Олифер. СПб.: Питер, 2006. 958 с.
3. Barannik V. Optimization of the Data Width to the Booked Quality of the Dobeshies-Wavelet Transform / V. Barannik., I. Hahanova // International Symposium [IIEEE East-West Design & Test!], (Yerevan, Armenia, September 7 - 10, 2007) / Yerevan: 2007. P. 154 - 157.4. Баранник В.В. Кодирование трансформированных изображений в ин-фокоммуникационных системах / В.В. Баранник, В.П. Поляков. Х.: ХУПС, 2010. 212 с.
Поступила в редколлегию 05.05.2013
Рецензент: д-р техн.наук, проф. Баранник В.В.
Леках Альберт Анатольевич, научный сотрудник научного центра Харьковского университета Воздушных Сил им. Ивана Кожедуба. Научные интересы: системы, технологии преобразования, кодирования, защиты и передачи информации. Адрес: Украина, 61023, Харьков, ул. Сумская, 77/79, тел. 8 067-2593011.
ному для применения известных методов поиска ассоциативных правил [1-3]. При этом требуется выполнять разбиение численных признаков на непересекающиеся интервалы, каждый из которых рассматривается затем как новый атрибут.
Однако в таких случаях возникают проблемы выбора количества интервалов и существенного возрастания размерности решаемой задачи, что повышает требования к вычислительным ресурсам ЭВМ. Кроме того, в некоторых случаях кроме часто встречающихся наборов важными для извлечения новых знаний об исследуемых объектах или процессах являются нечастые наборы элементов, позволяющие выявлять косвенные ассоциации, которые не извлекаются при использовании известных методов синтеза баз ассоциативных правил [1-6].
Поэтому актуальной является разработка метода синтеза баз численных ассоциативных правил, свободного от указанных недостатков и позволяющего извлекать не только часто встречающиеся наборы, но и редко возникающие интересные ассоциативные правила.
Целью настоящей работы является создание метода синтеза баз численных ассоциативных правил.
РИ, 2013, № 2
61