2012 Теоретические основы прикладной дискретной математики №1(15)
ТЕОРЕТИЧЕСКИЕ ОСНОВЫ ПРИКЛАДНОЙ ДИСКРЕТНОЙ МАТЕМАТИКИ
УДК 631.391:519.2
О СТАТИСТИЧЕСКИХ СВОЙСТВАХ НЕЛИНЕЙНОСТИ СУЖЕНИЙ БУЛЕВЫХ ФУНКЦИЙ НА СЛУЧАЙНО ВЫБРАННОЕ ПОДПРОСТРАНСТВО
А. Н. Алексейчук, С. Н. Конюшок
Институт специальной связи и защиты информации Национального технического университета Украины «Киевский политехнический институт», г. Киев, Украина
E-mail: [email protected], [email protected]
Показано, что для всех достаточно больших натуральных n относительная нелинейность произвольной булевой функции n переменных может быть статистически аппроксимирована относительной нелинейностью ее сужения на случайное подпространство (возможно, с выколотым нулевым вектором), размерность которого не зависит от n.
Ключевые слова: булева функция, нелинейность, случайное подпространство, статистическая оценка.
1. Постановка задачи и основной результат
Пусть Vn = {0,1}n, f : Vn ^ {0,1} — булева функция n переменных, f (a) = = 2-n (—1)fФ aX, a G Vn,—ее нормированные коэффициенты Уолша — Адама-
x€V„
ра. Напомним (см., например, [1, с. 233]), что нелинейность Nf функции f определяется как расстояние от f до множества аффинных булевых функций n переменных и удовлетворяет следующему равенству:
Nf = 2n-1(1 - f),
где
/* = max |f (a)|.
аЄУп
Назовем число Nf = Nf /2п-1 относительной нелинейностью функции f.
Пусть далее X — двоичная матрица размера t х n, где t < n. Обозначим fx (u) = = f (uX), u G V* = V\{0}, частичную булеву функцию, равную, с точностью до замены переменных u М uX, u G Vt*, сужению функции f на подпространство, порожденное строками матрицы X (возможно, с выколотым нулевым вектором). Положим
Па(Х) = 2Г1Т £ (-1)fx(u) *“ а G Vt; (2)
2 — 1 ueVt*
n*(X ) = max 1 Па(X )|. (3)
aeVt
2* — 1
Из данных определений следует, что величина N= —-—(1 — п*(Х)) равна расстоянию от функции /х до множества аффинных функций £ переменных, ограниченных на подмножество У**. Назовем число Л/ = 1 — п* (X) относительной нелинейностью функции /х.
Предположим теперь, что матрица X выбирается случайно и равновероятно из множества ^*хп всех £ х п-матриц над полем ^ = СЕ(2). Тогда случайную величину ТУ/ можно рассматривать как статистическую оценку параметра Nf, и естественно поставить вопрос о свойствах этой оценки. Отметим, что связь между нормированными коэффициентами Уолша — Адамара функций ¡ и ¡х исследуется в работах [2 - 4] в связи с построением вероятностных алгоритмов нахождения линейных аппроксимаций, а также проверки ряда свойств булевых функций. В частности, в [3] показано, что при случайном равновероятном выборе матрицы X из множества ^*хп для любых а Е УП, £ Е (0,1) выполняется неравенство
£-2
Р||/(а) — Пха(X)| ^ £} ^ ^. (4)
Аналогичное неравенство применительно к более общему случаю получено в [5], однако в указанных, а также в других известных авторам публикациях не затрагивается вопрос о связи между величинами (1) и (3) или, что то же самое, между относительными нелинейностями функций ¡ и ¡X.
Основным результатом настоящей работы является следующая теорема.
Теорема. Для любых £, 8 Е (0,1) существует натуральное число £0 = £о(£, 8), такое, что для любых натуральных п > £ ^ £0 и произвольной функции ¡ : Уп ^ {0,1} справедливо неравенство
Р{№ — /| » £} « 8, (5)
где X — случайная равновероятная £ х п-матрица над полем ^.
Доказательство теоремы базируется, в основном, на анализе моментов случайных величин (2) и излагается в п. 2. Возможность практического применения теоремы к оцениванию нелинейности булевых функций обсуждается в п. 3.
2. Доказательство теоремы
Зафиксируем числа п, £ Е N где п > £, £ Е (0,1), функцию ¡ : УП ^ {0,1} и оценим
сверху вероятность события {|ТУ/ — | ^ £} = {|/* — п*^)| ^ £}.
Докажем ряд вспомогательных утверждений.
Лемма 1. Справедливо неравенство
£-2 2* - 1'
Доказательство. Обозначим а* вектор из множества УП, такой, что ¡* = |/(а*)|. На основании формулы (3) событие {¡* ^ п*(X) + £} влечет событие {|¡(а*)| ^ ^ |пХ«*(X)| + £}, которое, в свою очередь, влечет событие {¡(а*) — пха*(X)| ^ £}. Отсюда на основании неравенства (4) следует, что
£—2 2* - 1'
Лемма доказана. ■
Следующее простое утверждение, по-видимому, хорошо известно, однако авторам не удалось найти источник, содержащий нужную формулировку.
Лемма 2. Для числа / (к, п) линейно зависимых систем, состоящих из к двоичных векторов длины п, справедливо неравенство /(к,п) < 2пк • 2к-п.
Доказательство. Число линейно независимых систем из к двоичных векторов длины п равно
2пк — /(к, п) = (2п — 1)(2п — 2) • • • (2п — 2к-1) = 2пк(1 — 2-п)(1 — 2-(п-1)) • • • (1 — 2—(п—(к—^).
N N
Отсюда на основании неравенства (1 хг) ^ 1 /* 1 хг, хг Е (0, 1), ^ 1,..., N,
г=1 г=1
следует, что
2пк — /(к, п) ^ 2пк (1 — 2-(п-к+1)(1 + 2-1 + ••• + 2-(к-1))) >
> 2пк ^ 2—(п-к+1) 2^ __ 2пк 2пк 2^—п
Лемма доказана. ■
Для любого положительного четного числа т ^ £ +1 обозначим
Пт,* = Е Е^^))т. (6)
а€У
Следующая лемма играет ключевую роль в доказательстве теоремы.
Лемма 3. Справедливо неравенство
т
- < (1 + 2*—т) & (¡<“0т + -»(1 + 2*—!
Доказательство. Преобразуем выражение (6):
Пт,. = £ Е( ЕЫ/(“х
а€У \ 2 — 1 <
1____Е( ^2 ^2 (—1)/(“(1)х)®"^®/(“(т)х)Ф(и(1)Ф-Фи(т))а
(2* 1) \и(1),...,и(т)еУ4* «£У
2* ы ^ / 1\/(«(1)х)ф^ф/(м(т-1)х)ф/(м(1)хф^фм(т-1)х)
Е Е (—1);
(2* 1) \и(1),...,«(т-1)еУ(*
о—*п
^ / ,ч/(«(1)х )©•••©/(«(т-1)х )ф/(«(1)хф^ф«(т-1)х)
Е 2—*п £ (—1)
(2* — 1)ти(1),...,и(т-1)еу4* х вЪх
Представим выражение в правой части (8) в виде суммы двух слагаемых
П(1) = _______2_____ у^(1) (. . .) П(2) = _________2______ у^(2) (. . .)
/1т,* /г)* 1 \т V У > лт,* (п-. \т V 7 >
(2 — 1) и(1),...,и(т-1)бУ4* (2 — 1) «(1),...,«(т-1)еУ4*
где символы £(1) и £(2) обозначают суммы по всем линейно независимым и линейно зависимым системам векторов и(1),... ,и(т—1) Е У** соответственно. Используя лемму 2, оценим значение п^2* следующим образом:
(2) 1 2*
га
(2* — 1)т
^(2) 2—*п ^2 ( — 1)/(“(1)х)Ф-Ф/(«(т-1) х)ф/(«(1)хф^ф«(т-1)х)
«(1),...,«(т-1)еУ4* х х„
2* 2* / 1 \ т
^ . * 2 ,т Е(2) 1 ^ * 2 ,т 2*(т—1)+т—1—* = 2т—*—1 1 + 1
(2* — 1)ти(1),...,и(т-1)еУ(* (2* — 1)т V 2* — 1
Оценим теперь значение п""*. Заметим, что если векторы и(1),... , и(т—1) Е У* линейно независимы, то для любого набора векторов г>(1),... , ^(т—1) Е Уп существует ровно (2*—(т— 1^ матриц X Е ^*хп, таких, что = ^(г), г = 1,... ,т — 1. Следовательно,
П
(1)
У^(1) 2—*п • 2*п— (т— 1)п ^ (—1)/(^(1))®^^^®/(^(т-1))ф/('и^ф—ф^™-1^
(2* — 1)
«(1),...,«(т-1)еУ4* ®(1),...,^(т-1)еУ„
Далее, поскольку
Е í/(а)) т = Е 2—'тп ^ (—1)/(^(1))®^^^®/(^(т))фа(а(1)ф^"фа(т))
аеУП аеУ„ »(1),...,^(“)еУп
= 2 — (т— 1)п ^ ( —1)/(^(1))ф^^^ф/(^(т-1))ф/(^(1)ф^^^ф^(т-1))
^(1),...,»(га-1)еУ„
то
п') = ,2‘ т Г (/МГ Е(1) 1
2421 — 1)т—1 & (/(а»' =(1 + ^) £ (/(а))"
(2* 1) аеУп ' «(1),...,«(т-1)еУ4*
ПО)
(2* — 1)т ¿¿У' Ч V 2* — V аеУп
Из соотношений (8)-(10) следует неравенство (7). ■
Лемма 4. Для любого положительного четного числа т ^ £ + 1 справедливо неравенство
р{/, + £ « ^)} < £—2 (1 + ) (г+7У" 2 + £-m2m-,-^ (1 + 4 '
Доказательство. Из формулы (3) и неравенства Чебышева следует, что
Р{/* + £ ^ п*^)} = Р ( и {/* + £ ^ |Па(X)|} ) ^ Е Р{/* + £ ^ |Па(X)|} ^
\«еУ4 / “еУ‘
^ (/* + £)—" Е Е^))" = (/* + £)—"Пт,*.
«еУ(
Следовательно, на основании леммы 3
Р{/*+£«n*<X)} « (/. +£)—т( 1 + 2г^^)е_(/(а))"+(/* + £)-m2m-,-^ 1 + ^)
Далее, согласно формуле (1) и равенству Парсеваля,
Е (/(а))" /т—2 Е (/ (а))2 = /Г—2,
аеУп У 7 аеУп У 7
откуда следует, что
*
1\/^\т 2 ( 1 Ут 2 1 , 1 1 I •> * 1 I ! £ I тот—*—1/1 , 1
< (/* + £)-( +(/* + "2т—‘—\«
*
2
< ^ 1 + 2^) (^) "—2 + ^ ^ "
Лемма доказана. ■
Завершение доказательства теоремы. На основании леммы 1 и леммы 4 для любых п,£,т Е N где п > £ ^ т — 1, т четно, £ Е (0,1) и / : Уп ^ {0,1}, справедливы следующие соотношения:
Р{|Ж/ — /| ^ £} = Р{(* ^ n*(x) + £} + Р{/* + £ У п*^)} У
— 2 т— 2 т
У ^—7 + £—2 I 1 + ^---7 I I ^-- I + £ т2т * 11 1 + —---- I у
2* — 1 V 2* — 1) У1 + £) V 2* — 1) ^ (11
У -----г + £—2 (1 + т—1—7Мт~^~У + £—т2т—*—1 (1 + 1
2т—1 — 1 ^ 2т—1 — 1 у \ 1 + £) \ 2т—1 — 1
Пусть теперь 8 Е (0,1). Выберем наименьшее четное число т0 > 0, такое, что
£—2 2 ( 1 у( 1 уто—2 8 , ,
+ £—2 1 + ^—1-------7 У ^, (12)
2то—1 — 1 у 2"о—1 — 1у^1+ £) " 2
и наименьшее натуральное число £0 ^ т0 — 1, такое, что
( 1 у то 8
£—то 2то—*о—1 / 1 +---_---- у (13)
^ 2"о—1 — 1 у ^2
В силу соотношений (11) для любых п > £ ^ £0 выполняется неравенство (5), что и требовалось доказать.
3. Заключительные замечания
Полученная теорема позволяет предложить вероятностный алгоритм оценивания нелинейности функции / : УЛ ^ {0,1} с точностью 2п—1 £ и достоверностью не
менее 1 — 8, £,8 Е (0,1), состоящий в вычислении значения случайной величины
2п—1(1 — п*^)), где X — случайная равновероятная матрица размера £0 х п над полем ^, а число £0 < п определяется из соотношений (12), (13). Нетрудно видеть, что при вычислении всех значений (2) с помощью быстрого преобразования Адамара (см., например, [1, с. 217]) трудоемкость указанного алгоритма составляет 0(2*°£0п) двоичных операций, где £0 зависит только от £ и 8. Однако значения £0 быстро растут
с уменьшением параметра £, поэтому применение этого алгоритма на практике оказывается неэффективным.
Вместе с тем, согласно лемме 1, для любых £,8 Е (0,1) и п > £ = |~1с^(1 + £—28—1)] справедливо неравенство
Р{2п—1(1 — п*^)) — 2п—1£ У Ж/} ^ 1 — 8,
где X — случайная равновероятная £ х п-матрица над полем ^, причем для вычисления указанной нижней оценки параметра Ж/ достаточно выполнить 0(п£—28—1 log(£—28—1)) двоичных операций. Далее, в качестве верхней оценки нелинейности функции / можно
использовать случайную величину 2п—1(1 — п?"^)), где ) = ( 2—* ^ (п«^))"
V «еУ
m ^ 4 — четное число. Опираясь на лемму 3 и проводя рассуждение, почти дословно повторяющее доказательство леммы 4, нетрудно убедиться в том, что для любых е, - Е (0,1) и n > t ^ m — 1, удовлетворяющих условию
e-22-t Л+-^-) У -, e-m2m-2i-1^1 + ) у -,
V 2J — V\1 + Ч 2’ V 2J — 1) 2
справедливо неравенство
P{Nf у 2n-1(1 — Пт(X)) + 2ra-1e} ^ 1 — -,
где X — случайная равновероятная t х n-матрица над полем F. При фиксированном m и t = [1/2 • log(4me-m--1)] для вычисления указанной верхней оценки параметра Nf требуется выполнить O(2Jtn) = O ^ne-m--2 log(e-m--2)^ двоичных и
O(2J) = O ^e-mm--2^ арифметических операций (сложения и возведения в степень вещественных чисел), что приводит к алгоритму, трудоемкость которого полиномиально зависит от n, e-1 и --1.
ЛИТЕРАТУРА
1. Логачев О. А., Сальников А. А., Ященко В. В. Булевы функции в теории кодирования и криптологии. М.: МЦНМО, 2004. 470с.
2. Levin L. A. Randomness and non-determinism // J. Symbolic Logic. 1993. V. 58. No. 3. P. 1102-1103.
3. Bshouty N., Jackson J., and Tamon C. More efficient PAC-learning of DNF with membership queries under the uniform distribution // Proc. 12th Annual Conf. on Comput. Learning Theory. NY, USA: ACM,1999. P. 286-295.
4. Gopalan P., O’Donnell R., Servedio A., et al. Testing Fourier dimensionality and sparsity // SIAM J. Comput. 2011. V.40(4). P. 1075-1100.
5. Алексейчук А. Н., Шевцов А. С. Быстрый алгоритм статистического оценивания максимальной несбалансированности билинейных аппроксимаций булевых отображений // Прикладная дискретная математика. 2011. №3(13). С. 5-11.