В заключение авторы выражают благодарность П. С. Колесникову за сделанные им замечания.
СПИСОК ЛИТЕРАТУРЫ
1. Михалев А.В., Пинчук И.А. Универсальные центральные расширения конформных алгебр Ли // Вестн. Моск. ун-та. Матем. Механ. 2005. № 1. 26-31.
2. Kac V. Vertex Algebras for Beginners. University Lecture Series. Vol. 10. Providence, RI: AMS, 1996.
3. Roitman M. On free conformal and vertex algebras //J. Algebra. 1999. 217. 496-527.
4. Zelmanov E. Conformal algebras // The Concise Handbook of Algebra. Dordrecht: Kluwer Academic Publishers, 2002. 326-330.
5. D'Andrea A., Kac V. Structure theory of finite conformal algebras // Selecta Math. 1998. 4. 377-418.
6. Михалев А.В., Пинчук И.А. Конформные алгебры Стейнберга // Матем. сб. 2005. 196, № 5. 31-52.
Поступила в редакцию 25.10.2008
УДК 519.72
ПОСТРОЕНИЕ ПОСЛЕДОВАТЕЛЬНОСТЕЙ НУЛЕЙ И ЕДИНИЦ СО СЛОЖНЫМИ
КОНЕЧНЫМИ ПОСЛЕДОВАТЕЛЬНОСТЯМИ
А. Ю. Румянцев1
Строятся бесконечные последовательности нулей и единиц, удовлетворяющие определенным ограничениям (не содержать подслов определенного вида или данных битов в данных позициях и т.п.). Рассматриваются вероятностные подходы к построению таких последовательностей с применением леммы Ловаса, а также их переформулировка на языке колмогоровской сложности и теории случайности по Мартин-Лефу.
Ключевые слова: колмогоровская сложность, префиксная сложность, последовательность, подпоследовательность, комбинаторика, вероятность.
We construct infinite sequences of zeros and ones under some restrictions (not to contain subwords of some definite type or definite bits at definite positions or so on). This paper concerns probabilistic methods of constructing such sequences with application of Lovasz Local Lemma and their Kolmogorov complexity reformulation.
Key words: Kolmogorov complexity, prefix complexity, sequence, subsequence, combinatorics, probability.
Вероятностный метод доказательства существования можно переформулировать так: берем случайную последовательность (в смысле алгоритмической теории вероятностей, т.е. определения Мартин-Лефа [1]) и проверяем, что она удовлетворяет всем ограничениям.
Связь случайности по Мартин-Лефу и колмогоровской сложности демонстрирует теорема Левина-Шнорра.
Теорема 1 (Левин-Шнорр). Последовательность и случайна по Мартин-Лефу тогда и только тогда, когда для некоторого с и для любого целого положительного числа п выполнено неравенство
КР(и([0, п))) ^ п - с.
Здесь KP обозначает префиксную сложность, [0,n) обозначает промежуток {0,1,2,...,n — 1}, а w([0,n)) есть n-битовое начало последовательности.
1 Румянцев Андрей Юрьевич — асп. каф. математической логики и теории алгоритмов мех.-мат. ф-та МГУ, e-mail: [email protected].
Таким образом, префиксы случайной по Мартин-Лефу последовательности имеют большую сложность. Отсюда следует, что если объявить некоторое небольшое разрешимое множество префиксов "запрещенными", то случайная последовательность не будет иметь (достаточно длинных) запрещенных префиксов.
Можно доказать и более общее утверждение.
Утверждение 1. Пусть последовательность и случайна по Мартин-Лефу. Тогда для любого конечного множества X С N верно неравенство КР(и(Х),Х) ^ \Х\ — 0(1).
Здесь \Х\ обозначает число элементов в множестве X, а и(Х) — слово, составленное из битов последовательности и с индексами в множестве X, записанных слева направо. Если X = [0,п), то и(Х) определяет X, второй член пары не нужен и мы получаем теорему Левина-Шнорра в качестве частного случая. Это утверждение дает критерий случайности, инвариантный относительно вычислимых перестановок последовательности.
Доказательство. Рассмотрим множество Т всех последовательностей, не обладающих нужным свойством. Требуется показать, что множество Т является эффективно нулевым.
Для данного с следует перечислить семейство интервалов, покрывающее Т и имеющее меру не более 2-с. Рассмотрим множество
Тс = {и \ ЗX КР(и^< IX\ — с}.
По определению Т = Пс Тс. Множество Тс задано как объединение интервалов (каждый интервал соответствует одной паре (XX)):
Тс = и {и \ и(^) = X}.
х,Х :КР(х,Х )<\Х\-с
Интервалы можно перечислять, поскольку префиксная сложность перечислима сверху.
Покажем, что мера Тс не превосходит 2-с. Мера интервала, заданного условием и^) = X, равна 2-|Х\. Значит, мера всего множества Тс не превосходит
2-\Х\ ^ ^ 2-с-КР(х,Х) ^ 2-с,
х,Х:КР(х,Х)<\Х\-с х,Х
поскольку £ 2-КР(и) ^ 1. □
и
По сравнению с теоремой Левина-Шнорра класс множеств X, для которых слово и^) сложное, расширился до всех простых множеств.
Левин [2] доказал существование последовательности со сложными подсловами (это использовалось в задаче о замощении плоскости для построения наборов плиток, для которых все замощения имеют большую сложность).
Лемма 1 (Левин). Для любого числа 0 < а < 1 существует такая последовательность и, что для любых п и к выполнено неравенство К(и([к, к + п))) ^ ап — 0(1).
Здесь К обозначает простую колмогоровскую сложность. Заметим, что эта лемма не следует из доказанного ранее утверждения 1, поскольку сложность множества индексов, представляющего собой промежуток, может быть сколь угодно велика при его небольшой длине (если начало промежутка имеет большую сложность).
Причиной является то, что сумма вероятностей нарушить запрещения здесь больше единицы и для доказательства существования приходится использовать независимость различных запрещений (связанных с непересекающимися отрезками).
Ясно также, что в данном случае нельзя улучшить оценку сложности: если в последовательности не встречается хотя бы одно слово (скажем, длиной т), то ее можно рассматривать как состоящую из 2т — 1 блоков длиной т, откуда следует, что сложность подслова длины N не больше N[^(2т — 1)/т].
На самом деле рассуждение Левина позволяет доказать и более сильный факт, а именно справедлива
Лемма 2. Для любого числа 0 < а < 1 существует такая последовательность и, что для любых п и к выполнено неравенство К(и([к,к + п)) \ и([0,к))) ^ ап — 0(1).
Приводимое далее доказательство основано на префиксной сложности.
Доказательство. Фиксируем некоторую константу т (выбор ее зависит от а, см. ниже). Будем строить последовательность и начиная с пустого слова, добавляя на каждом шаге т-битовый отрезок.
Пусть уже построено начало х = и([0,гт)). Выберем среди всех слов длиной т слово у = и([гт, (г + 1)т)), для которого условная префиксная сложность КР(у\х, КР(х)) максимальна (не важно какое, если таких несколько).
£
По свойству префиксной сложности
^ 2-кр(-Ф>кр(ж)) < 1
X
и в этой сумме содержится 2т слагаемых, которые не меньше 2-КР(у1х>КР(ж)), поэтому КР(у \ х, КР(х)) ^ т. Но из теоремы Левина о префиксной сложности пары следует, что
КР(х) + КР(у \ х, КР(х)) = КР(х, у) + 0(1) < КР(ху) + КР(\у\) + 0(1)
(последнее неравенство следует из того, что слова х и у можно восстановить, зная их конкатенацию ху и длину слова у). А значит, КР(ху) ^ КР(х) — КР(т) — 0(1), т.е. префиксная сложность при добавлении очередного отрезка длиной т увеличивается как минимум на т — 0(1с^ т).
Теперь фиксируем т так, чтобы сложность каждый раз увеличивалась как минимум на (Зт для некоторого в > а (мы всегда можем этого добиться, поскольку т — 0(^ т) > (Зт при достаточно большом т).
Рассмотрим подстроку Ь = и ([к, к + п)) и соответствующий ей префикс а = и([0,к)). Если к и п кратны т, то КР(аЬ) — КР(а) ^ (\Ь\, поскольку добавление каждого блока из т битов увеличивает сложность на (т. Для произвольных а и Ь это неравенство тоже выполнено с точностью до 0(1), так как при добавлении к концу слова одного бита его сложность меняется не более чем на константу (здесь мы считаем т фиксированным). А значит, выполняются неравенства (с точностью до 0(1))
КР(Ь \ а) ^ КР(Ь \ а, КР(а)) — 0(1) =
= КР(а, Ь) — КР(а) — 0(1) ^ КР(аЬ) — КР(а) — 0(1) ^ в\а\ — 0(1),
и аналогичное неравенство с заменой ( на а верно и для обычной (не префиксной) сложности, так как разница между ними порядка логарифма длины слова. Лемма доказана. □
Результат Левина можно получить и комбинаторными методами, используя следующий результат из теории вероятностей.
Теорема 2 (локальная лемма Ловаса). Пусть О = (V, Е) — неориентированный граф, V — множество вершин, а Е — множество ребер. Пусть для каждой вершины указаны событие в некотором вероятностном пространстве (одном и том же для всех у) и число £ (0,1). Предположим, что для любого у событие независимо со случайной величиной, составленной из всех событий Ни для и, не соседних с у, и выполнено неравенство
Рг(Н) < РV • П (1 — Ри).
(V,и)еЕ
Тогда Рг I Р| Нг„) ^ П (1 —р-ю), и, следовательно, это событие непусто. ^vev ' vev Доказательство этой леммы приведено в [3].
Покажем, как отсюда следует утверждение леммы Левина. В качестве вероятностного пространства рассмотрим множество двоичных последовательностей с равномерной бернуллиевской мерой.
В качестве событий будем брать "нарушения" вида и(Х) = х для некоторых пар (х,Х), где X — конечное множество индексов (натуральных чисел), а х — двоичное слово. (Как и раньше, и(Х) означает слово, составленное из битов последовательности и с индексами в множестве X, записанных слева направо.)
С помощью леммы Ловаса можно доказать следующий результат.
Утверждение 2. Для любого числа 0 < а < 1 существует число N со следующим свойством. Пусть А — некоторое множество пар вида (х,Х), называемых "запрещенными", где X — конечное множество натуральных чисел (индексов), а х — слово длимой \Х\. Пусть при этом все слова х в запрещенных парах имеют длину не менее N и для каждого индекса Ь и каждого числа п количество запрещенных пар с множествами размера п, содержащими позицию Ь, не больше 2ап:
УЬ,п\{(х,Х) £ А \ \Х\ = п и Ь £ Х}\ < 2ап.
Тогда существует последовательность и, не нарушающая ни одного запрещения (для всех (х,Х) £ А выполнено и(Х) = х).
Прежде чем доказывать это утверждение (доказательство приведено в конце статьи), укажем его сложностной аналог.
Теорема 3. Для любого числа 0 < а < 1 существует последовательность и с таким свойством: для любого конечного непустого множества X С N найдется элемент Ь £ X, для которого
К(и^\ Ь) ^ а^\ — 0(1).
В данной теореме мы усилили утверждение 1, использовав условную сложность, но одновременно и ослабили его, умножив правую часть на а < 1. Теперь не важно, какой именно вид сложности применяется, поскольку малые изменения а скомпенсируют логарифмичекую разницу между разными видами сложностей.
Эквивалентность утверждения 2 и релятивизованной теоремы 3 устанавливается несложно. Чтобы вывести сложностное утверждение из комбинаторного, достаточно взять множество запрещений
А = {(XX) \ = \х\ ^ N и тахК(х,X \ Ь) < а^\}.
Тогда количество запрещений мощности п, проходящих через заданную точку Ь, не будет превосходить 2ап, поскольку условная сложность каждого такого запрещения относительно Ь будет меньше ап. В другую сторону можно, как и раньше, взять в качестве оракула множество запрещений. Тогда получим, что для любого запрещения (х, X) и любой точки Ь выполняется неравенство К(х, X \ Ь) < аX\ + 0(log X\), так как количество запрещений мощности п, проходящих через точку Ь, не больше 2ап и все эти запрещения можно перечислять с данным оракулом, если получена точка Ь. Но величина 0(к^ \X\) поглощается малым изменением числа а.
Утверждение теоремы 3 обобщает лемму Левина. В самом деле, из него легко следует Теорема 4. Для любого числа 0 < а < 1 существует последовательность и с таким свойством: для любого конечного непустого множества X С N
К(и^) \ X) ^ а^\ — тахК^ \ Ь) — 0(1).
Доказательство. Действительно,
K(и(X),X \ Ь) < К(и^) \ X) + К(X \ Ь) + 0(к^ X\)
(величина 0(log X\) компенсируется малым изменением константы а). □
Отсюда сразу вытекает лемма Левина: последовательность будет иметь сложные подслова, поскольку отрезок прост относительно любой его точки. Видно также, что подследовательность будет иметь сложные относительно своей позиции подслова (но не относительно соответствующего префикса, как в лемме 2).
Более того, таким способом можно получить многомерный вариант леммы Левина, для которого первоначальное доказательство Левина неприменимо, а именно следующее
Утверждение 3. Пусть а £ (0,1). Для любого й ^ 1 существует й-мерная "последовательность" (отображение Zd ^ {0,1}), в которой сложность содержимого любого (целочисленного) параллелепипеда объема V не меньше а\У\ — 0(1).
Доказательство. Ясно, что переход от N к Zd не меняет дела (точки в Zd можно эффективно занумеровать), и сложность множества (номеров) точек параллелепипеда объема V относительно любой его точки есть 0(^ V) (достаточно указать координаты вершин параллелепипеда относительно этой точки); этот логарифм компенсируется изменением числа а. □
Другое усиление леммы Левина можно получить, если заметить, что утверждение теоремы 3 устойчиво относительно вычислимых перестановок последовательности. В самом деле, вычислимая перестановка вычислимо действует и на индекс Ь, и на пару (иХ(биты в слове и(^) переставляются, но эту перестановку легко найти, зная X). Получаем
Утверждение 4. Для любого числа 0 < а < 1 существует такая последовательность и, что для любой вычислимой биекции а: N ^ N перестановка и с помощью а, т.е. последовательность щ = иа(^, обладает свойством из леммы Левина: для любых п и к выполнено неравенство
К(и([к, к + п))) ^ ап — 0(1).
При этом константа в O(1) зависит от перестановки, но не зависит от n и к.
Доказательство. Достаточно взять последовательность из теоремы 3 с данной константой а. Тогда любая ее вычислимая перестановка тоже будет удовлетворять утверждению теоремы 3, а значит, и теоремы 4 и, следовательно, будет иметь сложные подслова. □ При этом получается даже более сильное утверждение: можно заменить сложность подслова на его условную сложность при известных n и к.
В заключение приведем обещанное доказательство утверждения 2 с помощью леммы Ловаса. Доказательство. Пусть N — достаточно большое число, значение которого мы определим позже. Для каждой запрещенной пары (x,X) £ A рассмотрим следующее событие (нарушение запрещения):
HxxX = {w I w(X) = x}.
Необходимо найти последовательность w, не входящую ни в одно из таких событий (в предположении, что все I XI не меньше N).
По соображениям компактности достаточно рассматривать конечные множества запрещений: если для каждого конечного множества запрещений существует последовательность, не нарушающая запрещений в этом множестве, то найдется и последовательность, не нарушающая ни одного запрещения.
Для конечного множества запрещений мы воспользуемся леммой Ловаса. Вершинами графа будут запрещения из этого множества. Ребра графа соединяют запрещения с пересекающимися областями действия: вершины (x, X) и (y,Y) соединены ребром, если X П Y = 0.
Запрещение независимо со случайной величиной, составленной из всех не пересекающихся с ним запрещений, так что условие леммы Ловаса о независимости выполнено. Осталось выбрать величины px,х и проверить выполнение неравенств из формулировки леммы. Возьмем произвольное ß в интервале (а, 1). Положим px,х = 2_^1х1. Достаточно доказать, что для любого запрещения (x,X) выполнено неравенство
Pr(Hx, х) ^ Px,X • (1 - Py,Y).
((х,х ),(y,Y ))ее
Разобьем произведение на n = X частей, соответствующих всем возможным точкам пересечения множества X с Y. Эти части, возможно, пересекаются, но неравенство от этого только усилится. Достаточно доказать, что
2-га < 2-^П П (1 - PyY),
гех (y,Y)ev\teY
для чего в свою очередь достаточно перемножить n следующих неравенств (для каждого t £ X):
2ß-1 < П (1 - PyY).
(y,Y )ev\teY
Для данного t, как мы видели, в этом произведении есть не более 2ат множителей с | Y| = m, т.е. оно не меньше Л (1-2-ßm)2"m, где произведение берется по всем m = N, N+1,.... Поскольку это произведение не
т
меньше Л (1 — 2(a-ß)m) по неравенству Бернулли, а соответствующее бесконечное произведение сходится,
т
то при достаточно больших N интересующее нас произведение будет близко к 1 и больше что и
требовалось доказать. □
СПИСОК ЛИТЕРАТУРЫ
1. Li M., Vitanyi P. An Introduction to Kolmogorov Complexity and Its Applications. 2nd ed. N.Y.: Springer, 1997.
2. Durand B., Levin L., Shen A. Complex tilings // STOC Proc. Heraklion, 2001.
3. Rajeev Motwani, Prabhakar Raghavan. Randomized Algorithms. N.Y.: Cambridge University Press, 1995.
Поступила в редакцию 10.11.2008