2018
Теоретические основы прикладной дискретной математики
№ 39
УДК 519.728
ОБ ОДНОМ ИНВАРИАНТЕ В ЗАДАЧЕ РАЗЛОЖЕНИЯ НЕДООПРЕДЕЛЁННЫХ ДАННЫХ
Рассматривается задача разложения произвольного недоопределённого источника в произведение недоопределённых двоичных источников. Ранее автором было установлено, что точное разложение существует не всегда, но всегда имеется в определённом смысле лучшее аппроксимирующее разложение. Исследуются построение и минимизация аппроксимирующих разложений. Развивается новая техника работы с разложениями на основе связанного с ними графа, названного характеристическим. Доказано, что этот граф является инвариантом равносильных преобразований разложений и полностью определяет класс равносильности. Установлено, что каждому конкретному разложению из этого класса соответствует покрытие характеристического графа системой полных двудольных подграфов, причём это соответствие взаимно однозначно с точностью до некоторой стандартизации разложений. Введённый инвариант, позволяя вместо отдельных разложений иметь дело со всем классом равносильности, значительно расширяет возможности конструктивного исследования разложений. В частности, он даёт подход к решению задачи минимизации разложений, недоступной для предшествующих методов.
Ключевые слова: недоопределённый источник, декомпозиция, аппроксимация, инвариант равносильных преобразований, характеристический граф разложения, биклика, МР-полнота.
DOI 10.17223/20710410/39/2
ON AN INVARIANT FOR THE PROBLEM OF UNDERDETERMINED
DATA DECOMPOSING
L. A. Sholomov
Federal Research Center "Computer Science and Control" of RAS, Moscow, Russia
The subject of this article is the problem of the best decomposing an arbitrary un-derdetermined source into a product of underdetermined binary sources. Let A0 = = [ai : i G M} be a finite alphabet of basic symbols, T ç 2M, and A = {aT : T G T} be an alphabet of underdetermined symbols. Any symbol ai, i G T, is considered to be a specification of the symbol aT. The symbol aM, denoted by *, is called indefinite. An underdetermined source X generates symbols aT G A independently with probabilities pT. The entropy of the source X is the quantity
where the minimum is taken over the set of probability vectors Q = (qi, i £ M). Underdetermined sources X and Y are equivalent (X ^ Y) if H(XZ) = 'H(YZ) for
Л. А. Шоломов
ФИЦ «Информатика и управление» РАН, г. Москва, Россия
E-mail: [email protected]
any source Z. The source X is not weaker than Y (X ^ Y) if XY ^ X. For the underdetermined source X and a natural s, we assign to each T e T some vector AT € e {0,1, *}s. If the component i (i = 1,..., s) of the vector is considered as the output value of some source Xj, then the product Xi... Xs of underdetermined binary sources arises. It's called decomposition associated with the source X. The decomposition X1... Xs is considered to be exact if X1... Xs ^ X. The decomposition is called (lower) approximation of the source X if X1... Xs ^ X and, for any connected with X decomposition Z1... Zt such that Z1... Zt ^ X, the relation X1... Xs ^ Z1... Zt is fulfilled. It is known that the exact decomposition of a source may not exist, but there is always an approximation that is unique up to equivalence. If the exact decomposition exists, then the approximation coincides with it. The aim of this paper is to construct approximations of minimal complexity (i.e., with the smallest number of factors).
The decomposition X1... Xs is represented by a matrix Л consisting of the columns AT, T e T. For the matrix Л, we construct a graph СХ(Л) with the set of vertices T. The graph is called the characteristic graph of Л. In it, the vertices T and T' are connected by the edge (T, T') if and only if the vectors AT and At are inconsistent, i.e. do not allow a common specification. It is proved that decompositions are equivalent if and only if the characteristic graphs of their matrices coincide. It means that the characteristic graph is the invariant with respect to equivalent transformations of decompositions and completely determines a equivalence class of the decompositions. For the equivalence class formed by approximations of the given source X, the characteristic graph GXPP(X) is also defined. The graph GXPP(X) is formed by all edges (T, T') such that T П T' = 0. All decompositions belonging to a given equivalence class are described too. It is proved that there exists a one-to-one correspondence between the decompositions (in some standard form) and coverings of the characteristic graph Gx with complete bipartite subgraphs. In particular, the approximate decompositions of the least complexity correspond to minimal coverings of GXPP(X). The construction problem for approximating decompositions with minimal complexity turned out to be NP-complete. The article describes a rather economical way to solve this problem for tasks having not too large dimension.
Keywords: underdetermined .source, decomposition, approximation, invariant of equivalent transformations, characteristic graph of approximation, biclique, NP-completeness.
Введение
Данная работа имеет дело с недоопределёнными данными — последовательностями недоопределённых символов. Каждому такому символу соответствует некоторое множество основных (полностью определённых) символов, любым из которых он может быть замещен (доопределён). Считается, что недоопределённые последовательности порождаются источником, генерирующим недоопределённые символы независимо с некоторыми вероятностями. При использовании недоопределённых данных часто бывает достаточно вместо самих данных иметь их доопределения. Эти ослабленные требования к данным предоставляют дополнительные возможности, одной из которых является возможность нетривиальных равносильных преобразований данных (подробнее см. в [1]).
В работе изучается задача разложения недоопределённых источников общего вида в произведение недоопределённых двоичных источников. Эта задача рассматривалась в работе [2], где установлено, что точное разложение, при котором произведение
равносильно исходному источнику, существует не всегда, но всегда имеется лучшее (в некотором заданном смысле) аппроксимирующее разложение. Для источников, допускающих точное разложение, аппроксимирующее разложение является точным. В [2] описан эффективный (полиномиальный) алгоритм построения аппроксимирующего разложения источника и представлен ряд эффективных методов, относящихся к проверке равносильности и упрощению разложений. Но подход, развитый в [2], позволяет производить лишь некоторые локальные упрощения разложений и не обеспечивает возможности построения равносильных разложений, минимальных по сложности.
Предлагаемая работа устраняет этот недостаток. В ней найден и исследован некоторый инвариант равносильных преобразований разложений. Он представляет собой граф, который в явном виде (и очень просто) выписывается по разложению. Этот граф, названный характеристическим графом разложения, обладает тем свойством, что разложения равносильны тогда и только тогда, когда их характеристические графы совпадают. Таким образом, характеристический граф описывает не отдельное разложение, а весь класс равносильных разложений и его можно считать характеристическим графом класса.
Установлено, что каждое конкретное разложение из класса равносильности соответствует некоторому покрытию характеристического графа системой полных двудольных подграфов (биклик), причём соответствие между разложениями источника и покрытиями характеристического графа бикликами взаимно однозначно с точностью до некой стандартизации разложений. В частности, разложение, имеющее наименьшую сложность, соответствует минимальному покрытию характеристического графа. Это даёт принципиальную возможность построения разложений минимальной сложности посредством решения задачи наилучшего покрытия характеристического графа бикликами. Задача построения наилучшего по сложности равносильного разложения оказалась КР-полной, что исключает возможность её эффективного решения (при условии ЫР=Р). Описан достаточно экономный метод решения этой задачи, применимый к задачам небольшой размерности.
Всё сказанное выше относится к произвольным классам равносильности разложений. Но основной интерес представляет класс аппроксимирующих разложений заданного источника. В работе найден простой способ построения характеристического графа этого класса и все задачи, связанные с нахождением и минимизацией аппроксимирующих разложений источника, решаются посредством операций над этим графом.
Использование введённого инварианта упростило решение задач, связанных с разложением недоопределённых данных и заметно расширило возможности методов, развитых в [2]. Кроме того, в терминах этого инварианта получили явную формулировку некоторые важные свойства разложений, для которых в [2] установлена лишь возможность полиномиальной проверки.
1. Недоопределённые источники. Равносильность
Считаем, что задан конечный алфавит А0 = {а^ : г Е М} основных символов. Каждому непустому Т С М поставлен в соответствие символ ат, называемый недоопре-делённым. Доопределением символа ат считается всякий основной символ а^, г Е Т. Символ ам, доопределимый любым основным символом, называется неопределённым и обозначается *. Будем говорить, что символ ат чётче символа аТ/ (ат/ размытее символа ат), если Т С Т'.
Пусть выделена система Т С 2м некоторых непустых подмножеств Т множества М и ей сопоставлен недоопределённый алфавит А = Ат = {ат : Т Е Т}. Источник X,
порождающий символы ат Е А независимо с вероятностями рт, ^ рт = 1, будем
т ет
обозначать (А, Р), где Р = (рт, Т Е Т). Дальше будем считать, что все символы ат ЕА имеют строго положительные вероятности, ибо при рт = 0 символ ат можно удалить из А (а множество Т — из Т). Источник (А,Р) будем называть недоопределённым, а в случае А = А0 — полностью определённым.
Задавшись некоторым набором вероятностей Q = (я, г Е М) символов аг Е А0, введём функцию
Н(Р^) = " £ рт Ь§Е Яг тет гет
(здесь и дальше логарифмы двоичные). Энтропией источника X назовём величину
Н(Х) =шт Н(Р^).
В задаче кодирования источников [3] эта величина играет для недоопределённых источников роль, подобную той, какую для полностью определённых играет энтропия Шеннона (подробнее см. в [4]). Распространение понятия энтропии на случай стационарных недоопределённых источников имеется в [5].
Недоопределённые источники X и У будем называть равносильными [2, 6] (и записывать X — У), если для любого источника Z выполнено1
Н(Х£) = H(УZ).
Другие способы введения того же понятия равносильности предложены в [1]. Одной из интерпретаций этого понятия является следующая [7]. Если рассматривать кодирования, которые по коду недоопределённой последовательности позволяют восстановить какое-либо её доопределение, то недоопределённые источники равносильны тогда и только тогда, когда всякое кодирование одного из них является также кодированием второго (при другом способе декодирования). Отсюда следует, что оптимальное кодирование одного источника оптимально и для второго.
Введём также отношение X £ У (источник X не слабее У), положив
X £ У ^^ XY - X. (1)
В [2] установлено, что отношения — и £ являются соответственно эквивалентностью и частичным порядком (нестрогим) и что они связаны соотношением
X - У ^ (X £ У) Л (У £ X). (2)
Источники X = (А, Р) и У = (В, Р) будем называть идентичными, если они различаются лишь обозначениями основных символов. Более точно, если основным и недоопределённым алфавитами источника X являются А0 = {аг : г Е М} и А = {ат : Т Е Т}, то соответствующие алфавиты источника У имеют вид В0 = {Ьг : г Е М} и В = {Ьт : Т Е Т}, причём символы ат и Ьт порождаются с одинаковыми вероятностями рт и имеют совместное распределение р(ат, Ьт) = рт (а потому р(ат, Ьт/) = 0 при Т = Т').
хКогда говорится о взаимоотношении нескольких источников, считается, что задано их совместное распределение. В частности, в данном определении предполагается заданным распределение для
Скажем, что символ аг мажорирует в источнике X = (А, Р) символ а^, если для любого ат Е А вхождение ] Е Т влечёт г Е Т. Операция исключения мажорируемого символа а^ производит замену символов ат на атВ результате возникает источник X' = (А',Р'), для которого Т = {Т' : Т = Т \ {3}, Т Е Т}, А' = {ат' : Т Е Т'}, Р' = (Рт', Т' Е Т'), рт' = рт' + рт'иц} (в случае ат' Е А считается рт' = 0; для символа ат'и{]} аналогично).
Источник, в котором отсутствуют мажорируемые символы, называется приведённым. По всякому источнику путём последовательного исключения (в произвольном порядке) мажорируемых символов может быть построен приведённый источник. Дальше понадобятся следующие факты.
Утверждение 1 [2, 6].
1. В результате исключения из источника мажорируемого символа возникает равносильный источник.
2. Разные приведённые источники, образованные из заданного последовательным исключением мажорируемых символов, идентичны.
3. Источники X и У равносильны тогда и только тогда, когда соответствующие им приведённые источники X' и У' идентичны.
2. Разложения
Пусть имеется недоопределённый источник X = (А, Р), А = Ат. Задавшись натуральным числом в, сопоставим каждому символу ат Е А некоторый набор Хт = = (Хт(1),..., Хт(в)) Е {0,1, *}5. Если рассматривать Хт(г), Т Е Т, как значения выхода некоторого источника Xi, г = 1,... , в, то возникнет произведение XI... Xs недоопределённых двоичных источников (т. е. источников в алфавите {0,1, *}), которое будем называть разложением, связанным с источником X. В этом разложении набор Хт значений выходов источников XI,... ,Xs имеет вероятность рт. На вид разложений каких-либо ограничений не накладывается. В частности, различным Т могут соответствовать одинаковые Хт.
Выделим некоторые специальные типы разложений, связанных с источником X. Разложение XI.. .Xs назовём точным, если XI.. .Xs ~ X. Точные разложения существуют не для всех источников, поэтому будем рассматривать также некоторые приближения. Разложение XI.. .Xs назовём нижней аппроксимацией источника X, если XI ...Xs ^ X и для всякого связанного с X разложения Z\... Zt, такого, что Z1... Zt ^ X, выполнено XI... Xs ^ Z1... Zt. В [2] доказано, что для любого источника существует нижняя аппроксимация. Все нижние аппроксимации одного источника равносильны, ибо если XI ...Xs и У\.. .Уь — две нижние аппроксимации, то XI... Xs ^ У\.. .Уь и У\.. .Уь ^ XI... Xs, а потому в силу (2) выполнено
^ ... Xs ~ У1.. .уь.
Двойственно (заменой соотношений ^ на ^ и наоборот) можно определить верхнюю аппроксимацию. Верхние аппроксимации в классе разложений существуют не для всех источников, поэтому дальше будем вести речь только о нижних аппроксимациях, которые будем называть просто аппроксимациями. Соответствующие разложения будем называть аппроксимирующими. Отметим, что если у источника существует точное разложение, то всякое аппроксимирующее разложение является точным.
Будем использовать представление разложений с помощью матриц. Положим п = = |Т| и N = {1,... ,'п}. Произвольно занумеруем числами ] Е N множества Т системы Т. Вместо Хт и Хт (г) будем использовать обозначения Хj и Хj (г), где ] —номер множества Т = Tj. Разложению X1 ..^ц сопоставим (в х п)-матрицу Л = (г)||
с в строками А(г) = (Аj(г),^ Е N), соответствующими источникам Xг, и п столбцами Аj• (точнее, столбцами являются транспонированные наборы Аj•). Чтобы превратить матрицу в разложение, следует приписать каждому столбцу Аj• вероятность ру. > 0.
Разложение XI... X., представляет собой источник, недоопределённый алфавит которого образован столбцами матрицы Л, а основной алфавит — всеми доопределениями столбцов. Вероятность недоопределённого символа равна сумме вероятностей, приписанных столбцам, с которыми он совпадает.
Процедура приведения источников фактически не зависит от значений приписанных его символам ненулевых вероятностей, а потому в силу п. 3 утверждения 1 от них не зависит понятие равносильности источников и можно говорить о равносильности алфавитов (подробнее см. в [1]). То же относится к разложениям; их равносильность определяется только матрицами разложений и не зависит от значений ненулевых вероятностей, приписанных столбцам. Матрицы назовём равносильными, если соответствующие им разложения равносильны. Для обозначения равносильности матриц Л и Л' будем применять запись Л — Л'. Отношение £ (не слабее), определённое посредством (1), может быть переформулировано применительно к матрицам в виде
Л £ Л'
Л,
где через
обозначена матрица, полученная записыванием друг под другом строк
матриц Л и Л'. Свойства отношений — и £, доказанные для источников, переносятся на матрицы.
Будем рассматривать преобразования матриц, выполняемые посредством операций над их строками. Преобразование назовём равносильным, если в применении к любой матрице разложения оно даёт равносильную матрицу. Систему равносильных преобразований назовём полной, если для любых двух равносильных матриц Л и Л' в ней имеется последовательность преобразований, переводящих Л в Л'.
Распространим булевы операции конъюнкции, дизъюнкции и инверсии (отрицания) на множество {0,1, *}, дополнив их соотношениями
0 Л* = * Л 0 = 0, 1 Л* = * Л 1 = *, *Л* = *,
1 V* = 1 = 1, 0 V* = 0 = *, *У* = *,
* = *.
Введём операции А(г) V А(и), А(г) Л А(и) и А(г) над строками, при выполнении которых соответствующие операции производятся над разрядами строк. Кроме того, введём операцию размытия строки А(г), осуществляемую путём замены некоторых из её символов Аj (г) более размытыми.
Утверждение 2 [2]. Следующие преобразования образуют полную систему равносильных преобразований матриц разложений.
1°) Добавление либо удаление строки, составленной только из нулей или из единиц.
2°) Добавление либо удаление инверсии некоторой строки.
3°) Добавление либо удаление конъюнкции двух строк.
4°) Добавление либо удаление дизъюнкции двух строк.
5°) Добавление либо удаление строки, полученной размытием некоторой строки матрицы.
Приведём некоторые производные от 1°-5° равносильные преобразования матриц, которые понадобятся дальше.
Инвертирование строки, т.е. замена строки А(г) на А(г). Эта операция может быть выполнена двойным применением правила 2°: сначала добавляется строка А(г), а затем удаляется А(г) как инверсия строки А(г).
Добавление либо удаление конъюнкции или дизъюнкции нескольких строк. Обоснуем, например, допустимость операции удаления дизъюнкции трёх строк. Пусть в матрице присутствуют строки А(г), А (и), А(^) и А(г) V А (и) V А(^). Тогда можно в соответствии с правилом 4° добавить А(г) V А (и), затем удалить А(г) V А (и) V А(^), после чего удалить А(г) V А (и).
Операции 1-расщепления и 0-расщепления. Обозначим через (г), а Е {0,1}, множество тех ], для которых Аj(г) = а. Со строкой А(г) свяжем два семейства строк {Аа^(г) : у Е (г)}, а = 0,1, где (г) означает строку, в которой все значения А расположены в тех же позициях, что и в строке А(г), в позиции у находится значение а, остальные разряды содержат *. Операция а-расщепления производит замену строки А(г) семейством {Аа^(г) : у Е (г)}. Допустимость операции 1-расщепления вытекает из того, что она может быть выполнена добавлением к матрице строк А0а-(г), у Е (г), получающихся размытием строки А(г), и последующим удалением строки А(г) как дизъюнкции добавленных строк. Операция 0-расщепления обосновывается аналогично, но роль дизъюнкции строк играет конъюнкция.
3. Характеристический граф разложений
Как и раньше, рассматриваем матрицы Л с п столбцами, где п — мощность недо-определённого алфавита. Столбцы Аи и А^ назовём несовместными, если они не могут быть доопределены до одного и того же столбца, т. е. в некотором разряде г значения Аи(г) и А^(г) определены и различны. Характеристическим графом матрицы Л назовем обыкновенный (т. е. неориентированный, без петель и кратных рёбер) граф с п вершинами, нумерованными числами 1,... , п, в котором вершины и и V соединены ребром (и^) тогда и только тогда, когда столбцы Аи и Аv несовместны. Случай пустого графа (т. е. графа с п вершинами и пустым множеством рёбер) не исключается. Характеристический граф матрицы Л будем обозначать через СХ(Л).
Следующее утверждение показывает, что характеристический граф инвариантен относительно равносильных преобразований матриц (и разложений).
Теорема 1. Матрицы разложений Л и Л' равносильны тогда и только тогда, когда их характеристические графы СХ(Л) и СХ(Л') совпадают.
Доказательство теоремы использует ряд лемм.
Лемма 1. Характеристические графы равносильных матриц совпадают.
Доказательство. Достаточно убедиться, что преобразования 1°-5° из утверждения 2 сохраняют характеристический граф.
1. При добавлении или удалении строки-константы во всех столбцах матрицы в одной и той же позиции возникает либо исчезает одна и та же константа. Это не влияет на совместность столбцов и не изменяет характеристический граф.
2. Инвертированная строка дублирует вклад исходной строки в множество несов-местностей. Поэтому при добавлении либо удалении инвертированной строки характеристический граф сохраняется.
3. Пусть дизъюнкция А(г) V А(у) обеспечивает несовместность столбцов Аи и Аv и Аи(г^Аи(У) = 0, Аv(г) VАv(у) = 1. Тогда Аи(г) = Аи(у) = 0 и какое-либо из значений Аv(г)
и Хv(]) равно 1. Это означает, что дизъюнкция Х(г) V Х(]) дублирует несовместность, даваемую одной из строк Х(г) и Х(]), и при добавлении либо удалении дизъюнкции строк характеристический граф не изменяется.
4. Случай добавления либо удаления конъюнкции строк рассматривается аналогично предыдущему.
5. Если строка является результатом размытия некоторой строки Х(г), то все связанные с ней несовместности содержатся среди тех, которые обеспечиваются строкой Х(г). Поэтому добавление или удаление более размытой строки не оказывает влияния на характеристический граф. ■
Будем различать матрицы разложений с точностью до перестановки строк. Разложение назовём каноническим, если его матрица имеет один из следующих видов:
(a) состоит из единственной строки 00 ... 0;
(b) составлена из попарно различных строк, каждая из которых содержит по одному разу элементы 0 и 1 (остальными являются *), причём 0 расположен в строке раньше 1.
Лемма 2. Произвольному графу О (на п вершинах) соответствует единственная матрица канонического разложения, характеристический граф которой совпадает с О.
Доказательство. Пустому графу О соответствует единственное каноническое разложение, имеющее тип (а), ибо характеристические графы всех канонических разложений типа (Ь) непусты.
Если характеристический граф некоторого канонического разложения не пуст, то разложение имеет тип (Ь) и существует взаимно однозначное соответствие между рёбрами этого графа и строками матрицы разложения: ребру (и, у), и < V, соответствует строка
* ... * 0 * ... * 1 * ... *,
где 0 расположен в позиции и, а 1 —в позиции у. Поэтому по произвольному графу О, принятому в качестве характеристического, каноническое разложение находится однозначно. ■
Лемма 3. Для всякой матрицы разложения существует единственная равносильная ей матрица канонического разложения.
Доказательство.
1. Покажем, что для всякой матрицы существует равносильная матрица канонического разложения.
(a) Рассмотрим сначала случай, когда в каждой строке матрицы присутствуют булевы элементы не более одного типа.
Проинвертировав строки, содержащие элементы 1, получим матрицу, образованную элементами 0 и *. По правилу 1° добавим строку 00... 0 и с помощью 5° удалим все другие строки. В результате получим матрицу с единственной строкой 00... 0.
(b) Рассмотрим теперь случай, когда в матрице разложения имеется строка, в которой одновременно присутствуют 0 и 1.
Сначала устраним все строки, содержащие булевы элементы одного типа. Для этого, как в п. (а), преобразуем совокупность всех таких строк в строку 00... 0 и удалим последнюю по правилу 1°.
Затем к каждой из оставшихся строк применим операцию 1-расщепления. Получим множество строк, любая из которых содержит некоторое количество 0 и единственное значение 1. Далее, выполнив для каждой из них операцию 0-расщепления, образуем
матрицу, во всех строках которой значения 0 и 1 встречаются по одному разу. Про-инвертировав строки, в которых 1 предшествует значению 0, и удалив с помощью 5° повторяющиеся строки, придём к матрице канонического разложения, эквивалентной исходной матрице.
2. Матрица канонического разложения, равносильная заданной матрице, единственна, ибо матрицы канонических разложений, равносильные заданной матрице, имеют по лемме 1 одинаковые характеристические графы и в соответствии с леммой 2 обязаны совпасть. ■
Лемма 4. Если матрицы разложений имеют одинаковые характеристические графы, то они равносильны.
Доказательство. Пусть матрицы Л и Л' имеют одинаковые характеристические графы. Для матриц Л и Л' рассмотрим единственные соответствующие им канонические разложения (лемма 2). По лемме 1 они имеют те же характеристические графы и потому по лемме 2 совпадают. Матрицы Л и Л', будучи равносильными одной и той же матрице (канонического) разложения, равносильны. ■
Теорема 1 вытекает из лемм 1 и 4.
Отношение равносильности матриц является эквивалентностью и потому множество матриц разложения разбивается на классы равносильности. Согласно теореме 1, каждому классу равносильности можно сопоставить граф, обладающий тем свойством, что матрица принадлежит классу, если и только если её характеристический граф совпадает с этим графом. Будем называть его характеристическим графом класса.
Следствие 1. Существует взаимно однозначное соответствие между классами равносильности матриц разложения с п столбцами и графами на п вершинах.
Доказательство. В силу сказанного выше, достаточно убедиться, что всякому графу соответствует некоторый класс равносильности матриц. Но это так, поскольку по лемме 2 каждый граф является характеристическим графом некоторого (в частности, канонического) разложения. ■
В терминах характеристических графов может быть выражено отношение £ (не слабее) для матриц и разложений. В теоретико-множественных соотношениях с участием графов под О понимается множество рёбер графа О.
Следствие 2. Отношение Л £ Л' имеет место тогда и только тогда, когда Ох (Л) Э СХ(Л').
Доказательство. С учётом равенства СХ ^ Л' ^ = ОХ(Л) и ОХ(Л') и теоремы 1
соотношение 3 может быть переписано в виде Л £ Л' ^^ ОХ (Л) и ОХ(Л') = ОХ(Л). Отсюда следует, что необходимым и достаточным условием для Л £ Л' является Ох (Л) Э СХ(Л'). -
Характеристический граф оказывается полезным в задаче упрощения разложений, где под упрощением понимается сокращение числа сомножителей в разложениях, а в терминах матриц — сокращение числа строк.
Для I С {1,..., в} обозначим через Л(/) множество строк А(г), г Е I, а через Л(А) — множество оставшихся строк. Поскольку мы различаем матрицы с точностью до перестановок строк, те же обозначения будем использовать и для матриц, составленных из этих строк. Множество строк Л(/) назовём устранимым из Л, если Л(1) ~ Л.
Следствие 3. Множество строк Л(1) устранимо из Л тогда и только тогда, когда Ох(Л(1)) э Ох(Л(1)).
Доказательство. Вытекает из следствия 2 и того, что условие устранимости множества строк Л(1) совпадает с условием Л(1) ^ Л(1) для матриц. ■
Теорема 1 и следствия 2 и 3 усиливают соответствующие результаты работы [2], поскольку дают явную формулировку условий, для которых в [2] установлена лишь возможность полиномиальнй проверки.
4. Характеристический граф аппроксимаций
Пусть требуется найти аппроксимирующее разложение заданного недоопределён-ного источника X (оно является точным, если точное разложение существует). Множество разложений, аппроксимирующих источник X, образует класс равносильности, характеристический граф которого обозначим через ОХрр(Х). Цель данного пункта — построение графа ОХрр(Х). Способ нахождения по графу самих аппроксимирующих разложений изложен в п. 5.
В работе [2] предложен эффективный (полиномиальный) алгоритм построения матрицы аппроксимирующего разложения заданного недоопределённого источника
X =(А,Р), А = АТ, Т = [Т1,...,Тп]. (4)
Утверждение 3 [2]. Аппроксимирующее разложение источника (4) задаётся матрицей Л = ||Х](г)|| со строками Х(г) и столбцами Х], г,] € N, где
если Т С Тг, если Т] П Тг = 0, в остальных случаях.
Отсюда и из утверждения 3 получаем явное описание графа ОХрр(Х).
Теорема 2. Характеристический граф ОХрр(Х) аппроксимирующих разложений источника (4) образован всеми такими рёбрами (и, у), и,у € N, что Ти П Тг = 0.
Доказательство. Граф ОХрр(Х) совпадает с графом Ох(Л) матрицы Л, представленной в утверждении 3. Ребро (и, у) принадлежит графу Ох(Л) тогда и только тогда, когда столбцы Хи и Хг несовместны, т.е. когда найдётся строка Х(г), элементы Хи(г) и Х(г) которой являются булевыми и различными. Пусть, для определённости, Хи(г) = 1, Хг,(г) = 0. Тогда Тг Э Ти и Тг П Т,0 = 0, откуда Ти П Т,0 = 0.
Обратно, пусть Ти П Тг = 0. Рассмотрим строку Х(и). В ней Хи(и) = 1, Хг(и) = 0, а потому столбцы Хи, Хг несовместны и (и, у) € Ох(Л). ■
Напомним некоторые сведения из теории графов [8]. Всякий граф О изоморфен графу пересечений, т.е. обладает следующим свойством. Если всеми вершинами графа О являются 1,... ,п, то существует система множеств Т = {Т1,... , Тп}, такая, что граф О содержит ребро (и, у) тогда и только тогда, когда Ти П Тг = 0. В качестве Тг (г = 1,... ,п) можно использовать множество, образованное вершиной г и всеми рёбрами, инцидентными г. Если п ^ 3 и граф О связен, то при его реализации в виде графа пересечений достаточно в качестве Тг (г = 1,... ,п) взять множество всех рёбер, инцидентных вершине г.
Покажем, что в качестве характеристических графов при аппроксимациях источников с п-буквенным недоопределённым алфавитом могут возникнуть любые графы на п вершинах.
Х] (г)
1,
0,
*
Теорема 3. Любой граф С является характеристическим графом СХРР(Х) аппроксимирующих разложений некоторого источника X.
Доказательство. Возьмём дополнение С графа С и реализуем С в виде графа пересечений. Пусть при этом возникает система множеств Т = {Т1,... , Тп}. Обозначим через X источник (4), в котором в качестве Т использована построенная система. Поскольку выполнено
(и, V) е С ^ (и, V) е С ^ Тад п Т то граф С в силу теоремы 2 совпадает с СХРР(Х). ■
0,
Пример 1. Пусть требуется указать недоопределённый источник X, для которого СХРР(Х) совпадает с графом С, представленным на рис. 1,а. Обозначим через С' граф на пяти вершинах, полученный из С удалением изолированной вершины 4, а через С' — дополнение последнего. Граф С' (рис. 1,б) связен. Занумеровав е1 = (1, 2), е2 = (1, 3), е3 = (1, 6), е4 = (2, 6), е5 = (3, 5) рёбра графа С' и используя в множествах Т вместо рёбер их номера, получим систему множеств Т1 = {1, 2, 3}, Т2 = {1,4}, Т3 = {2, 5}, Т5 = {5}, Т6 = {3,4}, которая, наряду с Т4 = {1, 2, 3, 4, 5}, задаёт алфавит источника X. Вероятности рт > 0 могут быть назначены произвольно. Заметим, что удаление изолированной вершины 4 не предусмотрено конструкцией теоремы 3 и не является обязательным, но позволяет упростить результат.
1
6
2
1
Рис. 1. Графы С (а) и С' (б)
6
2
5
3
5
3
4
а
5. Построение разложений на основе характеристического графа
Характеристический граф инвариантен относительно равносильных преобразований разложений и полностью определяет класс равносильности. Рассмотрим построение разложений, имеющих заданный характеристический граф.
Строку матрицы разложений будем считать тривиальной, если в неё входят булевы элементы не более одного из типов 0 и 1. Нетривиальную строку назовем стандартной, если самым левым булевым элементом строки является 0. Матрицу разложения будем считать нетривиальной, если в ней имеется хотя бы одна нетривиальная строка. Матрицу назовем стандартной, если все её строки стандартны и различны. Всякая нетривиальная матрица может быть эффективно преобразована в эквивалентную стандартную матрицу. Для этого сначала следует, как в лемме 3, исключить тривиальные строки, затем проинвертировать строки, в которых самым левым булевым элементом является 1, после чего удалить с помощью 5° повторяющиеся строки.
Тривиальные матрицы разложений, и только они, обладают пустым характеристическим графом. Дальше будем считать граф непустым и матрицу нетривиальной. Более того, поскольку при стандартизации матриц число строк не увеличивается (а
мы будем стремиться к уменьшению числа строк), ограничимся рассмотрением стандартных матриц.
Напомним некоторые понятия из теории графов. Граф называется двудольным, если множество его вершин можно разбить на два непустых подмножества (доли) так, что каждое ребро графа соединяет вершины из разных долей. Двудольный граф называется полным, если каждая пара вершин, принадлежащих разным долям, соединена ребром. Всякий полный двудольный подграф графа называется его бикликой.
Введём отображение Г, сопоставляющее всякому полному двудольному графу Н с не более чем п вершинами, которым приписаны числа (номера), образующие некоторое подмножество множества N = {1,...,п}, стандартную строку Г(Н) = Л = = (Л1,... , Лп). Для этого обозначим доли вершин двудольного графа Н через и и V так, чтобы вершина с наименьшим номером принадлежала доле и, и положим Лг = 0 для г € и, Лг = 1 для г € V, Лг = * для г € N \ (и и V) (дальше вершины и их номера не различаем). Очевидно, что Г взаимно однозначно отображает множество всех двудольных графов (с не более чем п вершинами, нумерованными числами из N) на множество стандартных строк (длины п).
Системе Н = {Н1,... , Н8} различных двудольных графов поставим в соответствие стандартную матрицу Л = Г(Н), образованную строками Л(г) = Г(Нг), г = 1,... , в. Напомним, что мы различаем матрицы с точностью до перестановок строк.
Теорема 4. Пусть Ко — класс равносильности матриц разложения, ассоциированный с характеристическим графом О. Имеют место следующие утверждения:
1) Если некоторая система Н биклик графа О образует его покрытие, то стандартная матрица Л = Г(Н) принадлежит классу Ко.
2) Отображение Г задает для любого О взаимно однозначное соответствие между покрытиями графа О бикликамими и стандартными матрицами класса Ко.
Доказательство.
1. Пусть Н = {Н1,... , Н8}. Поскольку Н — покрытие графа О, выполнено Н1 и и ... и Н8 = О. Стандартная матрица Л = Г(Н) образована строками Л(г) = Г(Нг), г = 1,... , в. Рассматривая строку Л(г) как матрицу, свяжем с ней характеристический граф Ох(Л(г)). Он представляет собой полный двудольный граф, доли которого образованы номерами нулевых и номерами единичных разрядов строки Л(г), а потому
Ох(Л(г)) = Нг. С учётом этого имеем ОХ(Л) = у Ох(Л(г)) = и Нг = О. Это означает
г=1 г=1
Л € Ко.
2. Докажем взаимную однозначность отображения Г при любом О.
Из того, что в применении к полным двудольным графам Н отображение Г(Н) взаимно однозначно, следует, что для разных систем Н таких графов стандартные матрицы Л = Г(Н) различны.
Осталось установить, что всякая стандартная матрица Л € Ко является образом Г(Н) некоторого покрытия Н графа О бикликами. Пусть матрица Л образована строками Л(г), г = 1,...,в. Введём полные двудольные графы Нг = Г-1(Л(г)); для них Л(г) = Г (Нг). При доказательстве п. 1 теоремы показано, что тогда ОХ(Л(г)) = Нг.
С учётом этого и Л € Ко имеем О = ОХ(Л) = и ОХ(Л(г)) = и Нг. Это означает, что
г=1 г=1
система Н образует покрытие графа О. Остаётся заметить, что Л = Г(Н). ■
Метод построения матрицы разложения по характеристическому графу проиллюстрируем примером.
Пример 2. Построим одну из стандартных матриц, соответствующих графу С, представленному на рис. 1, а. В качестве покрытия графа С бикликами возьмём, например,
С = ({2,6} х {3, 5}) и ({5} х {1, 2, 6}),
где и х V = {(м,^) : и е и, V е V} — полный двудольный граф с долями и и V. Стандартная матрица Л', сопоставленная этому покрытию по теореме 4, имеет вид
1 2 3 4 5 6 0 1 * 1 0".
0 0 * * 10
Укажем источник X', соответствующий разложению, представленному матрицей Л', и имеющий тот же основной алфавит, что и X. Метод его построения, обоснование которого мы опускаем, состоит из следующих этапов:
1. Каждой строке Л' (г) матрицы Л' сопоставляется множество и (г) —объединение множеств 7}, соответствующих единичным разрядам Л} (г) этой строки, где множества 7} относятся к источнику X. В рассматриваемом случае и(1) = Т3 и Т5 = {2,5}, и (2)= Т5 = {5}.
2. С каждым множеством и(г) связывается его характеристическая строка (имеющая 1 в разрядах, принадлежащих и (г)) и из этих строк образуется матрица Л0. Она является матрицей разложения символов основного алфавита, согласованной с матрицей разложения Л'. В данном случае матрица Л0 имеет вид
1 2 3 4 5
0 10 0 1.
0 0 0 0 1
3. Строится система множеств Т}', задающая алфавит аппроксимирующего источника X'. Множество Т}' образуется номерами тех столбцов матрицы Л0, которые доопределяют столбец Л}. В рассматриваемом случае возникает система множеств Т1 = {1,2,3,4}, Т2 = {1,3,4}, Т3 = {2,5}, Т4 = {1,2,3,4,5}, Т5 = {5}, 7 = {1,3,4}. Непосредственно видно, что она связана с системой множеств для источника X соотношениями 7} С Т}', означающими, что источник X' слабее X. Поскольку X' реализует (нижнюю) аппроксимацию источника X, он является сильнейшим из разделимых источников, система множеств которых обладает указанным свойством.
6. Минимизация разложений
Под сложностью разложения будем понимать число в двоичных источников, входящих в разложение. Задача минимизации разложений состоит в том, чтобы по заданному разложению и числу в узнать, существует ли равносильное разложение в произведение не более в источников. Задача о минимальной аппроксимации ставится как задача выяснения по недоопределённому источнику X и числу в, существует ли для X аппроксимирующее разложение, сложность которого не выше в.
В этих постановках ответ не зависит от значений ненулевых вероятностей. Поэтому, исключив вероятности из рассмотрения, будем вместо разложений говорить о матрицах разложений, а вместо источников — об их алфавите (либо системе множеств, задающих алфавит).
Теорема 5. Задача минимизации разложений и задача о минимальной аппроксимации недоопределённых источников NP-полны.
Доказательство. NP-полноту этих задач установим путём сведения к ним NP-полной задачи о покрытии графа бикликами [9, 10]. Она состоит в том, чтобы по графу G и числу s узнать, существует ли для G покрытие, образованное не более s бикликами.
Сведение к задаче минимизации разложений осуществляется путём покрытия графа G какой-либо системой биклик (например, биклик Si, образованных всеми рёбрами, инцидентными вершинам i) и построению по этому покрытию стандартной матрицы Л методом теоремы 4. Из теоремы 4 следует, что граф G может быть покрыт не более s бикликами тогда и только тогда, когда существует матрица с не более s строками, равносильная матрице Л.
Для сведения к задаче о минимальной аппроксимации достаточно построить методом теоремы 3 источник X, для которого GXpp(X) = G. Из теорем 3 и 4 следует, что граф G может быть покрыт не более s бикликами тогда и только тогда, когда существует аппроксимирующее разложение источника X, имеющее сложность не выше s. Теорема доказана. ■
Ясно, что задачи минимизации разложений и о минимальной аппроксимации источника также полиномиально сводятся к задаче покрытия графа бикликами, а потому полиномиально эквивалентны ей. Дальше будем вести речь только о покрытии графа бикликами. В [11] рассматривается вопрос о возможности решения с полиномиальной сложностью задачи о покрытии графа не более s бикликами при малых значениях s. Методами параметризованной сложности установлено, что при s = const эта задача допускает решение со сложностью O(f (s) + n3). Но полученное в работе значение f (s) = 32s +3s исключает реальное применение этого результата в приложениях.
В связи с NP-полнотой представляют интерес и неполиномиальные достаточно экономные методы решения задачи покрытия бикликами. При построении наилучших покрытий можно ограничиться максимальными (по включению) бикликами. Поэтому задача покрытия будет решаться в два этапа, на первом из которых будут найдены все максимальные биклики графа, а на втором — осуществлено покрытию ими графа.
Опишем первый этап. Пусть задан граф G. Ребру этого графа, соединяющему вершины u и v, сопоставим двумерную точку (u,v), u < v, и множество этих точек обозначим через G. Для полного двудольного графа H с долями U и V будем наряду с H использовать задание посредством множества точек H = U х V = {(u,v) : u Е U,v Е V}, которое назовём прямоугольником. В вырожденных случаях, когда какое-либо из множеств U и V одноэлементно, также будем говорить о прямоугольниках. Прямоугольник H допустим, если H С G.
Прямоугольники U х V и V х U будем называть сопряжёнными. Скажем, что прямоугольник H\ = Ui х Vi поглощает прямоугольник H2 = U2 х V2, если Ui ^ U2 и Vi ^ V2, и что Hi сопряжённо поглощает H2, если Ui ^ V2 и Vi ^ U2. Допустимый прямоугольник H назовём максимальным, если любой допустимый прямоугольник, поглощающий H, совпадает с ним. Отметим, что для пары сопряжённых прямоугольников Hi и H2 множества Hi и H2 совпадают, а потому, если один из них допустим (либо максимален), то и второй прямоугольник допустим (максимален).
Некоторое множество максимальных прямоугольников назовём представительным, если всякий максимальный прямоугольник либо сам содержится в этом мно-
жестве, либо в нём содержится сопряжённый ему прямоугольник (но не оба). Совокупность Н1,..., Н биклик образует покрытие графа С, если Н1 и ... и Н3 = С. Покрытие с наименьшим возможным значением в называется минимальным. Ясно, что при построении минимального покрытия можно ограничиться прямоугольниками, входящими в любое представительное множество.
Алгоритм построения представительного множества максимальных прямоугольников использует операцию о Я2 композиции прямоугольников, которая по = и1 х V и Я2 = и2 х V строит пряоугольник
#1 о Я2 = (и и и2) х (V! п V2).
Композиция допустимых прямоугольников даёт допустимый прямоугольник, ибо если прямоугольники и1 х V и и2 х V; допустимы, то допустимыми являются и1 х (V П V2) и и2 х (VП , а потому прямоугольник (и1 и и2) х (V П V2) также допустим. С каждой вершиной г (1 ^ г ^ п) графа С свяжем допустимый прямоугольник 5 = {г} х где — множество номеров всех вершин, смежных с г.
Алгоритм состоит из п основных этапов и заключительного. Результатом этапа г (1 ^ г ^ п) является некоторое множество прямоугольников, обозначаемое Пг.
Этап 1. Образуем множество П1, состоящее из единственного прямоугольника 51.
Этап г (2 ^ г ^ п). К множеству Пг-1 добавляем прямоугольник ¿»¿. Затем последовательно образуем (в каком-либо порядке) прямоугольники Но 5 = их V, Яе Пг-1, и присоединяем к множеству те из них, в которых IV| ^ 2, где | • | —мощность множества, и для которых нет поглощающего прямоугольника среди включённых в множество к данному моменту. Множество Пг является результатом этой процедуры и последующего удаления поглощаемых прямоугольников.
Заключительный этап. Путём удаления из Пп всех сопряжённо поглощаемых прямоугольников получаем множество П, считающееся результатом алгоритма.
Утверждение 4. Результатом работы алгоритма является представительное множество максимальных прямоугольников.
Доказательство. Сначала индукцией по г покажем, что для любого допустимого прямоугольника Н = и х V, у которого все элементы множества и не превосходят г и IV| ^ 2, в множестве Пг имеется прямоугольник, поглощающий Н.
Основание индукции г = 1. Если допустимый прямоугольник Н = и х V удовлетворяет указанным условиям при г = 1, то и = {1} и V С Ж1, а потому Н поглощается прямоугольником 51 е П1.
Индукционный шаг г ^ 2. Предположим, что множество Пг-1 обладает требуемым свойством. Рассмотрим произвольный допустимый прямоугольник Н = и х V, для которого максимальным элементом множества и является г и IV | ^ 2.
Если и \ {г} = 0, то Н поглощается прямоугольником 5 е Пг либо поглотившим его прямоугольником в случае, когда 5 был удалён из Пг как поглощенный.
Пусть теперь и \ {г} = и1 = 0. Прямоугольник Н1 = и1 х V допустим и элементы множества и1 не превосходят г — 1. По предположению индукции он поглощается некоторым прямоугольником Я2 = и2 х е Пг-1. В соответствии с алгоритмом образуем композицию Нз = Я2 о ¿¿. В силу и2 и {г} Э и1 и {г} = и и V; П Ж Э V П Ж = V, прямоугольник Н3 поглощает Н. В Пг содержится либо Я3, либо поглотивший его прямоугольник, который поглощает и Н. Индукция завершена.
При г = п заключаем, что для любого допустимого прямоугольника и х V с IV| ^ 2 в Пп имеется поглощающий его прямоугольник. В частности, там имеются все максимальные прямоугольники и х V с IV| ^ 2. Поскольку в Пп отсутствуют поглощения,
немаксимальных прямоугольников там нет. Если существует максимальный прямоугольник вида и х {г}, то сопряжённый прямоугольник {г} х и также максимален и в силу условия и С обязан совпасть с Последний, будучи максимальным, содержится в Пп. Множество П представительно, поскольку на заключительном этапе алгоритма устранены сопряжённые поглощения. ■
Пусть результатом работы алгоритма является система прямоугольников П = = {Н1,... , Нк }. От прямоугольников Нг следует перейти к множествам Нг и решить задачу минимального покрытия множества О множествами Н1,... , Нк. Для этого можно применять любые методы решения задач покрытия. Воспользуемся некоторой модификацией метода Яблонского [12] в сочетании с градиентной процедурой [13] (жадным алгоритмом). Опишем, в чём состоит эта модификация.
Напомним, что при решении задачи покрытия множества А = {а1,..., ап} наименьшим числом множеств В^ из заданной системы {В1,... , В к}, В1 и... и Вк = А, методом Яблонского с каждым множеством Bj связывается булева переменная Ь^ и элементам аг € А ставятся в соответствие дизъюнкции Вг = Ьj1 V ... V Ьjp, где Bj1,..., Bjp — все множества системы, покрывающие аг. Образуется функция ... Вп, которая затем путём раскрытия скобок с использованием булевых эквивалентностей преобразуется в выражение Г = Ьи1 ... Ьи , в котором отсутствуют поглощения конъюнкций.
П1,...,ид
Каждой конъюнкции Ьи1 ... Ьиг4 этого выражения соответствует тупиковое (безызбыточное) покрытие Ви1 и ... и Вид = А, и наоборот [12]. Наилучшие покрытия соответствуют конъюнкциям наименьшей длины.
Задавшись натуральным параметром I, модифицируем эту процедуру так, чтобы она давала дизъюнкцию Г |г всех тех конъюнкций из Г, длина которых не превосходит I. Для этого при последовательном раскрытии скобок в произведении В1... Вп будем руководствоваться правилом (В1... Di)|l = (((В1... Дг-1)|гОг)|г, т. е. после каждого шага г будем отбрасывать конъюнкции, имеющие длину больше I. Если в качестве I взять какую-либо верхнюю оценку длины минимального покрытия, то самые короткие конъюнкции функции Г|г будут соответствовать минимальным покрытиям.
Для получения оценки I длины покрытия можно воспользоваться градиентной процедурой. В терминах произведения В1... Вп она состоит в том, что на каждом шаге выбирается переменная, участвующая в наибольшем числе дизъюнкций, не исключённых на предыдущих шагах, и содержащие её дизъюнкции исключаются. Процедура завершается после исключения всех дизъюнкций; значение I равно числу выбранных в течение процедуры переменных. Градиентная процедура эффективна и обеспечивает достаточно хорошую оценку размера покрытия [13].
Пример 3. Проиллюстрируем все этапы построения наилучшего по сложности аппроксимирующего разложения заданного источника. Чтобы сравнить подход, развитый в данной работе, с методом из [2], рассмотрим тот же пример, что ив [2].
Пусть М = {1, 2, 3, 4,5, 6} и допустимы множества Т1 = {1, 2}, Т2 = {2, 3}, Т3 = = {3, 4}, Т4 = {4, 5}, Т5 = {5, 6} и Т6 = {1, 6}, т.е. алфавитом источника X является А = {а12,а23,а34,а45,а56,а1в}. Значения вероятностей символов несущественны и их указывать не будем.
Методом теоремы 2 построим характеристический граф О^Р(Х) аппроксимирующих разложений источника X (рис. 2).
Построение минимального аппроксимирующего разложения источника X в соответствии с теоремой 4 требует наилучшего покрытия графа О = ОХрр(Х) биклика-ми. Для решения этой задачи сначала методом утверждения 4 найдём представитель-
4
Рис. 2. Характеристический граф СХРР(Х)
ное множество максимальных прямоугольников. Исходными для алгоритма являются прямоугольники
¿1 = {1} х {3, 4,5}, & = {2} х {4, 5, 6}, 4 = {3} х {1,5, 6}, & = {4} х {1, 2,6}, ¿5 = {5} х {1, 2, 3}, ¿6 = {6} х {2, 3, 4},
связанные с вершинами графа С. В результате этапов г, г = 1,..., 6, работы алгоритма возникают системы прямоугольников П^, где П1 = {&},
П = П1 и {¿2, Я\}, Я\ = ¿2 ° ¿1 = {1, 2} х {4, 5}, Пз = П2 и {¿з, Я2}, Я2 = ¿3 ° ¿2 = {2, 3} х {5, 6}, П4 = Пз и {¿4, Яз}, Яз = ¿4 ° ¿з = {3, 4} х {1, 6}, П5 = П4 и {¿5, Я4}, Я4 = ¿5 ° ¿4 = {4, 5} х {1, 2},
Пб = П5 и {¿6, Я5, Яб}, Я5 = ¿6 ° ¿1 = {1, 6} х {3, 4}, Яб = Я ° ¿5 = {5, 6} х {2, 3}. Устранив из результирующего множества П6 = {¿1,... , ¿б, Я1,... , Я6} сопряжённо покрываемые прямоугольники Я4, Н5, Н6, придём к представительному множеству П = {¿1,... , ¿6, Я1, Я2, Яз}. Задача свелась к наилучшему покрытию множества точек С = {(1, 3), (1,4), (1, 5), (2, 4), (2, 5), (2, 6), (3,5), (3, 6), (4, 6)} множествами системы {б!,..., ¿56, н.1, Н2, Нз
Множествам и Я., сопоставим булевы переменные 5^ и Л и с каждой точкой (м,^) Е С свяжем дизъюнкцию переменных, соответствующх множествам, покрывающим эту точку (так, например, Д1з = 51 V 5з V Л2). Образуем произведение
(¿1 V 5з V ^з)(в1 V 54 V Л V ^з)(31 V 55 V ^)(52 V 54 V ^)(52 V 55 V Л V ^)Л
Л(52 V 56 V Лз)(5з V 55 V ^)(5з V 56 V ^ V Лз)(54 V 56 V Лз) ()
этих дизъюнкций.
Применением градиентной процедуры оценим сверху размер минимального покрытия. В данном примере одним из возможных результатов процедуры является последовательность переменных Л1,56,5з, и, таким образом, можно в модифицированной процедуре взять I = 3.
Приведём результаты раскрытия скобок в (5) с удалением конъюнкций, длина которых превышает 3. В строке г, г = 1,..., 9, помещён результат раскрытия первых г скобок:
1) в1 V вз V кз;
2) в1 V в3в4 V в3к1 V к3;
3) в1 V в3в4в5 V в5к3 V в3к1 V к1 к3;
4) в1в2 V в2в5к3 V в1в4 V в3в4в5 V в4в5к3 V в1к1 V в3к1 V к1к3;
5) в1в2 V в2в5к3 V в1в4в5 V в3в4в5 V в4в5к3 V в1к1 V в3к1 V к1к3 V в1в4к2;
6) в1в2Vв2в5к3Vв2в3к1Vв2к1к3Vв1в6к1Vв3в6к^вв^к^в1к1к2Vв3к1к2Vк1к2к3Vв1в4к2;
7) в1в2вз V в2взк1 V взввк V в1в2в5 V в2в5кз V в1в2к2 V в1к1к2 V взк^2 V к1к2кз V в1в4к2;
8) в1в2вз V в2взк1 V взввк V в2в5кз V в1в2к2 V в1к1к2 V взк^2 V к1к2кз V в1в4к2;
9) в1в4к2 V взввк1 V в2в5кз V к1к2кз.
Из последней строки, содержащей выражение Г|3, видно, что имеются четыре минимальных покрытия (их размер равен 3). Отметим, что и градиентное покрытие оказалось в данном случае минимальным.
Для построения минимального аппроксимирующего разложения воспользуемся, например, покрытием
О = 5 и 5*4 и Н2 = ({1} х {3,4,5}) и ({4} х {1, 2,6}) и ({2, 3} х {5,6}),
представленным первой конъюнкцией строки 9. Стандартная матрица, сопоставленная этому покрытию по теореме 4, имеет вид
1 2 3 4 5 6 0 * 111 *
00 * 1 * о . () *00*11
Она задаёт одно из минимальных аппроксимирующих разложений рассматриваемого источника.
Методом, описанным в примере 2, построим аппроксимирующий источник X', основной алфавит которого совпадает с основным алфавитом источника X. Построение включает следующие этапы:
1. Каждой строке г, г = 1, 2, 3, матрицы разложения (6) сопоставляется множество и (г) —объединение множеств Т, соответствующих единичным разрядам этой строки. В данном случае и(1) = Т3 и Т4 и Т5 = {3, 4, 5, 6}, и(2) = Т4 = {4, 5}, и(3) = Т5 и Т6 = = {1, 5, 6}.
2. Строится матрица Л0 кодирования символов основного алфавита, образованная характеристическими строками множеств и (г). Она имеет вид
1 2 3 4 5 6
0 0 1 1 1 Г 0 0 0 1 1 0.
1 0 0 0 1 1
3. Находится система множеств Т', задающая алфавит аппроксимирующего источника X', где множество Т' образуется номерами тех столбцов матрицы Л0, которые доопределяют столбец ] матрицы (6). В рассматриваемом случае возникает система множеств Т1 = {1, 2}, Т2 = {2, 3}, Т3 = {3, 4}, Т4 = {4, 5}, Т5 = {5, 6}, Т'& = {1,6}. Эта система совпадает с системой множеств Т1,... ,Т6 для исходного источника X. Равенство X' = X означает, что источник X разложим и матрица (6) задаёт его минимальное разложение.
Тот же пример рассматривался в работе [2], в которой путём преобразования матриц разложения было найдено одно из минимальных аппроксимирующих разложений. Но это потребовало применения эвристических соображений, интуиции, перебора. Развитая в данной работе техника, базирующаяся на характеристических графах, позволила регулярным методом найти все минимальные аппроксимирующие разложения.
Заключение
В работе рассмотрена задача разложения недоопределённых источников общего вида в произведение недоопределённых двоичных источников. Точное разложение существует не всегда, но всегда имеется лучшее аппроксимирующее разложение, которое для источников, допускающих точное разложение, является точным. Все аппроксимации заданного источника равносильны и образуют класс равносильности разложений. Ставится задача построения аппроксимирующего разложения, имеющего минимальную сложность, т. е. образованного минимальным числом сомножителей.
В [2] предложен полиномиальный алгоритм построения по источнику одного из его аппроксимирующих разложений, а также найдена полная система равносильных преобразований, позволяющая по одному разложению строить другие. Но это не даёт возможности направленного упрощения разложений и, тем более, их минимизации.
Эту проблему позволяет решить техника, развитая в данной работе. В ней с каждым разложением связывается граф, названный характеристическим. Установлено, что характеристический граф инвариантен к равносильным преобразованиям разложений и однозначно определяет класс равносильности. Зная какое-либо разложение из этого класса, можно, найдя по нему характеристический граф, получить доступ ко всему классу. Любому разложению из класса равносильности соответствует покрытие характеристического графа полными двудольными подграфами (бикликами), причём соответствие между разложениями и покрытиями взаимно однозначно с точностью до некоторой стандартизации разложений. Наилучшее покрытие характеристического графа бикликами решает задачу построения минимального разложения.
Но задача покрытия графа бикликами, а вместе с ней и задача минимизации разложений КР-полны. Покрытие графа бикликами сводится к покрытию двумерного дискретного точечного множества прямоугольниками и позволяет использовать известные приближённые либо точные (при малых размерностях) методы решения задач на покрытие. В работе описано применение для этой цели модификации метода Яблонского.
Отметим, что все построения, связанные с нахождением и минимизацией аппроксимирующего разложения источника, реализуемы в терминах введённого инварианта — характеристического графа. Сам граф находится непосредственно по источнику и все дальнейшие действия выполняются посредством операций над графами. Разложения в виде матриц используются лишь для представления ответа.
ЛИТЕРАТУРА
1. Шоломов Л. А. О понятии равносильности недоопределённых алфавитов // Прикладная дискретная математика. 2014. №3(25). С. 40-57.
2. Шоломов Л. А. Разложение недоопределенных данных // Дискретный анализ и исследование операций. 2012. Т. 19. №6. С. 72-98.
3. Галлагер Р. Теория информации и надежная связь. М.: Сов. радио, 1974. 720 с.
4. Шоломов Л. А. Элементы теории недоопределённой информации // Прикладная дискретная математика. Приложение. 2009. №2. С. 18-42.
5. Потапов В. Н. Введение в теорию информации. Ижевск: РХД, 2014. 152 с.
6. Шоломов Л. А. Преобразование нечетких данных с сохранением информационных свойств // Дискретный анализ и исследование операций. Сер 1. 2005. Т. 12. № 3. С. 85-104.
7. Шоломов Л. А. О сводимости алфавитов в задачах кодирования недоопределенных данных // Доклады Академии наук. 2015. Т. 460. №1. С. 26-29.
8. Харари Ф. Теория графов. М.: Мир, 1973. 300 с.
9. Orlin J. Contentment in graph theory: Coverings graphs with cliques // Nederlandce Akademie Wetenschappen Proc. Ser. A 80. Indiagationes Mathematcae. 1977. V. 39. No. 5. P. 406-424.
10. Muller J. On edge perfectness and classes of bipartite graphs // Discrete Mathematics. 1996. V. 149. No. 1-3. P. 159-187.
11. Flischner H, Majuni E, PaulusmaD., and Szeider S. Covering graphs with few complete bipartite subgraphs // Theor. Computer Sci. 2009. V.410. P. 2045-2053.
12. Чегис И. А., Яблонский С. В. Логические способы контроля электрических схем // Труды МИАН им. В. А. Стеклова. 1958. Т. 51. С. 270-360.
13. Нигматуллин Р. Г. Сложность булевых функций. М.: Наука, 1991. 240 с.
REFERENCES
1. Sholomov L. A. O ponyatii ravnosilnosti nedoopredelennyh alfavitov [On the concept of underdetermined alphabets of equal strength]. Prikladnaya Diskretnaya Matematika, 2014, no. 3(25), pp. 40-57. (in Russian)
2. Sholomov L. A. Decomposition of underdetermined data. J. Appl. Industr. Math., 2013, vol. 7, no. 1, pp.100-116.
3. Gallager R. G. Information Theory and Reliable Communication. New York, Wiley, 1968. 608 p.
4. Sholomov L. A. Elementy teorii nedoopredelennoy informatsii [Elements of the underdetermined information theory]. Prikladnaya Diskretnaya Matematika. Prilozhenie, 2009, no. 2, pp. 18-42. (in Russian)
5. Potapov V.N. Vvedenie v teoriyu informatsii [Introduction to Information Theory]. Izhevsk, RHD, 2014. 152 p. (in Russian)
6. Sholomov L. A. Preobrazovanie nechetkih dannyh s sohraneniem informatsionnih svoystv [Transformations of fuzzy data preserving information properties]. Diskretniy Analiz i Issledovanie Operatsiy, ser. 1, 2005, vol. 12, no.3, pp. 85-104. (in Russian)
7. Sholomov L. A. On the reducibility of alfabets for problems of underdetermined data coding. Doklady Mathematics, 2015, vol.91, no. 1, pp. 117-120.
8. Harary F. Graph Theory. London, Addison-Wesley, 1969. 274 p.
9. Orlin J. Contentment in graph theory: Coverings graphs with cliques. Nederlandce Akademie Wetenschappen Proc., ser. A80, Indiagationes Mathematcae, 1977, vol.39, no. 5, pp.406-424.
10. Muller J. On edge perfectness and classes of bipartite graphs. Discrete Mathematics, 1996, vol. 149, no. 1-3, pp. 159-187.
11. Flischner H, Majuni E, PaulusmaD., and Szeider S. Covering graphs with few complete bipartite subgraphs. Theor. Computer Sci., 2009, vol.410, pp.2045-2053.
12. Chegis I. A. and Yablonski S. V. Logicheskie spocobi kontrolya elektricheskih skhem [Logic methods for the electrical networks testing]. Trudy MIAN im. V. A. Steklova, 1958, vol. 51, pp. 270-360. (in Russian)
13. Nigmatullin R. G. Slozhnost bulevyh funktsiy [A Complexity of Boolean Functions]. Moscow, Nauka, 1991. 240 p. (in Russian)