ВЕСТНИК САНКТ-ПЕТЕРБУРГСКОГО УНИВЕРСИТЕТА
Сер. 10. 2009. Вып. 2
УДК 004.8 А. Л. Тулупьев
НЕПРОТИВОРЕЧИВОСТЬ ОЦЕНОК ВЕРОЯТНОСТЕЙ В ИДЕАЛАХ КОНЪЮНКТОВ И ДИЗЪЮНКТОВ*)
Введение. В искусственном интеллекте рассматривается ряд математических моделей баз фрагментов знаний с неопределенностью, среди которых особое место занимают вероятностные сети трех видов: марковские сети (МС), байесовские сети доверия (БСД) и алгебраические байесовские сети (АБС). Общая идея, заложенная в архитектуру и алгоритмы обработки указанных сетей, состоит в том, что знания о предметной области могут быть декомпозированы на достаточно небольшие фрагменты (фрагменты знаний, ФЗ), а фрагменты знаний могут быть связаны друг с другом, причем отдельно взятый ФЗ - лишь с небольшим числом других ФЗ. Связанные между собой фрагменты знаний образуют базу фрагментов знаний (БФЗ).
Внутри фрагментов могут быть с достаточной степенью детальности исследованы утверждения, в них вошедшие, и отношения между ними; затем уже учитываются отношения между ФЗ на уровне всей сети. Хотя логико-вероятностный вывод внутри каждого отдельного ФЗ может формально оказаться вычислительно сложным (например, сложность вычислений или требующийся объем данных может расти экспоненциально в зависимости от числа атомарных утверждений, вошедших в ФЗ), это обстоятельство нивелируется в силу изначального предположения о том, что любой ФЗ должен быть невелик по числу вошедших в него утверждений.
Набор основных операций логико-вероятностного вывода, которые применимы к вероятностным сетям, состоит из определения и поддержания непротиворечивости сети, априорного вывода (вывода не заданных напрямую оценок истинности утверждений по известным) и апостериорного вывода (распространения влияния свидетельства).
Вероятностные сети (МС, БСД, АБС) отличаются тем, какие математические модели рассматриваются для представления отдельного ФЗ и всей БФЗ, и тем, как формально определяются и осуществляются основные операции логико-вероятностного вывода в рамках выбранных математических моделей.
Целями настоящей статьи являются анализ идеала конъюнктов с оценками вероятности их истинности как математической модели ФЗ, использующейся в теории АБС, а также определение и исследование операций поддержания непротиворечивости и априорного вывода в рамках указанной модели.
Тулупьев Александр Львович — кандидат физико-математических наук, доцент кафедры информатики математико-механического факультета Санкт-Петербургского государственного университета, ведущий научный сотрудник СПИИРАН. Количество опубликованных работ: 133. Научные направления: представление и обработка данных и знаний с неопределенностью, применение методов математики и информатики в социокультурных исследованиях, применение методов биостатистики и математического моделирования в эпидемиологии, технология разработки программных комплексов с СУБД. E-mail: [email protected], [email protected].
+ ) Работа выполнена при финансовой поддержке Российского фонда фундаментальных исследований (грант № 09-01-00861-а).
© А. Л. Тулупьев, 2009
Определения. Пусть имеется алфавит - множество атомарных пропозициональных формул (атомарных пропозиций, атомов) А = {хо,... ,хт-1}, которые представляют собой простейшие высказывания о предметной области, истинность которых нам удается оценить. Введем обозначение аргументного места (или литерала, что является синонимом) х. Аргументное место может принимать одно из двух значений х € {х, х}, где х € А, а х - его логическое отрицание. Как было бы и в случае со случайной бинарной величиной х, для аргументного места х положительным означиванием считается х, а отрицательным - х. Набор всех возможных пропозициональных формул (конечной длины) над А обозначим Г° = Г° (А), а набор квантов - цепочек конъюнкций аргументных мест максимальной длины т со всеми возможными означиваниями, назовем Q = Q(A) = {хохх ...хт-1}. Символ операции конъюнкции Л в цепочках, мы, как правило, будем опускать. Здесь и далее рассматриваем, на самом деле, классы формул, т. е. работаем с фактор-множеством
Г = Г (А) = Г °(А)/ = .
Фактор-множество Г состоит из классов пропозициональных формул, построенных над алфавитом А, в один класс попадают эквивалентные формулы. В частности, мы не различаем цепочки конъюнкций с одинаковым набором аргументных мест и/или атомарных пропозициональных формул. По умолчанию считаем, что пустая конъюнкция эквивалентна тождественной истине: ед = Т.
Идеалом конъюнктов (идеал положительно-означенных цепочек конъюнкций атомарных пропозициональных формул) над заданным множеством атомарных формул назовем
С = С (А) = |х^ х^ ...х^к : (гь г2, ...гк) € 20(1)(т-1), к € 0(1)т} .
Запись ё,1^2)^, где все ] € Ж, здесь и далее означает, что рассматриваем множество целых чисел {г € Ж : с],1 ^ г ^ Сз, г = с],1 + Ьс],2, Ь € Ж,Ь ^ 0} , а запись г = )Сз или
г € ]1(с],2 )Сз - что индекс г принадлежит соответствующему множеству или, при ином прочтении (но с тем же смыслом), «пробегает» целые числа от с],1 до Сз с шагом ]2.
Частичный порядок на идеале обусловлен отношением вхождения цепочек друг в друга; здесь существенно отметить, что вхождение определяется для множеств атомарных пропозиций, составляющих соответствующие цепочки. Более глубоко со свойствами идеала можно познакомиться в [1].
Идеал дизъюнктов - все положительно-означенные цепочки дизъюнкций атомарных пропозициональных формул
Су = Су (А) = {х^ V х^ V ... V х^к : (гьг2, ...ги) € 20(1)(т-1), к € 0(1)т} .
При переходе к матрично-векторному языку нам понадобится упорядочить конъюнкты и кванты. Для этого на множестве квантов и конъюнктов требуется ввести перенумерацию. Вопросы перенумерации были детально рассмотрены в [2, 3], здесь же приведем таблицу, позволяющую на интуитивном уровне освоить правила сопоставления номера, кванта и конъюнкта. Идея перенумерации заключается в том, что положительное вхождение атома х^ в квант или конъюнкт с номером к соответствует единице на соответствующей (г-й) позиции в двоичной записи числа к. В таблице используется обозначение [т]2 - двоичная запись неотрицательного целого числа то < 2Г, состоящая ровно из г двоичных цифр, т. е. (0 „ . 0)2 ^ то = [то]^ ^ (1 1)2-
Г Г
Обратим внимание, что в двоичной записи присутствует нужное количество ведущих нулей, если это необходимо. С числом, представленным в такой форме, можно выполнять побитовые логические операции. Нижний индекс в записи [т]2 будем, как правило, опускать: [т]г.
Перенумерация квантов и конъюнктов
Нумерация А = {хі} А = {хі, ж2} А = {хі,х2,хз}
№ю Ю \щ* Я АО Я А° я А°
0 02 0002 XI ЄЛ Х2Х1 ел ХЗХ2Х1 ел
1 І2 00І2 XI XI Х2Х\ XI Х3Х2Х1 XI
2 ю2 ою2 Х2Х\ Х2 Х3Х2Х1 Х2
3 1І2 0112 Х2Х\ Х2Хі Х3Х2Х1 Х2Х\
4 юо2 юо2 Х3Х2Х! х3
5 1012 1012 Х3Х2Х1 Х3Х!
6 1102 1102 Х3Х2Х1 Х3Х2
7 1112 1112 Х3Х2Х1 Х3Х2Х1
Краткая запись Х[і] будет обозначать і-й квант, а (АХ)[г] - г-й конъюнкт, где кванты и конъюнкты строятся над атомарными пропозициями из цепочки X. Разумеется, здесь необходимо договориться о порядке следования элементов - при перенумерации для удобства считается, что атомы в цепочках конъюнкций следуют в порядке, обратном алфавитному.
Определим понятие вероятности над пропозициональными формулами. Строгое изложение подхода Н. Нильссона (его оригинальный вклад - [4, 5], последующие формализации других авторов - [6, 7]) к введению вероятности на пропозициональных формулах Г (А) основывается на теореме о СДНФ. Формализация, предложенная группой Хальперна, Фаджина и Меджидо, будет ниже изложена с упрощениями; на русском языке она с достаточной полнотой представлена в [8].
Рассмотрим набор всех квантов Q как множество элементарных событий (или множество возможных миров). Зададим на нем исходное распределение вероятностей (дискретную плотность вероятности) р° : Q —> [0; 1] такое, что
У Є Q) р°(д) > 0, (1)
Е Р°(Ч) = 1- (2)
Введем вероятность р : 2Я —> [0; 1] следующим образом: (У Б С Q) р(Б) = ^ р°(ч).
На этом шаге было получено вероятностное пространство ^, 2Я ,р). Определим вероятностную меру на множестве Г так: (У/ Є Г) р(/) = р(Б(Г)).
Взяв за основу такое распространение вероятности на множество пропозициональных формул, получим новое вероятностное пространство: ^,Г,р). Эта [упрощенная] структура вероятностного пространства по Н. Нильссону задает вероятность над всеми пропозициями, построенными над множеством атомарных формул А.
Исходя из вышеописанного способа введения вероятности на пропозициональных формулах, имеем р(Т) = 1 и р(¥) = 0, что согласуется с нашими интуитивными представлениями.
В ряде доказательств удобнее оперировать не вероятностями конъюнкций, а вероятностями над случайными бинарными последовательностями (СБП). При этом вероятность, заданная над конъюнциями в соответствии с вероятностной логикой,
и вероятность, определенная на случайной бинарной последовательностью, суть одна и та же.
Рассмотрим набор означиваний цепочки конъюнкций вида U = XY; соответствующая случайная бинарная последовательность U = XY принимает значения из этого набора. Предполагается, что X и Y как множества атомов не пересекаются. Обозначим подобное множество для СБП X через Set [X], тогда указанное выше условие примет вид Set [X] П Set [Y] = 0.
Строгой записью вероятности приобретения СБП U значений вида U была бы такая: p(U = U), но вместо нее станем применять сокращенный вариант p(U) везде, где это не будет вносить неясностей в изложение.
Во всех дальнейших определениях, если не оговорено иного, будем использовать случайные бинарные последовательности, соотносящиеся следующим образом:
Set [X] П Set [Y] = 0, Set [Y] П Set [Z] = 0, Set [Z] П Set [X] = 0,
U = XY, v = Y Z, W = XY Z.
Зная распределение вероятностей p(XY) над цепочкой XY - конъюнкцией непересе-кающихся подцепочек X и Y, можно получить индуцированное распределение вероятностей над любой подцепочкой. Такой переход называется операцией маргинализации или маргинализацией. Примером маргинализации при имеющихся обозначениях может послужить следующее суммирование: p(X) = p(XY).
Y
Пусть дано распределение вероятностей СБП p(XY). Если yX yY p(XY) = p(X)p(Y), то соответствующие СБП X, Y называются (вероятностно) независимыми.
Заметим, что СБП £Л все время приобретает единственное значение £Л. Эта СБП не зависит ни от какой другой, как, впрочем, никакая другая СБП от нее также не зависит; £Л соответствует достоверному событию в теории вероятностей и тождественной истине - в логике.
Пусть известно распределение вероятностей p(W). При заданных условиях СБП X и Z называются условно независимыми (относительно СБП Y), тогда и только тогда, когда справедливо утверждение: yW p(XYZ)p(Y) = p(XY)p(YZ).
Заметим, что если Y = еЛ, то из условной независимости следует независимость: p(XZ) = p(X)p(Z). Кроме того, при заданных условиях СБП X и Z условно независимы (относительно СБП Y) тогда и только тогда, когда справедливо следующее утверждение: yY (p(Y) = 0) ^ (p(XZjY) = p(X\Y)p(Z\Y)).
Рассмотрим теперь два набора бинарных последовательностей U и V, над каждым из которых задано соответствующее распределение вероятностейpi(U) и p2(V). Причем U = XY и V = YZ, а p\(Y) = p2(Y). Утверждается, что тогда над W = XYZ можно построить распределение вероятностей p(W) такое, что p(U) = pi(U) и p(V) = p2(V). Здесь следует напомнить, что YY обозначает одну и ту же последовательность аргументных мест, а когда она встречается в формуле, то во всех ее частях имеет место одно и то же означивание аргументной последовательности одновременно. Нужно также добавить, что, поскольку аргументные места поименованы, порядок их следования не важен, в вычислениях их можно располагать как угодно. Выразим и докажем эту мысль в теореме, но перед этим определим понятие композиции распределений вероятностей над цепочками конъюнкций.
Пусть даны два набора бинарных последовательностей U и V, над которыми указаны распределения вероятностей pi(U) и p2(U), и набор бинарных
последовательностей IV, соотносящиеся как приведено выше. Тогда распределение вероятностей р(]¥) будем называть композицией распределений вероятностей р\(й) и Р2(У).
Теорема. Распределение верояностей, заданное формулой
{0, если р\(У) = 0,
рх{ху)р2{уг) ,~г, /п (з)
--------------, если Р1{У) ф 0,
Р\\У)
является композицией распределений вероятностей р\(и) и р2(У) [8, 10].
Замечание 1. В знаменателе формулы (3) может стоять также вероятность р2(У), поскольку по условию теоремы она равна вероятности р\(У).
Фрагменты знаний. В теории АБС фрагмент знаний С со скалярными оценками вероятности определяется как упорядоченная пара {С,р), где С - идеал конъюнктов над подмножеством атомов Б = {хо,..., хт-\}, лежащий в основе ФЗ, а р - функция на С, задающая скалярные (точечные) оценки вероятностей: р : С —> [0; 1]. Значения этой функции на конъюнктах из С, упорядоченные согласно возрастанию индексов последних, как было описано выше [8, 11], записывают в виде вектора Р. Компоненты вектора нумеруются от 0 до 2т — 1. Следует обратить внимание, что в векторе Р его нулевой компонент Ро = 1, так как пустой конъюнкт соответствует тождественной истине.
Используя введенные векторные обозначения, тот же фрагмент знаний С со скалярными оценками можно рассмотреть и как пару {С, Р), состоящую из идеала конъюнктов и вектора скалярных оценок вероятности истинности этих конъюнктов.
Определим также альтернативную математическую модель фрагмента знаний, которая будет образована над идеалом дизъюнктов.
Фрагмент знаний над идеалом дизъюнктов Са со скалярными оценками вероятности определяется как упорядоченная пара {Су ,р), где Су - идеал дизъюнктов над подмножеством атомов Б, лежащий в основе ФЗ, а р - функция на Су, задающая скалярные оценки вероятностей: р : Су —> [0; 1]. Значения этой функции на дизъюнктах из Су, упорядоченные, как было описано выше, записывают в виде вектора О (иногда как Ра, а вероятности конъюнктов - как Рс). Компоненты вектора нумеруются от 0 до 2т — 1. Следует обратить внимание на то, что в векторе О его нулевой компонент Оо = 0, так как пустой дизъюнкт соответствует тождественной лжи.
Используя введенные векторные обозначения, тот же фрагмент знаний над идеалом дизъюнктов со скалярными оценками можно рассмотреть и как пару {Су, О), состоящую из идеала дизъюнктов и вектора скалярных оценок этих дизъюнктов.
Непротиворечивость фрагментов знаний. В теории АБС допускаются как рассмотренные выше скалярные оценки вероятностей конъюнктов (и дизъюнктов), так и интервальные.
Условия (1) и (2), накладываемые аксиоматикой вероятностной логики на вероятности квантов, не допускают произвольного назначения их оценок. Те же условия опосредованно накладывают существенные ограничения на возможности для назначения оценок вероятностей над идеалом конъюнктов, что требует четкого оформления понятия непротиворечивости (непротиворечивого) [12, 13] фрагмента знаний и исследования его свойств.
Для описания процессов проверки и подержания непротиворечивости необходимо ввести дополнительно ряд векторов и матриц.
Обозначим вектор, состоящий из 2т нулей, как 0т\ вектор той же размерности, состоящий из единиц, как 1т, единичную матрицу размерности 2т х 2т как Е(т). Если размерность будет очевидна из контекста, то верхний индекс в нулевом и единичном векторах, а также в нулевой и единичной матрицах будем опускать.
Пусть I
1 —
1 -1
0 1
г[т]
Л
1—
. Тогда для ш ^ 2 определим матрицы
порядка 2т: Іт — II ], Лт
ЛІт], где [т] означает кронекерову (или прямую) степень
матрицы. Матрицы 1т и Лт взаимно обратны: 1т х Лт = Лт х 1т = Е(т).
Пусть г, ] = 0(1)(2т — 1), г индексирует кванты, а ] - конъюнкты, тогда при выбранном подходе к перенумерации квантов и конъюнктов, а также на основе формулы включений-исключений в [2, 3] было показано, что
р(Х [з ])
р (4х )Н)
Е (і®®з)р{Нх)H)),
1)(2т \Лг
Е р(х 3
г=0(1)(2т-1),
(4)
(5)
і=0(1)(2т-1), г=гЛЛ^
где ЛЛ - логическая операция побитового «и», ®® - логическая операция побитового «исключающего или», а выражение ~ (г ® ®3) приобретает значение «1», если в числе-результате операции побитового «исключающего или» содержится четное число единичных битов, и «—1» - в противном случае.
По существу, выражения (4) и (5) - это один из способов записи формулы включений-исключений. Его особенность - удобство программной реализации, связанной с перенумерацией квантов и конъюнктов.
Заметим, что соотношения (4) и (5) являются линейными и позволяют выразить ^(т) через Р(т) и наоборот. Значит, каждому соотношению соответствует матрица линейного преобразования. Можно показать [14, 15], что 1т и Лт как раз такие:
Іт X Р(т) — Я
(т)
Лт X Я(т) — Р(т).
Здесь ограничимся лишь формулировками основных утверждений, встречающихся в процессе доказательства.
Утверждение 1’. Рассмотрим матрицу 1т и выражение (4). Пусть ] = 0(1)(2т — 1) индексирует столбцы матрицы (и конъюнкты), а г = 0(1)(2т — 1) - строки матрицы (и кванты), тогда элемент /) матрицы 1т, стоящий в ^’-й строке, г-м столбце, приобретает значение «нуль», когда справедливо ] = ] Л Лг.
Замечание 2. Это утверждение говорит о том, что в матрице 1т нулевые элементы появляются при тех же г и ], когда нулевые коэффициенты стояли бы в выражении (4). В формальной записи выражения (4) члены с нулевыми коэффициентами просто не входят в сумму.
Утверждение 1”. Рассмотрим матрицу 1т и выражение (4). Пусть ] = 0(1)(2т — 1) индексирует столбцы матрицы (и конъюнкты), а г = 0(1)(2т — 1) - строки матрицы (и кванты), тогда ненулевой элемент 1^™матрицы 1т, стоящий в ]-й строке, г-м столбце, приобретает значение «1», когда число ненулевых битов в (г ® ®3) четно, и « — 1» -иначе.
Введем обозначение
т(т) _ / 0, 3 = 3 Л Лг, (6)
^ _ \ - (3 ®®г), 3 = 3 ЛЛг. ()
Утверждение 1. Рассмотрим матрицу 1т. Пусть 3 = 0(1)(2т — 1) индексирует
столбцы матрицы, а г = 0(1)(2т — 1) - строки матрицы, тогда элемент 1^™) матрицы
1т, стоящий в 3-й строке, г-м столбце приобретает значение согласно (6).
В случае скалярных оценок вероятностей над множеством квантов требования аксиоматики вероятностной логики (1) и (2) в матрично-векторном виде выразятся таким образом:
д(т) ^ 0т,
^Ц(т), = 1.
Для проверки непротиворечивости назначения скалярных оценок вероятностей над идеалом конъюнктов сначала требуется перейти к вероятностям над квантами, а затем проверить, что получившиеся вероятности неотрицательны. Второе условие -условие нормировки - будет выполнено автоматически, поскольку
1 (т) =
±т х
1 —1
0 1
11
м
[т]
[т]
[т]
1 0 0
и соответственно
((1т X Р(т)) , 1<т^ = (Р(т), 1т X 1<т>)
Р(т)
\
1 0 0
I р(ел) \
\
/
1 0
V0)
1
\ . /
1 0
V0)
1.
В матричном виде условие «неотрицательности» (которое обозначается Е(т)) выражается следующим образом: тт х Р
(т) ^ о<т>. На основе сведений из предметной области над идеалом конъюнктов может быть задано множество (которое обозначается В(т)) исходных интервальных оценок вероятностей, представимое в векторном виде как Р0 ,(т) ^ Р(т) ^ Р+,(т), где Р0 ,(т) - вектор, составленный из констант - (исход-
ч ~ Т1+?(т)
ных) нижних границ вероятностей соответствующих конъюнктов, а Р0 - такой
же вектор, но содержащий верхние границы. Компоненты обоих векторов с нулевым индексом всегда равны единице. Объединение двух множеств ограничений, исходящих
х
т
1
X
0
из аксиоматики вероятностной логики и предметной области, имеет свое особое обозначение: М(т) = В(т) и Е(т). Решая для каждой формулы ] из идеала конъюнктов задачи линейного программирования (ЗЛП) вида
можно обнаружить либо несовместность системы ограничений М(т), и тогда признать
интервальные оценки вероятностей над идеалом противоречивыми, либо получить непротиворечивые уточненные оценки вероятностей каждого элемента идеала. Векторы, содержащие уточненные нижние и верхние оценки вероятностей, обозначаются
его можно восстановить из контекста. Задачи линейного программирования в векторных обозначениях запишутся таким образом:
Р- = шш { Р) , Р+ = тах { Р) ,
к к
где поиск минимума и максимума осуществляется почленно и независимо.
Введем дополнительно несколько обозначений:
Первый вектор будет состоять из 2т единиц, второй - из того же числа нулей, третий - из того же числа элементов, причем все будут нулевыми, кроме самого верхнего, четвертый - из того же числа элементов, причем все будут нулевыми, кроме самого нижнего. Согласно [11], в новых обозначениях можно записать Іт х 1т — 0т.
из нулей, но на ее второй главной диагонали располагаются единицы. Когда матрица такого вида воздействует на вектор соответствующей размерности, он «переворачивается», т. е. его элементы переходят на симметричные относительно середины вектора
Операция умножения Em X Qm равносильна замене означиваний литералов на противоположные в векторе вероятностей квантов Qm.
Определим Pт = lm - Pm; получившийся вектор содержит вероятность отрицания каждого конъюнкта или, по правилу де Моргана, вероятность каждого дизъюнкта, составленного из отрицаний атомов.
Далее индекс m и знак операции умножения матриц X будем иногда опускать, где возможно это сделать без потери смысла.
Пусть K = JEL Заметим, что K2 = E: K2 = JEIJEI = JEEI = JI = E^ Более того, справедливы равенства KP = P, KP = P^ Далее, по правилам де Моргана, имеют место соотношения l - P = D, l - D = P■ Таким образом, K (l - D) = P^
Для фрагмента знаний C = {C, P) задание скалярных оценок считается непротиворечивым [11], если IxP ^ 0^ Определим предикат Consistent [C], который истинен, когда фрагмент знаний (аргумент предиката) непротиворечив. В остальных случаях предикат принимает ложное значение. При необходимости для фрагментов знаний со скалярными и интервальными оценками вероятностей можно использовать более подробную запись Consistent [{C,p)] и Consistent [{C, p)] соответственно или запись с векторами оценок.
Р-.(т) и Р+-(т) соответственно. Отметим, что показатель (т) часто опускается, если
Получившаяся матрица Em состоит
позиции. Например: Eт X 0т = 0т, Eт X 0т = (0т■
Для фрагмента знаний Cd = {Cy, D) задание скалярных оценок считается непротиворечивым, если ID ^ 0. На языке введенных матрично-векторных обозначений это
условие непротиворечивости выводится следующим образом:
IK (1 - D) = IP = Q > 0, ^TJ^EI (1 - D) > 0, EI (1 - D) > 0,
E
I (1 - D) > 0, I1 - ID > 0, ID < I1, ID < 0.
Определим предикат Consistent [Cd\, который истинен, когда фрагмент знаний (аргумент предиката) непротиворечив; как и в предыдущем случае, можно рассмотреть те же альтернативные записи аргумента предиката.
В случае системы интервальных оценок истинности в идеале дизъюнктов для проверки и поддержания непротиворечивости можно сформировать задачи линейного программирования, сходные с теми, которые приходится решать в случае идеала конъюнктов.
Когда сведения относительно одного и того же небольшого набора утверждений поступают из разных источников, над одним и тем же идеалом конъюнктов может быть сформировано несколько фрагментов знаний. Так случается, например, когда опрашиваются несколько экспертов.
Каждому ФЗ в зависимости от нашего доверия к источнику можно приписать неотрицательный вещественный вес так, чтобы сумма весов равнялась единице. Тогда на основе построенных ФЗ и выбранных весов можно построить фрагмент знаний (над тем же одинаковым для всех исходных ФЗ идеалом), где оценка каждого конъюнкта получается как линейная комбинация с соответствующими весами оценок таких же конъюнктов из набора исходных ФЗ. Такой фрагмент знаний назовем линейной комбинацией набора исходных ФЗ.
Если исходные ФЗ были непротиворечивы, то и их линейная комбинация также непротиворечива [8, 10, 16]. Эта операция позволяет комбинировать свидетельства разных экспертов (или различных источников) с учетом нашей оценки их надежности или достоверности.
Уточним, что линейная комбинация интервалов (точнее, отрезков) является интервалом, где нижняя граница есть линейная комбинация нижних границ исходных интервалов, а верхняя - линейная комбинация верхних. Необходимо указать, что если взять непротиворечивые ФЗ одинаковой структуры, но с разными распределениями и построить новый ФЗ такой же структуры, но в качестве нижней оценки для каждого конъюнкта взять минимум по всем нижним оценкам этого конъюнкта, а в качестве верхней - максимум по верхним, то получившийся ФЗ будет непротиворечив.
Априорный вывод. Заметим, что вероятность любой пропозициональной формулы f из F(А) выражается как сумма вероятностей некоторых квантов из Q(A). Вероятности же квантов линейно выражаются через вероятности конъюнктов. Следовательно, вероятность f линейно выражается через вероятности конъюнктов:
(Vf £ F(А)) 3 ! L(m) : p(f) = (L(m), P(m)) , (7)
где L(m) — вектор вещественных констант, совпадающий по размерности с P(m). Если требуется оценить вероятность формулы f, опираясь на оценки вероятностей элементов идеала конъюнктов, то пополнив множество R(m) уравнением p(f) = (L(m), P(m))
и решив ЗЛП по минимизации и максимизации переменной p(f), получим искомую оценку. Если же требуется учесть наше знание об интервальной оценке величины p(f), то подобным же образом множество R(m) пополняется ограничением (7) и ограничением, исходящим из предметной области: p-(f) ^ p(f) ^ p(f)+.
Априорный вывод заключается в том, чтобы по известным вероятностным оценкам истинности заданных пропозициональных формул построить вероятностную оценку пропозициональной формулы, не вошедшей в число заданных.
Если исходные данные совместны, то в результате поддержания непротиворечивости и априорного вывода формируются интервальные оценки, которые представляют собой отрезок (замкнутый промежуток), возможно, вырождающийся в точку. Для каждой точки такого отрезка можно выбрать точки во всех оставшихся оценках-отрезках так, чтобы получившаяся совокупность скалярных оценок оказалась непротиворечивой. Это важный факт: он говорит о том, что такая оценка именно интервальная, а не обладает какой-то более сложной структурой. Доказательство [8, 10, 16] опирается на то, что ограничения ЗЛП задают выпуклое множество.
Заключение. В теории алгебраических байесовских сетей математической моделью ФЗ является идеал конъюктов с оценками вероятности истинности. Процессы проверки и поддержания непротиворечивости, а также априорного вывода в таком ФЗ сводятся либо к матрично-векторным операциям (при скалярных оценках), либо к решению задач линейного программирования (при интервальных оценках).
Противоречивому ФЗ сопоставляется пустое семейство распределений вероятностей, непротиворечивому ФЗ со скалярными оценками - единственное распределение вероятностей на квантах, а с интервальными - непустое семейство таких распределений.
В работе остался без упоминания расчет оценок чувствительности получающихся результатов. Как оказалось, в случае поддержания непротиворечивости и априорного вывода он сводится к решению серии задач линейного программирования. Подробности доступны, например, в работе [8], где также можно почерпнуть сведения о некоторых теоретических оценках чувствительности.
Литература
1. Владимиров Д. А. Булевы алгебры. СПб.: Изд-во С.-Петерб. ун-та, 2000. 616 с.
2. Тулупьев А. Л. Генерация множества ограничений на распределение оценок вероятности над идеалом цепочек конъюнкций // Вестн. молодых ученых. 2004. № 4. Сер. Прикладная математика и механика. № 1. С. 35—43.
3. Тулупьев А. Л., Никитин Д. А. Экстремальные задачи в апостериорном выводе над идеалами цепочек конъюнкций // Труды СПИИРАН. 2005. Вып. 2, т. 2. СПб.: Наука, 2005. С. 12—52.
4. Nilsson N. J. Probabilistic Logic // Artificial Intelligence. 1986. Vol. 47. Amsterdam: Elsevier Science Publishers B.V., 1986. P. 71-87.
5. Nilsson N. J. Probabilistic Logic Revisited // Artificial Intelligence. 1993. Vol. 59. Amsterdam: Elsevier Science Publishers B.V., 1993. P. 31-36.
6. Fagin R., Halpern J. Y., Megiddo N. A Logic for Reasoning about Probabilities: Report RJ 6190 (60900) 1988.04.12. P. 1-41.
7. Fagin R., Halpern J. Y. Uncertainty, Belief, and Probability-2 // Proc. of the IEEE Symposium on Logic and Computer Science. 1991. Vol. 7. P. 160-173.
8. Тулупьев А. Л., Николенко С. И., Сироткин А. В. Байесовские сети: логико-вероятностный подход. СПб.: Наука, 2006. 607 с.
9. Тулупьев А. Л. Композиция распределений случайных бинарных последовательностей // Информационные технологии и интеллектуальные методы. 1996. Вып. 1. СПб.: СПИИРАН, 1996. С. 105112.
10. Тулупьев А. Л. Алгебраические байесовские сети: теоретические основы и непротиворечивость. СПб.: СПИИРАН, 1995. 76 с.
11. Тулупьев А. Л. Алгебраические байесовские сети: локальный логико-вероятностный вывод: учеб. пособие. СПб.: С.-Петерб. гос. ун-т; ООО Изд-во «Анатолия», 2007. 80 с.
12. Городецкий В. И., Тулупьев А. Л. Формирование непротиворечивых баз знаний с неопределенностью // Изв. РАН. Сер. Теория и системы управления. 1997. № 5. С. 33—42.
13. Городецкий В. И., Тулупьев А. Л. Непротиворечивость баз знаний с количественными мерами неопределенности // КИИ’98: сб. науч. трудов. Т. 1. Пущино, 1998. С. 100—106.
14. Тулупьев А. Л. Дерево смежности с идеалами конъюнктов как ациклическая алгебраическая байесовская сеть // Труды СПИИРАН. 2006. Вып. 3, т. 1. СПб.: Наука, 2006. С. 198—227.
15. Тулупьев А. Л. Алгебраические байесовские сети: логико-вероятностная модель баз фрагментов знаний с неопределенностью // Труды Всерос. науч. конференции по нечетким системам и мягким вычислениям НСМВ-2006 (20—22 сентября 2006 г.). Тверь, 2006. С. 31—47.
16. Тулупьев А. Л. Алгебраические байесовские сети: логико-вероятностный подход к моделированию баз знаний с неопределенностью. СПб.: СПИИРАН, 2000. 282 с.
Статья рекомендована к печати член-кор. РАН, проф. Г. А. Леоновым.
Статья принята к печати 25 декабря 2008 г.