лирование. Зачастую повторное обращение к экспертам с целью устранения противоречий оказывается невозможным, поэтому возникает задача согласования подобных высказываний без привлечения дополнительной информации. Проблемы возникают не только из-за противоречивых, но и из-за просто пересекающихся высказываний, даже если данные экспертами вероятности совпадают.
В работе [1] поставлена задача о введении меры информативности I на множестве классов эквивалентных формул - высказываний экспертов (в частности, некоторого фиксированного языка), и сформулированы естественные требования, которым должна удовлетворять эта функция, выражаемая через некоторую метрику р на множестве классов эквивалентных формул, значения которой принадлежат интервалу [0,1]. Все желаемые свойства меры информативности [1] мы сформулируем на формулах языка первого порядка, точнее на представителях их классов, где они лежат:
1) Если р = 1, то I(р) = 0 (информативность тождественно истинной формулы равна нулю).
2) Если р = 0, то I(р Л 0) = I(р).
3) Если р(р, 0) = 1, то I(р Л 0) = I(р) + I(0).
4) В случае р(р,0) Є (0,1), I(рЛ0) = /(I(р),!(0),р(р,0)), где / (ж,у,г) некоторая функция от переменных ж, у, г удовлетворяющая следующим свойствам:
а) /(ж, у, 1) = ж + у; б) /(ж, ж, 0) = ж;
в) /(ж, у, 21) < /(ж, у, 22), если 21 < 22.
5) I(р) = 1 - I(-р).
Таким образом, для решения поставленной задачи ( и применений) необходимо решить две подзадачи:
1) ввести достаточно адекватную метрику на классах формул;
2) найти такую функцию /(ж, у, г), которая обладает требуемыми свойствами.
В работах [2, 3] эта задача решена для формул языка исчисления высказываний. Мера информативности здесь (и ранее) определена как мера опровержимости формулы на моделях. В случае непротиворечивости формулы (если для нее существует хотя бы одна модель, на которой она истинна (выполнима)) эта мера отражает интуитивное представление о количестве информации, содержащейся в высказывании эксперта, и ее ценности (важности) с точки зрения эксперта. В [4] задача решена для формул языка первого порядка с использованием конечного класса моделей.
В настоящей работе предлагается некоторый общий подход с использованием измеримого класса моделей и его расширений для вычисления естественных расстояний, мер информативности и установления свойств, удовлетворяющих требованиям 1 - 5. В дальнейшем всегда вместо понятия мера информативности будем использовать слова мера
опровержимости, поскольку это более соответствует сути вводимой меры. Рассматривается также задача введения расстояний на множестве вероятностных формул. Для предложенных расстояний также справедливы хорошие свойства метрики (как в предыдущих случаях) и меры опровержимости.
Предложенные метрики и меры опровержимости аппробированы на отдельных примерах и на задаче по интеграционному проекту СО РАН «Компьютерная система для анализа антропологической информации» (рук. д.т.н., профессор Г. С. Лбов), которые кратко приводятся в работе.
Отметим, что проблемой введения расстояний в классе специальных формул и предикатов занимается Н. Г. Загоруйко [5, 6]. Его подход более проработан с точки зрения практических применений. Наш подход отличается некоторой общностью (произвольные предикаты и формулы) и теоретической проработкой исследований как свойств предлагаемых метрик, так и решением задачи о введении информативности (как меры опровержимости).
В решении поставленных задач играет важную роль измеримость числа моделей и используется логическая теория моделей, как теория алгебраических систем по академику А. И. Мальцеву, что позволяет изучать вопрос не только с точки зрения высказываний экспертов, но и «знаний» экспертов (гипотез), выраженных в виде интерпретаций сигнатурных предикатов (возможно и многоместных)в моделях.
Исследование позволит решать вопросы связанные с согласованием экспертных высказываний, построением решающих функций на основе различных метрик, распознавания образов, а также при создании логических баз знаний, их кластеризации и разработке экспертных систем [2, 5]. Результаты статьи прошли аппробацию на Всероссийской конференции ММРО-14, Суздаль 21-25 сентября 2009г., а так же и других.
1. Расстояния между формулами языка первого порядка
Пусть О = {рт, ...,рт} — фиксированная сигнатура, состоящая из конечного числа предикатных символов, которые выбираются для записи и изучения имеющихся связей между переменными в конкретной прикладной области. Случай исчисления высказываний описан в [2, 3]. Пусть задано некоторое исходное множество переменных X = {жі, ...,жр}. Обозначим через ПХі непустое множество с конечной мерой
р
возможных значений переменной ж,-. Пусть Ап = и ОХ. —непустое
з=1 3
множество мощности п, являющееся объединением всех значений рассматриваемых переменных, включенных в предикаты.
В сигнатуру О для каждой переменной ж, дополнительно включен одноместный предикат РХ^., выделяющий область значений переменной
Xj в Ап, то есть предикат РХ. (а) истинен в модели Ап на элементах а € Ап тогда и только тогда, когда а € ДХ..
Определение 1. [7]. Под интерпретацией будем понимать отображение 7, ставящее в соответствие каждому ш^-местному предикатному символу Р™ из сигнатуры О ш^-местный предикат (отношение) РАп С Ат®, заданный на множестве Ап.
Это позволяет говорить о модели < Ап, О > сигнатуры О. В модели
< Ап, О > предикат РДх1,..., хт) истинен на элементах а1,..., ат из Ап (записывается < Ап, О >|= РДа1,..., ат)) тогда и только тогда, когда
< а1, ...,ат® >€ Р^ п и аj € ДХ.. Будем рассматривать модели только конечной сигнатуры.
Пусть имеется конечное число в экспертов и области возможных значений всех переменных. Модели (в смысле теории моделей) задаются специалистами согласно утверждениям экспертов. С каждым экспертом связывается модель, согласно его знаниям интерпретируются сигнатурные предикаты. Каждый эксперт «задает» свою интерпретацию каждого предикатного символа Р™ сигнатуры О соответствующим отношением (предикатом) на множестве Ап. В результате имеем множество моделей {Mj}|=1 (исходный класс моделей).
«Знания» экспертов можно записать в виде формул (возможно с кванторами) в некоторой сигнатуре первого порядка (возможно и предложениями, то есть формулами с кванторами без свободных переменных). Предложения либо истинны, либо ложны на модели, а формулы с переменными определяют формульные предикаты (подмножества) в каждой модели Mj по заданной интерпретации ^’-го эксперта [2].
Пусть Р — система подмножеств множества и АП, образующая а -
к
алгебру, где АП = Ап х ... х Ап. Нас будут интересовать только такие
к
подмножества Sj из Р, для которых найдется формула фj, отражающая "знания"экспертов, которая и определяет это подмножество Sj (формульное подмножество). То есть Sj — это множество кортежей из
и АП, на которых выполняется формула /фj. Формула /фj либо отра-
к
жает какое-то из высказанных «знаний» экспертов, либо является их булевой комбинацией и навешиванием кванторов на некоторые переменные. В дальнейшем каждому рассматриваемому нами множеству Sj соответствует некоторая формула фj.
Пусть В — замыкание множества О относительно логических операций —, Л, V, ^ и кванторов V и 3 по переменным. Ясно, что рассматриваемое экспертами множество формул в В содержится.
Определение 2. [8]. Вероятностной мерой ^ на множестве В называется отображение ^ : В —► [0,1], удовлетворяющее для р и ф € В
условиям:
1) если Ь р = то ^(р) = ^(ф), (Ь р означает, что на всех моделях р истинна);
2) если I--і(р Л ф), то ^(р V ф) = ^(р) + ^(ф);
3) если Ь р, то ^(р) = 1;
4) если I—-р, то ^(р) = 0;
5) ^(-р) = 1 - ^(р)-
Заметим, что в каждом конкретном случае мера ^ выбирается исходя из задачи.
Далее предполагаем, что на множестве формул В задана вероятностная мера ^. Тем самым, вероятностная мера ^ задана на элементах множества Р.
По заданным «знаниям» экспертов мы построили класс моделей (исходный класс). Чтобы более полно использовать информацию экспертов расширим исходный класс моделей. Учитывая одновременно информацию нескольких экспертов, можно уточнить каждую модель (тем самым получить еще одну или более новых моделей) и эти новые модели добавить в исходный класс. Уточнять модели будем следующим образом. Вместо «знания», заданного экспертом в виде предиката Рі в модели Му, далее будем рассматривать его уточнение — предикат Рі.
Под уточнением Рі предиката Рі понимаем уточнение интерпретации этого предиката в модели Му одним из способов:
1) оставить предикат Рі без изменений;
2) исключить из Рі те элементы, в истинности которых І-ый эксперт не совсем уверен;
3) в предикат Рі добавить новые элементы и исключить некоторые старые, например, с учетом «знаний» других экспертов;
4) выполнить пункты 2) и 3) одновременно.
Обозначим произвольный расширенный класс моделей как Моёга(0). Введем расстояние на множестве «знаний» экспертов с помощью более полного класса моделей Моёга(0). Модели различаются интерпретациями сигнатурных предикатов, входящих в «знания» экспертов.
Определим расстояние между формульными подмножествами (предикатами) от одних и тех же переменных в каждой модели Мі Є Моёга(0), как отнормированную меру их симметрической разности. Предикат Рі ] в новой добавленной к исходному классу модели Му это предикат Рі 7.
Определение 3. Расстоянием между предикатами (формульными подмножествами) РМ и рМ* от одних и тех же переменных, определенными в модели Мі, назовем величину
Рм (рМ ,рМ* )= ^(рМ ДрМ).
Замечание 1. Это определение можно расширить на формулы с различными наборами свободных переменных. В этом случае, если рассматриваемые предикаты имеют разную местность или разный набор переменных, и эксперт считает отсутствующую в одной из формул переменную Жі несущественной, полагаем, что она принимает любое из возможных значений и добавляем конъюнктивно к нужной формуле предикат РХі, выделяющий область значений этой переменной. В противном случае (если она существенна) доопределяем эту переменную, добавив конъюнктивно к нужной формуле предикат Р'х ., уточняющий значения этой переменной после повторного обращения к эксперту [2]. Если расстояние измеряется между формулами, у которых наборы переменных различаются, например, по переменной Жі, причем в одной из формул переменная Жі находится под действием квантора, а в другую формулу Жі не входит, тогда относительно переменой Жі в таких формулах никаких изменений делать не надо. Если же расстояние измеряется между формулами, у которых наборы переменных различаются по переменной Жі, и в одной из формул переменная Жі находится под действием квантора, а в другой формуле Жі является свободной переменной, тогда доопределяем эту переменную, добавив конъюнктивно к нужной формуле предикат Рх . или Рх ., уточняющий значения этой переменной, в зависимости от способа доопределения переменной. Например, заменяем формулу ф(жу) = Зжір(жі,жу) на формулу ф(жі,жу) = Зжі(р(жі,ж^)ЛРх.)ЛРх.. Аналогично рассматривается случай с квантором V.
В дальнейшем, с учетом выше сказанного, будем изучать расстояния между формулами от одних и тех же переменных (одной арности).
Расстояние между формулами, определенными на множестве моделей Моёга(О), определим как среднее на множестве расстояний в моделях.
Определение 4. Расстоянием между формулами Рд и Ру от одних и тех же переменных, определенными на множестве Моёга(О), назовем величину
£ рм. (РМ ,рМ)
м.еМоап(п)
| Моёга(О) | ’
Теперь рассмотрим способ определения расстояния между предложениями (замкнутыми формулами). Обозначим через Моё(р) множество моделей из Моёга(О), на которых истинно предложение р, т.е. Моё(р) = {Мі Є Моёга(О) | Мі |= р}.
Очевидно, существуют такие модели, на которых предложение (эксперта) истинно, и такие, на которых оно ложно. Естественно с семантической точки зрения измерять различие информации, содержащей-
ся в предложениях, количеством моделей, на которых предложения принимают разные значения истинности.
Определение 5. Расстоянием между предложениями р и ф от одних и тех же переменных назовем величину
Рассмотрим еще один способ определения расстояния между формулами. Дополним сигнатуру О константами из множества Ап. Для этого множества рассмотрим произвольные кортежи а длины местности формул, равной ^(а). При подстановке кортежей в формулы, в предположении, что формулы имеют одинаковую местность (как этого добиться было показано выше), формулы становятся предложениями.
Под эквивалентностью двух формул р(Х) и ф(Х) (р(х) = ф(ж)) будем понимать эквивалентность их в классе моделей Моёга(О), то есть в каждой модели Мг € Моёга(О) соответствующие р(Х) и ф(Х) формульные подмножества (множество реализаций формул) совпадают.
Тогда расстояние между неэквивалентными формулами р и ф определим как минимум расстояний, определенных по всем кортежам, которые реализуют формулу р, но не реализуют формулу ф и наоборот, используя определенное выше расстояние для предложений. Расстояние между эквивалентными формулами равно нулю.
Определение 6. Расстоянием между формулами р и ф от одних и тех же переменных назовем величину
где х(ж) = (—р(ж) Л ф(ж)) У_(р(ж) Л —ф(ж))) и х(АП(<і)) = {Ь Є АП(<і) |
ЗМі Є Моёга(0) : Мі |= х(Ь)}
Ранее доказана теорема [4], из которой следует, что предложенные расстояния действительно являются метриками. В теореме 1 обобщается этот результат и приведены некоторые свойства введенных для формул расстояний.
Далее вместо р(ж), ф(ж), х(Ж) для краткости будем писать р, ф, х.
Теорема 1. Для любых формул р, ф, х от одних и тех же переменных и любого конечного расширения исходного класса моделей для любого рі (і = 1, 2, 3) выполняются следующие свойства:
|Моё((—р Л ф) V (р Л —ф)) Р2 (р,ф) = -----------------,-,----
рз(р(ж),ф(ж))
1. 0 < рі(р, ф) < 1.
2. рі(р,ф) = рі(ф,р) (симметричность).
3. Если рг(р,ф) = рг(р1,ф1) и рг(р1, Ф1) = рг(р2,ф2), то Рг(р,ф) = Рг(Р2,ф2)-
4 Рг(Р,ф) < Рг(Р,Х) + Рг(Х,ф)-
5. р = ф рг(р,ф) = 0.
6. р = -ф рг(р,ф) = 1.
7. рг(р, ф) = 1 - рг(р, -ф) = рг(-р, -ф).
8. рг(р, ф) = рг(р Л ф, р V ф).
9. рг(р, -р) = рг(р, ф) + Рг(ф, -р).
Доказательство теоремы следует из определений, свойств вероятностной меры, теоретико-модельных вычислений и аналогично доказательству из [4]. Для наглядности приведем доказательство пункта 4.
Для г = 1 достаточно показать, что ^(рМ ДфМ4) < ^(рМ ДхМ) +
+ ^(хМ® ДфМ®) для каждой модели М^. Рассмотрим
^(рМ ДфМ) = ^(рМ \ фМ) + ^(фМ \ рМ) = ^(рМ Л -фМ) + ^(фМ Л
- рМ) =
= ^(рМ Л хМ Л -фМ) + ^(рМ Л -хМ Л -фМ) + ^(фМ Л -рМ Л хМ) +
+^(фМЛ-рМЛ-хМ®) < МхМЛ-фМ®)+^(рМЛ-хМ®)+М-рМ*ЛхМ) +
+ ^(фМ4 Л -хМ) = МрМ ДхМ) + МхМДфМ), что и требовалось получить.
Докажем свойство 4 для г = 2. Обозначим через $1 = Мо^((-рЛф) V (рЛ-ф)), $2 = Мо^((-рЛх) V(рЛ-х)), $3 = Мо^((-хЛф) V(хЛ-ф)). Докажем, что |$11 < |$21 + |$з|. Достаточно доказать, что $1 С $2 и $3. Возьмем произвольно М? € $1, тогда (М? |= (-рЛф)) V(М? |= (рЛ-ф)). Без ограничения общности (используя симметричность) будем считать, что Му |= (-р Л ф). Значит, М? |= -р и М? |= ф. Для произвольного х ясно, что (М? |= х) V (М? |= -х). Если М? |= х, то М? |= (-р Л х), т. е. М? € $2. Если М? |= -х, то М? |= (-хЛф), т. е. М? € $3. Получили, что (М? € $2) V(Mj € $з), т.е. М? € $2и$з. В силу произвольности М? имеем $1 С $2 и $3 .Поэтому, | $1 | < | $2 и $3 | = | $2 | + | $3 | - | $2 П $ | < | $2 | + | $3 |, что и требовалось. Для г = 3 свойство 4 доказывается аналогично.
2. Меры опровержимости и вероятности формул
С точки зрения важности информации, сообщенной экспертом, которому мы доверяем, естественно считать, что опровержимость непустой формулы тем выше, чем меньше число удовлетворяющих ей элементов для конечного случая, и чем меньше мера задаваемого предикатной формулой подмножества в общем случае. Поэтому введем меру опровержимости следующим образом.
Определение 7. Мерой опровержимости формулы р(ж) назовем величину
1г(р(х)) = Рг (р(х), 1), где 1 — тождественно истинный предикат (например, ж = ж).
Для введенных расстояний рі (і = 1, 2, 3) получаем соответственно следующие меры опровержимости:
У] ^(—ірмг) | | шіп |Моё(—^(а,)) |
Т , Ч МіЄМоап(П) т ! \ _ |Моа(-^)| г / ч _ аЄх(АП(а))
/і(р) = |Моёп(П)| , |Моёп(П)| , /з(р) = |Моё„(П)| •
Для мер опровержимости справедлива следующая
Теорема 2. Для любых формул исчисления предикатов р и ф от одних и тех же переменных и любого конечного расширения исходного класса моделей справедливы для любого рі (і = 1, 2, 3) следующие свойства:
1. 0 < /і(р) < 1.
2. 1і(1) = 0.
3. 1і(0) = 1.
4. /і(р) = 1 - /і(-р).
5. /і(р) < /і(р А ф).
6. /і(р) > /і(р V ф).
7. /і(р А ф) = рі(р,ф) + /і(р V ф).
8. Если р = ф, то /і(р) = /і(ф).
9. Если рг(р, ф) = 0, то /Др V ф) = /Др А ф) = /Др).
10. /і(р А ф) = (/і(р) + /і(ф) + рі(р,ф))/2.
11. /і(р V ф) = (/і(р) + /і(ф) - рі(р, ф))/2.
Для доказательства теоремы используются введенные определения, свойства метрики из теоремы 1 и теоретико-модельные вычисления аналогичные доказательству из [4]. Приведем доказательство пункта 10. Докажем для і = 1. /1(р Аф) = 1 — /1(-(р Аф)) = 1 — /1(-р V-ф) =
У] ^(^мі Л^мі) У (^(^мі )+^(^Мі) —2^(^мі Л^мі))
м4єМоап(п) м4єМоап(п)
= 1 ІЛ/Äò сом = 1 +
|Моа„(п)| = 1 + 2|Моа„(п)|
у (М^м )+М^м)) £ ^(^мі д^мі)
мїЄМо'Зп (П) ___ 1 . мїЄМо'Зп(П) І1 ( —^)+1"і (—^) _ і і
2|Моёп(П)| = 11 2|Моёп(П)| 2 = 11
+1 рі(р,ф) — 2(1 — /і(р) +1 — /і(ф)) = 2 (/і(р) + /і(ф) + рі(р>ф)).Что
и требовалось доказать. Для і = 2, 3 аналогично.
На практике же эксперт обычно задает высказывание с его «вероятностью». А вопрос состоит в изучении и согласовании таких высказываний, введении некоторой метрики на таких высказываниях. Первоочередной задачей, на наш взгляд, является определение вероятностей для формул с помощью модельного подхода.
Определение 8. Вероятностью формулы р(Х) назовем величину
р(р(х)) = Рг(р(х), 0).
Теорема 3. Для любого конечного расширения исходного класса моделей для любых формул исчисления предикатов р и ф от одних и тех
же переменных и для любого рі (і = 1, 2, 3) справедливы следующие утверждения:
1. 0 < Р*(р) < 1.
2. Р*(1) = 1.
3. Рі(0) = 0.
4. Рі(р) = 1 — Рі(-р).
5. Рі(р) > Рі(р а ф).
6. Рі(р) < Рі(р V ф).
7. Рі(р а ф) = Рі(р V ф) — рі(р, ф).
8. Если р = ф, то Рі(р) = Рі(ф).
9. Если рі(р,ф) = 0, то РДр V ф) = Р»(р А ф) = Рі(р).
10. Рі(р а ф) = (Рі(р) + Рі(ф) — Рі(р,ф))/2.
11. Рі(р V ф) = (Рі(р) + Рі(ф) + рі(р, ф))/2.
Для доказательства теоремы 3 последовательно используются результаты теорем 1 и 2 и то, что Рі(р(ж)) = /і(—р(ж)).
Так вычисленные с использованием модельного подхода вероятности позволяют уточнять «вероятности» экспертов и будут применяться в дальнейшем.
Разработан и реализован алгоритм для вычисления расстояний между формулами и мер опровержимости формул. Приведем один из тестовых примеров.
Пример 1. Пусть три эксперта высказываются о возрасте человека и его профессии, предсказывая наличие у него того или иного заболевания, например, радикулита и ухудшения зрения. То есть X = {жі(профессия), Х2(возраст)};
Ас 1 = {учитель, шофер, строитель, продавец};
А2 = {41, 42, 43, 44, 45};
О = {Рі — радикулит, Р2 — ухудшение зрения}.
Для краткости формулу (ж = аі V ж = а2 V ж = аз) будем записывать как (ж = аі V а2 V аз) и через Р(ж, у) = и обозначать, что предикат истинен.
1-ый эксперт:
Р/ (ж1, ж2) = и [(ж1 = ш V стр V прод) А (ж2 = 42 V 43 V 44 V 45)]
Р2 (ж1 ,ж2) = и [(ж1 = уч V ш V прод) А (ж2 = 41 V 42 V 43 V 44)]
2-ой эксперт:
Р'12(ж1 ,ж2) = и [(ж1 = стр) А (ж2 = 44 V 45)]
Р|(ж1, ж2) = и [(ж1 = уч V стр V прод) А (ж2 =43 V 44 V 45)]
3-ий эксперт:
Р13(ж1 ,ж2) = и [(ж1 = стр V прод)]
Р23(ж1, ж2) = и [(ж1 = уч V стр) А (ж2 = 41 V 43 V 45)]
Вычислим расстояние между предикатами Р1 и Р2 и меры их опро-вержимости.
В модели М1 первого эксперта имеем:
рМх (Р1) ) = 0 6; ^Мх (Р1) = 0, 4; /мх (Р21) = 0 4
В модели М2 второго эксперта имеем:
РМ2 (Р12, Р2) = 0, 35; /м2 (Р12) = 0, 9; /м2(Р22) = 0, 55.
В модели М3 третьего эксперта имеем:
РМз(Р3, Р23) = 0, 5; /м3(Р3) = 0, 5; /мз(Р3) = 0, 7.
Тогда результирующее расстояние между предикатами Р1 и Р2 равно р(Р1,Р2) = 0, 4833; а меры опровержимости предикатов соответственно равны /(Р1) = 0, 6; /(Р2) = 0, 55.
Можно вычислить расстояния между «знаниями» экспертов относительно одного и того же заболевания: р(Р/, Р2) = 0, 5; р(Р1, Р3) = 0, 3; р(Р2, Р3) = 0, 4; р(Р21, Р22) = 0, 65; р(Р2, Р23) = 0, 7; р(р22, Р3) = 0, 35.
Приведем еще один пример.
Пример 2. ([6]). Два эксперта высказываются о влажности (Х1), которая измеряется четырьмя значениями, то есть ^Хх = {нулевая, низкая, средняя, высокая}, о количестве азотных удобрений (Х2), диапазон изменений которого от 0 до 320 кг/га, то есть ^х2 = (0, 320) (Х2 -непрерывная переменная), о типе почвы (Х3), число которых 4, и видах культур-предшественников (Х4), число которых 8.
На вопрос, каковы условия для получения хорошего урожая пшеницы, эксперты дали такие ответы:
1: (Х1 = средняя) Л (Х2 € (160 — 200)) Л (Х3 = чернозем),
2: (х1 = средняя V высокая) Л (Х2 € (200 — 280)) Л (Х4 = бобовые V травяные).
Тогда расстояние между высказываниями экспертов и мера опро-вержимости высказываний, вычисленные по введенным формулам с учетом замечания 1 следующие: р1 (1, 2) = 0, 039, /1(1) = 0, 992, /1(2) = 0, 969.
Если не учитывать замечание 1, а вычислять расстояние только по общим переменным, то результат получается такой: р1(1, 2) = 0.156.
Если вычислять расстояние между этими мнениями экспертов по формуле, предложенной Н. Г. Загоруйко в работах [5, 6], то получается К = 0.18.
3. Расстояние между вероятностными высказываниями
экспертов
Как уже отмечалось, на практике эксперт обычно задает высказывание с его «вероятностью». В этом случае вопрос состоит в изучении и согласовании таких высказываний, введении некоторой метрики на таких высказываниях. Рассмотрим «знания» экспертов, представленные формулами исчисления высказываний с вероятностями (вероятностные
высказывания), т. е. высказывания вида: «р с вероятностью р^», где р
— формула исчисления высказываний. Используем следующую запись для таких высказываний: В =< р,р^ >, В =< ф,р^ >.
Пусть £ — база знаний, состоящая из формул исчисления высказываний (в £ содержатся все те формулы, которые дали эксперты), £(р)
— носитель формулы р, т.е. множество элементарных высказываний, используемых при написании формулы р, и £(£) = У $(р) — носитель
жеств множества 5(£). Элементы множества Р(5(£)) назовем моде-
(обозначим для простоты).
Предположим, что эксперты говорят о вероятностях формул на множестве всех моделей, и каждое высказывание присутствует только с одной вероятностью (случай, когда у высказывания не одна вероятность будет рассмотрен ниже).
Тогда интерпретируем вероятность, данную экспертом, следующим образом: В =< р,р^ > означает, что высказывание р истинно на п^ = |_п ■ р^] моделях, где п = 2|5,(2)| — всего моделей.
Пусть даны два вероятностных логических высказывания В^ =< р,р^ > и В^ =< ф,р^ >, и требуется вычислить расстояние р(В^,В^) между такими высказываниями.
Тогда, интерпретируя данные экспертами вероятности описанным выше способом, получаем, что высказывание р истинно на п^ = |_п ■ р^] моделях, а высказывание ф истинно на п^ = |_п ■ р^] моделях.
Отметим, однако, что неизвестно на каких именно моделях каждое высказывание истинно, а также число моделей, на которых эти высказывания истинны одновременно.
Рассмотрим следующую подзадачу. Пусть высказывание р истинно на п<^ моделях, высказывание ф истинно на п^ моделях и к — число моделей, на которых эти высказывания одновременно истинны. Требуется вычислить расстояние между высказываниями В^ =< р,р^ > и В^- =< ф,р^ >.
Возникающие в дальнейшем расстояния обозначим через р&(В^,В^), где к = £, £ + 1,..., шіп(п^, п^), здесь и далее £ = тах(0, п^ + п^ — п). Заметим, что значение к для каждой пары высказываний свое.
Как и раньше [3-4], расстояние р&(В^,В^) определим как симметрическую разность, то есть
лями. Известно, что мощность множества Р(5(£)) равна 2|5(2)| = п
рй (ВИ В^')
1
(п^ — к + п^ — к)
1
(п^ + п^ — 2к), (1)
п
п
для каждого к = £, £ + 1,..., шіп(п^, п^).
Для расстояний рд (Ві, В^-) справедливы все утверждения теоремы 1. (Здесь Ві = В^ р = 0 и р^ = р^, это означает, что формулы р и
0 истинны на одних и тех же моделях.)
Предложим несколько способов вычисления расстояния р(Ві, В^) между вероятностными высказываниями Ві =< р,р^ > и В^ =< 0,р^ >.
Так как нам не известно число к (число моделей, на которых высказывания р и 0 одновременно истинны), и если нет никаких предпочтений для значения к (предпочтение может быть высказано экспертами), то можем поступить следующим образом.
Предположим, что для нас все значения для числа к равновероятны. Тогда расстояние между вероятностными высказываниями Ві =< р,р<^ > и В^ =< 0,р^ > определим как усреднение расстояний рд (Ві, В.,-) по всем значениям к, то есть
тіп(га^,га^)
£ Рй (Вг,В^-)
Рсред(Ві, В) = тіП(п^) + 1 - £ • (2)
Для этого расстояния также справедлива теорема 1.
Если экспертами высказано, какое значение для к для пары Ві и В.,-предпочтительнее, то в качестве р(Ві, В^-) берется это рд(Ві, В^-), то есть
р(Ві, В^-) = рд(Ві, В^-). (3)
Подойдем к этому вопросу с вероятностной точки зрения: для каждого к построим вероятностную модель и вычислим вероятность того, что ровно на к моделях высказывания р и 0 одновременно истинны.
Рассмотрим следующую задачу. Найти вероятность рд того, что в выбранных п^ и п^ моделях (выбираются из п моделей) будет ровно к моделей, на которых высказывания р и 0 одновременно истинны, где к = £, £ + 1,..., тіп(п^, п^).
Сначала определим вероятностное пространство < О,А,р >, где О
— пространство элементарных исходов, О = {£,£ + 1,..., тіп(п^,п^)}
— множество всевозможных совпадений моделей в наборах из п^ и п^ моделей, А — система подмножеств множества О, образующая ст-алгебру событий, и р — вероятность на < О, А >. Определим на О такую случайную величину £ что £(к) = рд(Ві, В^).
Вероятность того, что ровно к моделей совпало в наборах из п^ и п^ моделей вычисляется следующим образом:
= / п\( п - к\/п - п^\ /Г / п \ / п\1
рд V к ) \ п^ - к у V - к / / |Д п^ / \п^ Г
В результате имеем рд(Ві, В^) с вероятностями рд, где к = і,і + 1,..., тіп(п^,п^).
Зная вероятности рд для каждого расстояния рд (Вг, В), в качестве расстояния между вероятностными высказываниями Вг =< р,р^ > и В^ =< 0,р^ > можно взять расстояние рд(Вг,В^) с наибольшей вероятностью, то есть
ртах р(Ви В^') = рт(Вг; В^')! где рт = т&Хрд. (4)
к
Очевидно, что для расстояния ртах р(Вг,В^) справедлива теорема 1.
Можно в качестве расстояния между вероятностными высказываниями Вг =< р,р^ > и В^- =< 0,р^ > взять величину, равную математическому ожиданию или среднему значению случайной величины £, то есть
тт(га<^ ,га^)
Рср(Вг, В^)= ^ рк(Вг, В^) ■ Рк• (5)
к=4
Для этого расстояния рср(Вг, В^-) справедливы все утверждения теоремы 1.
В предложенных формулах (1)—(5) расстояний не учитывается вид формул, между которыми вычисляется расстояние. Поэтому естественно предложить расстояние, которое учитывает и сами формулы.
Применяя модельный подход [3-4] к элементам множества Р(£(£)) (моделям), найдем вероятности Р(р) и Р(0) и расстояние р(р, 0) (модельные вероятности и расстояние). Затем по свойству, аналогичному свойству 10 теоремы 3, справедливому и для формул исчисления высказываний, вычислим Р(р Л 0) = 2(Р(р) + Р(0) — р(р,0)). Тогда можно найти число ко = |_п ■ Р(р Л 0)] — число моделей, на которых высказывания р и 0 одновременно истинны.
Имея число ко (вычисленное по моделям), можно уменьшить число возможных значений для к. Здесь возможны 3 случая:
1) если £ < к0 < тт(п^, ), то к = к0 — 1, к0, к0 + 1;
2) если к0 = £ или к0 = тт(п^,п^), то, например, к = к0,к0 + 1 или к = к0 — 1, к0 соответственно;
3) если к0 > тт(п^,п^) или к0 < £, то к = тт(п^,п^) или к = £ соответственно.
И уже к этим значениям для числа к применять предложенные выше формулы (1)—(5). По необходимости возможно некоторое расширение числа значений для к.
Теперь рассмотрим случай, когда одно и то же высказывание присутствует с разными вероятностями. В этом случае предлагаем два варианта введения расстояния:
1) Пусть имеется в экспертов, которые указали вероятности р1, р2,..., Рз высказывания р. Тогда в качестве вероятности р^ можно взять р^ =
- Е рг. Проделав такую процедуру для каждого высказывания, полу-
3 г=1
чим, что каждое высказывание присутствует только с одной вероятностью. Далее следует уменьшить число возможных значений для к и применять формулы (1)—(5).
2) Рассмотрим г-того эксперта. Имеем высказывание р с вероятностью рг и высказывание 0 с вероятностью , данные г-тым экспертом. Тогда вычислим расстояние р(В-, В^) для г-ого эксперта как в случае высказываний с одной вероятностью. Это расстояние обозначим через рг(Вг,В^). Такую процедуру проделаем с каждым из имеющихся
в экспертов, а за р(В-, В^) примем р(В-, В^) = ^ Е Рг(Вг,В^).
Г=1
Замечание 2. Предложенными способами можно также вычислять расстояние между следующими высказываниями: В- =< р,р< > — информация, полученная от г-го эксперта, и В^ =< р,р<. > — информация, полученная от ]-го эксперта.
Результаты предыдущих рассуждений переносятся на формулы исчисления предикатов с вероятностями и произвольного конечного класса конечных моделей фиксированной сигнатуры. Остановимся на существенных моментах, отличающих этот случай от предыдущего.
Рассмотрим «знания» экспертов, представленные формулами исчисления предикатов с вероятностями, т. е. высказывания вида: «р(Х) с вероятностью р<», где р(ж) — формула исчисления предикатов. Используем следующую запись для таких высказываний: В- =< р(ж),р< >,
В^- =< 0(ж),р^ >.
Напомним, что О = {Р-™1 ,...,Р™4} — сигнатура, X = (ж-,...,жр} — множество переменных, ,..., — конечные множества возможных
значений переменных, в — число экспертов. Каждый эксперт «задает» свою интерпретацию каждого предикатного символа сигнатуры О соответствующим отношением с приписанной ему вероятностью, т. е. «знания» г-го эксперта могут быть записаны в виде: < Р{(ж),р- >
,...,< Р4г(ж),р£ >. {Мг}|=1 — исходное множество моделей. Высказывания экспертов могут быть представлены и формулами исчисления предикатов данной сигнатуры.
Зададим для простоты расстояние между предикатами Р и Р,. Для этого сначала вычислим расстояние между вероятностными интерпретациями В- =< Ргг(ж),р- > и В7 =< Р,-(ж),р^ > предикатов в каждой модели М-. Расстояния вычисляются между предикатами одинаковой местности и от одних и тех же переменных (см. замечание 1).
«Знание» в- =< РДж!,..., жр),р- > означает, что предикат
Ргг(ж1,..., жр) истинен на пр = [п ■ р-] кортежах длины р в модели М-, р
где п = П I |.
7 = 1
Аналогично случаю исчисления высказываний пусть предикат Р/(ж) истинен на Прг кортежах в модели М-, предикат Р-(ж) истинен на Прг
1 _ 7 3
кортежах в модели М- и кг — число кортежей, на которых эти предикаты одновременно истинны, где кг = £, £+1,..., шш(прг,Прг), £ = тах(0,
1 3
прг + прг — п). Значение кг для каждой пары предикатов свое. Тогда
1 3
для каждого кг расстояние рд.г (В-,В/) зададим формулой
р&г (В-,В/) = _(п р/ + п рг — 2кг). п 1 3
Для расстояний р^г (В-, В/) справедливы все утверждения теоремы 1. Применяя модельный подход [3-4] и теорему 3, вычислим вероятности Рмг(Р-), Рмг(Р-) и расстояние рмг(Р^Р-) в модели М-, затем вычислим вероятность Рмг (Р- А Р-) и найдем число к- = [Рмг (Р- А Р-) ■ п] — число кортежей, на которых предикаты одновременно истинны, вычисленное по моделям.
Далее поступаем как в случае исчисления высказываний: в каждой модели М- вычислим расстояния рг(В-,В/) с учетом вероятностей и уменьшенного числа значений для кг, и в качестве рвер(Р, Р/) возьмем величину
1 3
Рвер(Р ,Р ) = -Ерг(В-,В/). (6)
в
г=1
Для расстояния рвер(р, Р/) также справедлива теорема 1.
Таким же образом вводится расстояние между двумя формулами языка первого порядка с вероятностями.
Мера опровержимости формул с вероятностями (в случае исчисления высказываний и в случае языка первого порядка) вводится так же, как в пункте 2, то есть
Рер(р) = р^ ^
где 1 — тождественно истинная формула, а р — одно из введенных по формулам (2)—(6) расстояний на вероятностных высказываниях.
Для так введенных мер опровержимости справедливы все свойства теоремы 2, доказанные нами для формул исчисления высказываний и формул исчисления предикатов с использованием исходного конечного класса моделей.
Приведем один из тестовых примеров для формул исчисления предикатов.
Пример 3. Рассмотрим высказывания экспертов, приведенные в примере 1, но с приписанной экспертами вероятностью (вероятностные высказывания).
1-ый эксперт:
Р11(ж1 , ж2) = и [(ж1 = ш V стр V прод) А (ж2 =42 V 43 V 44 V 45)],
вероятность р1 = 0, 5.
Р21(ж1 ,ж2) = и [(ж1 = уч V ш V прод) А (ж2 = 41 V 42 V 43 V 44)],
вероятность = 0, 7.
2-ой эксперт:
Р'12(ж1 ,ж2) = и [(ж1 = стр) А (ж2 = 44 V 45)], вероятность р2 = 0, 8.
Р|(ж1 ,ж2) = и [(ж1 = уч V стр V прод) А (ж2 = 43 V 44 V 45)],
вероятность Р2 = 0, 6.
3-ий эксперт:
Р3(ж1, ж2) = и [(ж1 = стр V прод)], вероятность р1 = 0, 6.
Р2 (ж1 ,ж2) = и [(ж1 = уч V стр) А (ж2 =41 V 43 V 45)], вероятность
Р2 = 0, 7.
Вычислим расстояние между вероятностными высказываниями экспертов, выраженными предикатами Р1 и Р2, и меры их опровержимо-сти.
В модели М1 первого эксперта имеем: пр1 = 10; пр1 = 14; к1 = 4,..., 10; Р 1(Р'11 А Р2) = 0, 3; тогда кд = 6 и,
следовательно, к1 = 5, 6, 7; рКр/, Р2) = 0, 7; р6(Р/, Р2) = 0, 6; р^Р/, Р2) = 0, 5; тогда расстояние р1(Р/, Р21) =0, 6 и меры опровержи-мости 11(Р11) =0, 5 и 11(Р21) = 0, 3.
В модели М2 второго эксперта имеем:: пр2 = 16; пр2 = 12; к2 = 8,..., 12; Р2(Р2 А Р22) = 0,1; тогда кд = 2 и,
следовательно, к2 = 8; р|(Р2,Р2) = 0, 6; тогда расстояние р2(Р2, Р|) = 0, 6 и меры опровержимости /2(Р'12) =0, 2 и /2(Р2) = 0, 4.
В модели М3 третьего эксперта имеем: прз = 12; прз = 14; к3 = 6,..., 12; Р3(Р3 А Р2) = 0,15; тогда =3 и,
следовательно, к3 = 6; р|з(Р3, Р2) = 0, 7; тогда расстояние р3(Р3, Р|) =
0, 7 и меры опровержимости /3(Р3) =0, 4 и /3(Р2) = 0, 3.
Усредняя, получаем расстояние рвер(Р1,Р2) = 0, 6333 и меры опровержимости /вер(Р1) = 0, 3667 и /вер(Р2) = 0, 3333.
Пример 4. Под руководством Гл. Н. С. Института математики, профессора Г.С. Лбова решалась задача из области археологии в рамках интеграционного проекта "Компьютерная система для анализа антропологической информации". В.Б. Бериковым и Т.И. Лучшевой независимо былиполучены закономерности, характеризующие антропологические промеры черепов той или иной определенной эпохи. В анализируемый антропометрический комплекс входили более 20 непрерывных переменных, представляющие собой важнейшие характеристики, дифференцирующие основные расы и их локальные варианты. Множество рассматриваемых объектов (черепов) было разбито на 24 образа, отвечающих той или иной культуре.
Для хорошей кластеризации (таксономии) множества объектов и хорошего распознавания образов желательно, чтобы расстояние между своими представителями каждого кластера были малыми, а расстояния до представителей других кластеров по возможности большими.
Для примера рассмотрим полученные закономерности для двух кластеров.
Закономерности для 1-го образа (кластера):
1. (X1 в [165; 188.50]) и (X3 в [123.50; 134.05]) и (X4 в [93.50; 103.25]) и (X8 в [68.94; 86]) и(Х 11 в [24.95; 32]) и (X14 в [19.95; 25.20]) и
(X15 в [2.04; 3.84]) и (X20 в [83.80; 89.15]).
2. (X3 в [123.50; 134.05]) и (X8 в [68.94; 86]) и (X10 в [28.75; 36.25]) и (X11 в [24.95; 32]) и(Х15 в [2.04; 3.84]) и (X16 в [5.14; 9.14]) и
(X18 в [140.89; 150.44]) и (X20 в [83.80; 89.15]).
3. (X3 в [123.50; 134.05]) и (X8 в [68.94; 86]) и (X11 в [24.95; 32]) и (X13 в [8.94; 12.14]) и(Х15 в [2.04; 3.84]) и (x 16 в [5.14; 9.14]) и (X19 в [124.84; 143.14]) и (X20 в [83.80; 89.15]).
Закономерности для 2-го кластера:
4. (X1 в [174.50; 188.50]) и (X3 в [125.50; 139.50]) и (X12 в [53.90; 58.09]) и (X14 в [19.45; 23.34])и (х 17 в [78.75; 92.50]) и (X20 в [84.90; 90.15]) и (х21 в [20.89; 34]).
5. (X9 в [40.84; 46.04]) и (X12 в [53.90; 58.09]) и (X14 в [19.45; 23.34]) и (X17 в [78.75; 92.50]) и(Х 18 в [137.10; 153.85]) и (X19 в [127.90; 146.39]) и
(х20 в [84.90; 90.15]) и (X21 в [20.89; 34]).
6. (X7 в [125.50; 148.50]) и (X8 в [69.90; 82.34]) и (X9 в [40.84; 46.04]) и (X12 в [53.90; 58.09]) и(х 14 в [19.45; 23.34]) и (X17 в [78.75; 92.50]) и (х20 в [84.90; 90.15]) и (X21 в [20.89; 34]).
Расстояния между закономерностями 1-го кластера, вычисленные по предложенным нами формулам следующие: р(1, 2) = 0, 0006643; р(1, 3) = 0, 0007205; р(2, 3) = 0, 0006942.
Расстояния между закономерностями 2-го кластера соответственно следующие:
р(4, 5) = 0, 0006458; р(4, 6) = 0, 0006411; р(5, 6) = 0, 0007238.
И расстояния между закономерностями из разных кластеров:
р(1, 4) = 0, 0095527; р(1, 5) = 0, 0381027; р(1, 6) = 0, 0270584;
р(2, 4) = 0, 0644439; р(2, 5) = 0, 0810485; р(2, 6) = 0, 0825482;
р(3, 4) = 0, 0645001; р(3, 5) = 0, 0971838; р(3, 6) = 0, 0826044.
Если вычислить меру информативности (опровержимости) каждой закономерности, то получаем следующие результаты:
I(1) = 0, 999655; I(2) = 0, 999681; I(3) = 0, 999625; I(4) = 0, 999718;
I(5) = 0, 999636; I(6) = 0, 99964.
Оценим диаметр каждого кластера через среднее расстояние между всеми парами представителей одного кластера. Получаем, что diami = = 0, 007207 и diam2 = 0, 007239. И оценим расстояние между кластерами (разнесенность кластеров) через среднее расстояние между всеми
парами представителей из разных кластеров. Получаем, что р^2 = 0, 0606527.
Аналогичные результаты характерны и для всех остальных кластеров и закономерностей.
Таким образом, введенное в работе расстояние позволяет посмотреть на закономерности с точки зрения близости по метрике. Результаты говорят о том, что эти закономерности обладают высокой информативностью, и полученные кластеры образуют «компактные» сгустки [5], что говорит о хорошей кластеризации закономерностей.
Заключение
Рассмотрены логические высказывания экспертов, представленные формулами исчисления высказываний и формулами языка первого порядка. Предложен некоторый общий подход с использованием конечного класса моделей и его расширений для вычисления естественных расстояний, мер информативности, вероятностей формул и установления свойств, которым должны удовлетворять расстояния и мера информативности. Рассмотрена также задача введения расстояний на множестве вероятностных формул. Для предложенных расстояний справедливы хорошие свойства метрики и меры опровержимости.
Разработан и реализован алгоритм для вычисления расстояний между формулами, мер опровержимости и вероятностей формул с учетом меры разброса в метрических моделях. Теоремы распространяются на измеримые классы метрических моделей.
Исследование позволит решать вопросы связанные с согласованием экспертных высказываний, построением адаптивных решающих функций, распознаванием образов, а также при создании логических баз знаний, их кластеризации и разработки экспертных систем.
Авторы благодарят профессора Г. С. Лбова за постоянный интерес к вопросам этого направления.
Список литературы
1. Блощицын В.Я., Лбов Г.С. О мерах информативности логических высказываний. // Доклады Республиканской Школы-Семинара "Технология разработки экспертных систем". Кишинев, 1978. С.12-14.
2. Лбов Г.С., Старцева Н.Г. Логические решающие функции и вопросы статистической устойчивости решений. Новосибирск: Изд-во Института математики, 1999.
3. Vikent’ev A.A., Lbov G.S. Setting the metric and informativeness on statements of experts // Pattern Recognition and Image Analysis. 1997. V. 7, N. 2. P. 175-189.
4. Vikent’ev A.A., Koreneva L.N. Setting the metric and measures of informativity in predicate formulas corresponding to the statements of experts about hierarchical objects// Pattern Recognition and Image Analysis. 2000. V. 10, N. 3. P.303-308.
5. Загоруйко Н.Г. Прикладные методы анализа данных и знаний. Новосибирск: Изд-во Института математики, 1999.
6. Загоруйко Н.Г., Бушуев М.В. Меры расстояния в пространстве знаний.// Анализ данных в экспертных системах. Новосибирск, 1986. Вып. 117: Вычислительные системы. С. 24-35.
7. Ершов Ю.Л., Палютин Е.А. Математическая логика. М.: Наука, 1991.
8. Gaifman H. Concerning measures in the first order calculi. // Israel Math. 1964. V. 2, N. 1. P. 1 -18.
A. A. Vikentiev, R. A. Vikentiev
A distance and the measure refutations on logical formulas (statements of experts with probability) in the measure class metric models
Abstract. In the paper we discuss statements of experts about objects represented as the formulas in language logics and we offer techniques for introducing metrics on such statements and measure of refutability. The research will find a use to problems of the best matching of the statements, of construction the decision functions of pattern recognition and development of expert’s systems. We have studied the properties of entered metrics and the measures connected to. We also give examples. The work was also supported by the program «Mathematical logika» of Novosibirsk State University.
Keywords: pattern recognition, distance between statements, theory of models, metrics, know base
Александр Александрович Викентьев, ИМ СО РАН (пр. Академика Коптюга, д.4.), Ст.н.с. лаборатории Анализа Данных, канд. физ-мат. наук, Новосибирский госуд. университет, доцент, ([email protected]. ru)
Руслан Александрович Викентьев, Институт математики СО РАН, инженер, Лаборатория Анализа данных. Новосибирский госуд. университет; Преподаватель, ([email protected])
A.A. Vikentiev, Sobolev Institute of Mathematics of the Siberian Branch of the Russian Academy of Sciences, Laboratory of Data Analysis, Senior Researcher, Ph.D. in Physics and Mathematics; Novosibirsk State University, professor, e-mail: [email protected]
R.A. Vikentiev, Sobolev Institute of Mathematics of the Siberian Branch of the Russian Academy of Sciences, Laboratory of Data Analysis, Engineer; Novosibirsk State University, Assistant, e-mail: [email protected]