Б.И. СЕМКИН,
М.В. ГОРШКОВ
Аксиоматическое введение мер сходства, различия, совместимости и зависимости для компонентов биоразнообразия
Предложена система аксиом субаддитивных симметричных функций, на основе которой определены меры, определяющие отношения сходства, различия, совместимости и зависимости.
Ключевые слова: меры сходства, меры различия, меры совместимости, меры взаимозависимости, сравнительный анализ, биоразнообразие, дескриптивные множества, меры включения.
Axiomatic introduction of similarities, differences, compatibility, and dependence of components of biodiversity. B.I. SEMKIN, M.V. GORSHKOV
Shows a system of axioms of sub-additivity symmetric functions, which define the measures of relationships, similarities, differences, compatibility and dependency.
Key terms: measures of similarity, measures of differences, measures of compatibility, measures of interdependence, comparative analysis, biodiversity, descriptive set, measures of inclusion.
В биологических и социально-экономических науках используются различные коэффициенты, индексы и меры для оценки отношений сходства, различия, совместимости и зависимости. Обзор этих мер можно найти в ряде работ [4, 6-8, 9, 10, 12, 13, 17, 18]. Для целей упорядочения совокупности этих показателей применялись различные системы аксиом [1-4, 8, 9, 10]. Обычно системы аксиом предлагались для введения мер сходства (различия) объектов или зависимости признаков. В данной статье нами рассматривается система аксиом, которая позволяет ввести одновременно как симметричные, так и несимметричные меры для оценки отношений сходства, совместимости и зависимости.
1. Субаддитивные симметричные функции
Субаддитивные симметричные функции вводятся с целью разработки общего подхода к введению мер, определяющих отношения сходства, различия, совместимости и зависимости.
Строгое определение субаддитивных симметричных функций (обозначим их через S) вводим посредством следующей системы аксиом.
Определение 1. Пусть E - произвольное множество. Функция 8 есть отображение произведения E х E в множество R действительных чисел, обладающее следующими свойствами (аксиомами):
1. 5”(х, у)> 0 Vx, у е Е (неотрицательность);
II. 5 (х, у ) = 5 (у, х) Vx, у е Е (симметричность);
III. 5 (х, у) > 5(х, х) Vx, у е Е («целое больше части»);
IV. 5 (х, у) < 5(х, х) + 5(у, у) Vx, у е Е (субаддитивность). Посредством функции 5 вводятся меры дивергенции и конвергенции.
2. Дивергенция и конвергенция
Из аксиом (II) и (III) следует, что 5 (х, у)- 5 (х, х)> 0, 5 (х у )- 5 & у ) > 0. Назовем эти разности односторонними дивергенциями (расхождениями).
Определение 2. Функция
&у(х; у) = 5 ^ у)-5 ^ у) (1)
называется односторонней дивергенцией элемента х от у.
Меняя местами элементы х и у в формуле (1), получим направленную дивергенцию элемента у от х:
&у(у; х) = 5 (х, у) - 5 (х, х). (2)
Очевидны следующие свойства односторонних дивергенций: &у(х; у)> 0, &у(у; х)> 0, &у(х; х) = ^у(у; у) = 0.
Сумма двух односторонних дивергенций (1) и (2) называется двухсторонней дивергенцией или просто дивергенцией.
Определение 3. Функция
<у(х, у) = <у(х; у)+<у(у; х) (3)
называется дивергенцией элементов х и у. Очевидно, что двухсторонняя дивергенция является симметричной функцией: &у(х, у) = &у(у, х). Подставляя выражения (1) и (2) в (3) получим
<Цу(х, у) = 25 (х, у)- 5 (х, х) - 5 (у, у). (4)
Аксиома (IV) позволяет ввести также неотрицательную функцию, которую мы назовем конвергенцией.
Определение 4. Функция
сопу(х, у ) = 5 (х, х) + 5 (у, у) - 5 (х, у) (5)
называется конвергенцией двух элементов х и у.
Из аксиомы (IV) следует свойство неотрицательности функции (5), т. е. сопу(х, у) > 0. Очевидны также следующие свойства этой функции:
сопу(х, х) = 5 (х, х), сопу(у, у) = 5 (у, у).
В дальнейшем, для краткости записи, будем использовать следующие обозначения: 5(х | у) = &у(х; у), 5(у | х) = &у(у; х),
./(х,у) = сопу(х, у), 5 (х, х) = 5 (х), 5(у, у) = 5 (у ), ./(х, х) = ./(х) = 5(х),
3 (y, у ) = 3 (у ) = 5 (у).
Посредством этих обозначений можно записать следующие соотношения между дивергенциями, конвергенциями и функцией 5 (х, у):
5 (х, у) = 5 (х | у) + 5 (у | х) + 3(х, у ),
5 (х, у )= 5 (х)+ 5 (у)- 3 (х, у),
5(х)= 5(х | у)+ 3(х,у), 5(у) = 5(у | х)+ 3(х,у).
3. Относительные дивергенции и конвергенции
Рассмотрим нормированные дивергенции и конвергенции, значения которых заключены в интервале [0, 1].
Определение 5. Функция Е(х; у) называется относительной направленной дивергенцией элемента х от у, если она обладает следующими свойствами:
1. 0 < Е (х; у )< 1; (6)
2. Е(х; у) = 0 ^ <Цу(х; у) = 0; (7)
3. Е(х; у) = 1 ^ сопу (х, у) = 0. (8)
Символ читается как «тогда и только тогда, когда» (эквива-
ленция). Например, указанным свойствам удовлетворяет функция
Е(х;у)= 5(-х)-/)х,у), 5(х)> 0.
5 (х)
Перестановкой элементов х и у определяется относительная дивергенция у от х. Относительная направленная конвергенция определяется как двойственная функция относительной направленной дивергенции.
Определение 6. Функция
К(х; у) = 1 - Е(у; х) (9)
называется относительной направленной конвергенцией элемента х от у.
Очевидны следующие свойства относительной направленной конвергенции К (х; у):
1. 0 < К(х;у)< 1; (10)
2. К(х;у) = 0 ^ сопу(х,у)= 0; (11)
3. К (х; у) = 1 ^ <Цу(у; х) = 0. (12)
Например, функция
К (х; у ) = I - Е (у; х ) = 1 -[8(у 3 у)] = З^.
Определение 7. Функция Е(х, у) называется относительной дивергенцией элементов х и у, если справедливы следующие свойства:
1. 0 < Е (х, у )< 1; (13)
2. Е (х, у) = Е (у, х); (14)
3. Е(х,у) = 0 ^ <Цу(х,у)= 0; (15)
4. ^ у ) =1 ^ сопу (х, у) = 0. (16)
Относительная конвергенция определяется как функция, дополняющая до единицы относительную дивергенцию.
Определение 8. Функция
К (x, у ) = 1 - Е (x, у) (17)
называется относительной конвергенцией х и у.
Приведем ряд относительных дивергенций и конвергенций, построенных на основе 5-функций.
Теорема 1. Функция
Р (х; у ) = , 5 (х)> 0 (18)
удовлетворяет свойствам (6)-(8).
Доказательство. Очевидно Е(х; у)> 0, т. к. 5(х | у)> 0 и 5(х)> 0. Справедливо также неравенство Е (х; у )< 1. Действительно, из аксиомы (IV) следует 5(х | у)< 5(х). Следовательно, свойство (6) для (18) выполняется.
Пусть Е(х; у) = 0. Тогда из (18) следует
5(х | у) = 5(х, у) - 5(у) = <Цу(х; у) = 0 .
Обратно, пусть &у(х; у ) = 0. Тогда Е (х; у )= <^у(х’у) = 0. Свойст-
5 (х)
во (7) справедливо для функции Е(х, у). Аналогично проверяется и свойство (8).
Следствие. Функция
К (х. у )= ^ (19)
удовлетворяет свойствам (10)—(12) относительной направленной конвергенции. Можно также показать, что функции
К т(х; у )= 1 + К(х:у( ), (20)
1 + т-т К (х; у )
К,(у;х)= К(у;х . , (21)
тЧ 7 1 + т-т К (у; х)
где -1 < т < да , также являются относительными конвергенциями. При т = 0 получаем относительные конвергенции
К0(х; у )=К (х; у )= , (22)
К0 (у; х)=К (у;х )=3^(2^. (23)
5 (х)
Теорема 2. Функция
Ч(х, у )= 5 (х)+5^ (х•у} ■ 5(х,у)> 0 (24)
удовлетворяет свойствам (13)—(16).
Следствие. Семейство функций
р (х у)= 5(х) + 5(у)-23(х,у) (25)
^у = 5(х) + 5(у)- 2ф(т)./(х,у) , (25)
где ф(т ) = —Т—, -1 <т<да , удовлетворяет аксиомам (13)—(16). При 1 + т
т = 1 из (25) следует (24).
Из (17) следует, что функции
К1 ^ у) = , 5(x, у)> 0, (26)
5 (x, у)
К (у )=(1 +,)' (х3»-2т 3 ( у) •"1 <т<да (27) являются относительными конвергенциями. При т = 0 из (27) следует
К0 (х, у)= у()). (28)
^ 5 (х) + 5 (у) ' }
4. Метрические относительные симметричные субаддитив-ные функции
Совокупность 5-функций можно сузить, наложив на них некоторые ограничения.
Определение 9. 5-функции, удовлетворяющие кроме аксиом ([—ГУ) еще аксиоме
V. 5(х,у)+5(у,г)> 5(х,г)+5(у,у) Ух,у,г е Е , (29)
называются метрическими.
Можно показать, что система аксиом (I—V) непротиворечива. Например, функция
5(х,у) = п(Х ^ У),
где X, У, X ^ У — конечные множества и их объединение соответственно; п(.) — число элементов множества. Данная функция удовлетворяет также аксиомам 0^).
Действительно, выполнимость аксиом (I—V) для функции очевидна. Легко проверяется и аксиома (V):
5(х, у) + 5(у, г) = п(Х и X) + п(У) + п[У \ (XX и X)] +
+ п[(Х п X) \ У] > п( и X) + п(У) =
= 5 (X, X ) + 5 (У ,У ).
Указанное неравенство также можно проверить с помощью кругов Эйлера.
5. Расстояние
Некоторые дивергенции и относительные дивергенции удовлетворяют аксиомам расстояния.
Определение 10. Пусть Е — некоторое множество. Расстояние в Е есть отображение й произведения Е х Е в множество Я действительных чисел, обладающее следующими свойствами:
I. й(х,у)> 0 Ух,у е Е; (30)
II. й(х, х) = 0 Ух е Е ; (31)
III. й(х,у) = й(у, х) Ух,у е Е (симметричность); (32)
IV. й (х, г )< й(х, у)+й(у, г) Ух, у, г е Е (неравенство треугольника); (33)
V. й(х,у) = 0 ^ х = у . (34) Если не выполняется аксиома (V), то в этом случае функция
й (х, у) называется квазирасстоянием.
Теорема 3. Функция
&у(х, у) = 25 (х, у)-5 (х)-5 (у), (35)
где 5 (x, у) — метрическая 5-функция, удовлетворяет аксиомам квазирасстояния.
Доказательство. Очевидно, функция &у(х, у) неотрицательна, симметрична и удовлетворяет тождеству &у(х, х) = 0. Следует доказать выполнимость неравенства треугольника. Для этой цели представим функцию в следующем виде:
Шу(х,у) = 5(х | у)+5(у | х). (36)
Покажем сначала выполнимость неравенства треугольника для функции 5 (х | у). Действительно, последовательно получаем:
5(х | у) + 5(у | г) = 5(х, у)- 5(у, у)+ 5(у, г) - 5(г, г) >
> 5(х,г)- 5(г,г) = 5(х | г). (37)
При этом использовалось следующее неравенство:
5 (х, у) - 5 (у, у) + 5 (у, г )> 5 (х, г),
которое следует из аксиомы (29). Аналогичное неравенство справедливо для функции 5(г | у).
Следовательно,
5(х | у) + 5(у | г)> 5(х | г),
5(г | у) + 5(у | х)> 5(г | х).
Складывая эти неравенства, получим
5 (х | у) + 5 (у | х) + 5 (у | г) + 5 (г | у )> 5 (х | г) + 5 (г | х) или
&у(х, у) + &у(у, г) > &у(х, г).
Следствие. Пусть &у(х, у ) = 0. Тогда из (35) получим 25(х,у)-5(х)-5(у) = 0 или 5(х,у) - 5(х) = 0, 5(х,у)-5(у) = 0,
5 (у ) = 3 (х, у ), 5 (х) = 3 (х, у ), т. е.
5 (х ) = 5 (у ) = 3 (x, у).
В случае если из условия 5 (х) = 5 (у ) = 3 (х, у) следует равенство х = у , то функция (35) является расстоянием.
Теорема 4. Функция
^у) 5(х)+5(ку)-23(г,у), (38)
5 ^ у )
где 5( х,у) — метрическая функция, удовлетворяет аксиомам квазирасстояния (30)—(33).
Доказательство. Свойства неотрицательности, симметричности и равенства нулю при совпадении аргументов очевидны для относительной дивергенции (38). Докажем выполнимость неравенства треугольника для этой функции. Представим (38) в следующем виде:
¿¡(х^^хЦ + ^уЦ). (39)
5 (х, у) 5 (х, у) ' '
Покажем справедливость неравенства треугольника для каждого из слагаемых (39).
Последовательно получаем
5 (х | у) + 5 (у | г) = 5 (х | у) + 5 (у | г)
>
>
5(х, у) 5(у, г) 5(х | у) + 5(у, у) 5(у | г) + 5(г, г)
__________5 (х | у)________+____________5 (у| г)_________=
5(х | у) + 5(у | г) + 5(г, г) 5(х | у) + 5(у | г) + 5(г, г)
= 5 (х | у) + 5 (у | г) > 5 (х | г) = 5 (х | г)
5 (х | у)+ 5 (у | г)+5 (г, г) 5 (х | г) + 5 (г, г) 5 (х, г)'
При доказательстве использовались следующие неравенства:
1) 5 (y, у)< 5 (y, г)=5 (у| г)+5 ( г);
5 (х | у) + 5 (у| г) > 5 (х | г)
5(х | у) + 5(у | г) + 5(г, г) 5(х | г) + 5(г, г) '
которое является следствием неравенства треугольника для функции
5(х | у) и неравенства —-— > —У— при и > у и а > 0 .
и + а у + а
Аналогично можно показать выполнимость неравенства треугольника для второго слагаемого (39):
5 (х | у) + 5 (у| г) > 5 (х | г)
5 (х, у) 5 (у, х)~ 5 (х, г) ,
5(г | у) + 5(у | х) > 5(г | х)
5(у, ^) 5(х, у)~ 5(х, 2).
Складывая эти неравенства, получим окончательно:
Е1(x, у) + Е1 (y, г )> р1(x, г).
Следствие. Пусть Е1 (х, у )= 0. Тогда 25 (х, у)- 5 (х)- 5 (у )= 0. Как
уже было показано, в случае если из этого условия следует, что х = у ,
то функция Е1 (х, у) является расстоянием.
Теорема 5. Функция
Е (ху)= 5(х, х) + 5(у, у)- 23(х, у) (40)
т , 5 (х, х)+5 (у, у)-2ф(т) 3 (х, у )
где ф(т) = —т—, -1 < т < да , удовлетворяет аксиомам квазирасстояния 1 + т
при ф(т) > 2 , т > 1.
Доказательство. Преобразуем функцию (40) следующим образом:
( у) Г 5 (г)+5 у-2 3 -х, у) | 5 М+5 (Ь) -х, у) + х _ 2ф^т);/УГly) =
I 5(x, у) А 5Х у) 5(x, у)у
=__________у)_= (1 + т)рl(x, у )
1 + ^1 - 1+т-^|(1 - Е (х, у)) 2 + (г-1)771 (x, у)
где Е1 (х,у) — квазирасстояние (38). Следовательно, и функция
а Е (х у)
----- / \, где а > 0, Ь > 0 , также является квазирасстоянием [5].
Ь + р|(x, у)
В нашем случае
1 + т , 2
а =-----, Ь =-
т -1 т -1
положительны при т > 1 или ф(т) > 1.
При т = 1 или ф(т) = 2 функция Е1 (х, у) — квазирасстояние. Следовательно, при т> 1 или ф(т)> 2 функция Е1 (х, у) является квазирасстоянием.
6. Семейство относительных мер конвергенций
Одним из общих способов получения относительных конвергенций является метод симметризации относительных направленных конвергенций. Симметризацию будем производить путем взятия степенного среднего из двух относительных направленных конвергенций [12, 13].
В результате такой процедуры получим множество относительных конвергенций, упорядоченных двумя параметрами:
1 Уп
К т;^ у ) =
Кп(х; у)+К п(у;х)
2
(41)
где Кт(х;у)= 1 + ^у(—), Кт(у; х)= 1 + К (К х(—),
1 + т - т К0 (х; у) 1 + т - т К0 (у; х)
К0(х;у)= ^, К0(у;х)=/5хy), -1 <т<да, -да<п<+да. при
П< 0, Кт(х;у)> 0 и Кт(у;х)> 0.
Особо отметим три меры конвергенции, получаемые при п — 0,
П — -да и п —— +да :
К т;0(x, у )=л/К т(х; у) К т(у;х), (42)
К т;-да (х, у) = ш1и[К т (х; у); К т (у; х)], (43 )
К т;+да (х, у) = тах[Кт (х; у), Кт (у; х)]. (44)
7. Интерпретации
Рассмотрим четыре интерпретации 5-функций: 1) множественную; 2) дескриптивную; 3) вероятностную; 4) информационную.
1) Множественная интерпретация
Элементы: множестваXи У.
Операции: пересечение множеств X п У, объединение множеств X и У, разность множеств X \ У, симметрическая разность X А У = (X \ У) и (У \ X).
Отношения: равенства X = У, включения X с У или У с X, непе-ресечения X п У = 0 , где 0 — пустое множество.
Функции 5: 5(х,у) = п( и У) — число элементов объединения множеств,
5(х, х) = п( и X) = п—), 5(у, у) = п-У и У) = п-У),
5(х | у) = п^)-п^ п У) = п^ \ У),
5(у | х) = п(У)- n(X п У) = п(У \ X), 3 (х,у) = п^ п У),
&у(х, у) = й(х, у) = п^) + п(У) - 2п^ п У) = n(X и У) - п^ п У) = п^АУ) =
= п^ \ У)+п(У \ X).
Относительные направленные меры конвергенции:
к 0 (х; у )=^^пр-, (45)
п(У)
К0 ^ х )=>пхХу) ) — (46)
n(X)
меры включения множества У в X и X в У соответственно. Относительные направленные меры дивергенции:
т, (х; у )= 1 - К„ (у; х )= 1 - ^ = nУx/-уX/УP/, (47)
- Г,-I - Г- у) 1 "(Xп г) я<7)-"(X п У) ( )
-,У'-)=1 - к(--У )-1 —"(У)-------------------"(У)-(48)
меры невключения множества У в X и X в У соответственно. Относительные меры конвергенции:
к ( у)- 2 7 (- У) - 2п(Х п У) к^ ’У)- 5(-) + 5(у)-п(Х) + п(У)5
п(
(49)
к (.Уи 7(-У) - п(х пУ) - п(хпУ) (50)
^ ' 5(-,у) п(х и у) п(Х) + п(У)- п(х п У) ’ ( )
к (-у)=___________4-у)______- п(х п У) (51)
К0;-^-’У> - тах(5(-), 5(у)) = тах[п(Х),п(У)]' (51)
Все меры хорошо известны экологам: формула (49) - мера сходства Серенсена, (50) - мера сходства Жаккара и (51) - мера сходства Браун-Бланке для множеств X и У.
Относительные меры дивергенции:
Г (-у) , к (-у) п(Х)+п(У)-2п(Х п У) п(Х и У)-п(Х п У) (52)
Р0 (У)-1 - К0 (-'У)- п(Х)+п(У) ^ п(Х)+п(У) ’ <52)
-і (-.У)-п(Х У), (53)
п\Х и У)
^ ( ) п(Х п У) п(Х) + п(У)-2п(Х п У) + |п(Х)-п(У) (54)
- тах[п(Х),п(У)] “ п(Х) + п(У) + |п(Х)-п(У) . (54)
Последнее - мера различия (расстояние Юрцева) двух множеств Х и У.
2) Дескриптивная интерпретация
Элементы: дескриптивные множества (наборы) - -(х^..., хг) и У ^У^-.уг).
Операции: дизъюнкция - х V у = (шах(-і,Уі),шах(х2,У2),...
тах(хГ,уГ)), конъюнкция - - л У - (тп(х1, Уі), тт(х2, У2),к, тт(хг, Уг)), разность - х\у - (х1 - тіп(х1, у1 ), х2 - тіп(х2, у 2), к, хг - тіп(хг, уг )), симметрическая разность - хДу = (тах(х1,у1) - тіп(х1,у1),.,тах(хГ,уГ) -тіп(хг,уг)).
Отношения: равенства х - у о х1 - у1,х2 - у2,...,хг - уг, включения х < у о х1 < у1, х2 < у2, к, хг < уг, непересечения х л у - ©, где
© - (0,0,...,о).
4---V---'
Г
г
Функции 5: 5(х,у)-т(хVу)-Хтах(хі,уі), где т(хVу) - мера
і-1
дескриптивного набора (х V у).
5(х) - т(х) - X хі, 5(у) - т(у) - X Уі,
і-1 і-1
5(х | у)- т(х)- т(х л у), 5(у|х)- т(у)- т(х л у),
Г
3 (х,у) - т(х л у) - X тіп(хі, Уі ),
і-1
йі\(х, у) - й(х, у) - т(х) + т(у) - 2т(х л у) - т(х V у) - т(х л у) - т(хДу) -
- т(х \ у) + т(у \ х).
Относительные направленные меры конвергенции:
К0 (х; у)- ^, (55)
т(У)
/ ч т(х л у) ,
к0(у;х)- 4 ( - (56)
т(х )
меры включения дескриптивного набора у в х и х в у соответственно.
Относительные направленные меры дивергенции:
—0 (х, У)-1 - К 0 (у, х)-1 - л у), (57)
т(х) т(х)
—0(у;х)-1 - к0(х,у)-1 - М-- (58)
т(у ) т(у )
меры невключения дескриптивного набора у в х и х в у соответственно. Относительные меры конвергенции:
/ ч / ч 2Х тіп(х., у.)
к (ху)-_2:£х’У)- 2т(хлу) - £ ‘ ‘ (59)
К^- 5(х) + 5(у)- т(х)+т(у)- Хх Г , (59)
X хі +Х У‘
і-1 і-1
/ ч / ч V шт(ж., у.)
к. (ж. у (_^(х^у!__л.------------1—, (60)
Х(х,у) т(ж V у) £ шах(ж. ,у,)
._1
к. (жу)__________________ т(ж п у)____(61)
0; “ ’ шах(((ж), 5(у)) шах[т(ж), т(у)]
меры сходства дескриптивных наборов ж и у.
Относительные меры дивергенции:
к ( у)_ т(ж( + т(у)- 2т(ж л у) _ т(ж V у)- т(ж л у) (62)
0 , т(ж)+т(у) т(ж)+т(у) ,
к1(ж.у)_ т(жVу((-т(жлу>, (63)
т(ж V у)
к ( )_ т(ж(+ т(у)-2т(жлу( + |т(ж)-т(у(| _ (б4)
0;-(Ю у т(ж)+ т(у) + |т(ж)- т(у )|
меры различия дескриптивных наборов ж и у.
3) Вероятностная интерпретация
Элементы: события X и У.
Операции: теоретико-множественные операции над событиями: пересечение, объединение и разность двух событий X и У.
Отношения: теоретико-множественные отношения: равенство, включение, пересечение двух событий X и У.
Функции 5: 5(ж. у)_ Р(х и У) - вероятность объединения двух событий X и У,
5(ж(_ Р^), Х(у(_ Р(У(,
5 (ж | у) _ Р^ \ У) _ Р^)- Р^ п У),
5(у | ж) _ Р(У \ X) _ Р(У) - P(X п У),
3(ж.у)_ Р^ п У),
Шу(х. у (_ d (ж, у (_ P(х (+ р(у (- 2Р( п У (_
_ Р( и У ) - Р( п У ) _ Р( \ У )+ Р(У \ X( Относительные направленные меры конвергенции:
к0(ж;у(_Щ)1, Р(У(>0, (65)
к0(у;х(_Рр(;п(7(, P(X(>0 - (66)
условные вероятности события X при условии У и У при условии X соответственно.
Относительные направленные меры дивергенции:
^у(_ 1 - К,(у;Ж(_ 1 - ^ ^ ^ ^ ( , (67)
F(;x) = 1 -К(x;y) = 1 -^ = P(Y)-*рY) - (68)
дополнения условных вероятностей до 1. Относительные меры конвергенции:
Ko(-y=s2MrPS&)' »
*,(„). 4Ц . ilUii, (70)
1V ' S (x, y) P(X u Y)’ V '
K o;-„ (X y) = min(K о (x; У), K о (y;x))
= min
f P(X_ n Y) P(X n Y) P(x) , P(Y) _
maxi
P(X n Y) (71)
((X ), P(Y ))’
Ko;+OT (xy)=max(о(x; ylKо (y;x)) P(X n Y) P(X n Y)
max P(X n Y)
v P(X ) ’ P(Y) ,
(72)
min(p(X), P(Y)) '
Формула (72) - известная мера совместимости событий Гудолла [14]. Относительные меры дивергенции:
F (xy) = P(X) + P(Y)- 2P(X n Y) = P(X u Y)-P(X n Y)
' p(x)+p(y) p(x)+p(y) , ( )
F (xy) = P(X) + P(Y)- 2P(X n Y) = P(X u Y)-P(X n Y)
Л’У) p(x) + p(y)-p(x n Y) P( u y) ,( )
F (xy) = max(P(X ), P(Y ))-P(X n Y)
F°;-<»vХ,У) = max(p(X),P(Y)) ’
in(p(X ) P(Y)) - P(X n Y)
(75)
к0+ (ж.у)_ШШ^*Л^-;^ - (76)
0;+^ У! шin(p(х), Р(У))
меры несовместимости событий X и У.
4) Информационная интерпретация
Элементы: конечные вероятностные схемы (распределения) [X], [У] [XY] таблицы сопряженности.
Операции: нет.
Отношения: отношения независимости, функциональной односторонней зависимости, взаимной зависимости.
Функции 5: 5(ж.у)_Н(X,У) есть информационная функция.
н^Y)=-XZp«lnPv, где Pv = р(х‘,у.-) (1 = n ; J = l-.т) -
i=1 i=1
совместная вероятность событий Xi и У i.
n m
S (x)=H (x )=-X р(х )ln p(x), S (y )=H (y )=-Z р(у. )ln р(у. ),
«=1
i=1
5 (ж | у) _ Ну (X) _ Н (X ) -1 (X, У),
5 (у|ж)_ Н X (У )_ Н (У)-1 (X ,У ),
3 (ж.у ) _ I (X, У ) _ Н (X ) + Н (У ) - Н (X, У ),
^у(ж. у) _ d (ж, у) _ Н (X) + Н (У) - 21 (X, У) _ Н (X, У) -1 (X, У) _ Нг (X) + Нх (У). Относительные направленные меры конвергенции:
к 0 (ж; у (_ НУ^, (77)
к0 (у; ж(_ НУ - (78)
меры зависимости «признаков» У от X и зависимости X от У и соответственно.
Относительные направленные меры дивергенции:
-Н7Т_HXШVУ_ нpX!•
к,(,■>■ 1 - 1 - ^ _ Н# - «0!
относительные меры односторонней независимости.
Относительные меры конвергенции:
К0М_ „(У^(:, (81)
Н (X)+Н (У)’
)________
I (X ,У )
I (X ,У )
к (ху)_ I^,У( _ I&,У( (82)
Н (X)+Н (У)-1 (X ,У) Н (X ,У) ( )
к0 (ж.у)_------------------г V ч / м . (83)
в-со\ У! шах[Н(X),Н(У)]
Приведенные меры взаимозависимости встречаются в литературе: формула (81) - в работах [4, 9, 11, 16], формула (82) - в работе [15], а формула (83) - в работе [13].
Относительные меры дивергенции:
Г (ху)_ Н^( + Н(У(-2I(X,У( _ Н^,У(-1(,У(
0{,у) Н (X) + Н (У) Н (X)+Н (у ) , ( )
Г (ху)_ Н(X( + Н(У(-21(X,У( _ Н(X,У(-1(,У( (85)
н (X) + Н (у )-1 (X ,У) Н (X ,У) ’ (85)
гм_ 1 - ^ _
шах[Н (X ), Н (У )]
Н (X ) + Н (У ) - 2I (X, У ) + Н (X ) - Н (У (
нш+НУу+нМ-ну
Приведенные меры взаимной независимости можно встретить в следующих работах: формулы (84) и (86) - в работе [9], формулу (85) -в работе [19].
В итоге благодаря аксиоматическому подходу на основе 5-функций удалось одновременно рассмотреть несимметричные и симметричные меры в четырех интерпретациях - множественной, дескриптивной, вероятностной и информационной. В общем случае доказаны теоремы о мерах дивергенции, являющиеся квазирасстояниями и расстояниями.
Отметим, что наиболее часто используются относительные меры сходства, совместимости и зависимости, упорядоченные параметрами т и п и записанные в единой формуле.
Литература
1. Воронин Ю.А. Введение мер сходства и связи для решения гео-лого-геофизических задач / Ю.А. Воронин // Докл. АН СССР. 1971. Т. 139, № 5. С. 64-70.
2. Воронин Ю.А. Начала теории сходства / Ю.А. Воронин. - Новосибирск: Наука. Сиб. отд-ние, 1991. - 128 с.
3. Викентьев А. А. О метризациях булевой алгебры предложений и информативности высказываний экспертов / А.А. Викентьев, Г.С. Лбов // Докл. РАН. Сер. Информатика. 1998. Т. 361, № 2. С.174-176.
4. Елисеева И.И. Группировка, корреляция, распознавание образов: (статистические методы классификации и измерения связей) / И.И. Елисеева, В.О. Рукавишников. - М.: Статистика, 1977. - 143 с.
5. Келли Д.Л. Общая топология / Д.Л. Келли. - М.: Наука, 1968. -384 с.
6. Миркин Б.М. Анализ качественных признаков и структур / Б.М. Миркин. - М.: Статистика, 1980. - 319 с.
7. Песенко Ю.А. Принципы и методы количественного анализа в фаунистических исследованиях / Ю.А. Песенко. - М.: Наука, 1982. - 287 с.
8. Раушенбах Г.В. Меры близости и сходства / Г.В. Раушенбах // Анализ нечисловой информации о социологических исследованиях. - М.: Наука, 1985. - С. 169-203.
9. Семкин Б. И. Дескриптивные множества и их приложения / Б. И. Семкин // Исследование систем. Т. 1. Анализ сложных систем. Владивосток: ДВНЦ АН СССР, 1973. С. 83-94.
10. Семкин Б.И. Количественные показатели для оценки односторонних флористических связей, предложенных Б. А. Юрце-вым / Б.И. Семкин // Бот. журн. 2007. Т. 92, № 4. С. 114-127.
11. Семкин Б.И. Об аксиоматическом подходе к определению мер различия и квазиразличия на семействах множеств / Б. И. Семкин // Информационные методы в системах управления измерения и контроля. Т. 1. Владивосток: ДВНЦ АН СССР, 1972. С 23-26.
12. Семкин Б.И. Теоретико-графовые методы в сравнительной флористике / Б.И. Семкин // Теоретические и методические проблемы сравнительной флористики: Материалы II рабочего совещания по сравнительной флористике. Неринга. 1983 г. Л.: Наука, 1987. С.149-163.
13. Семкин Б.И. Эквивалентность мер близости и иерархическая классификация многомерных данных / Б.И. Семкин // Иерархические классификационные построения в географической экологии и систематике. Владивосток: ДВНЦ АН СССР, 1979. С. 97-112.
14. Goodall D.W. Sample similarity and species correlation / D.W. Goodall // Handbook of Vegetation science. Pt 5. Ordination and Classification of vegetation. The Hague, 1973. P. 107-156.
15. Raijski C. A metric space of discrete probability distributions / C. Raijski // Information and Control. 1961. Vol. 4, N 4. P. 371-377.
16. Rehak R.P. Merene statisicka zavilosti nominalnich znaki / R.P. Re-hak, B. Rehakova // Sociologicky Casopis. 1973. N 4. S. 404-417.
17. Sneath P.H.A. Numerical taxonomy: the principles and practices of
numerical classification / P.H.A. Sneath, R.R. Sokal. - San-
Francisco: Freeman, 1973. - 573 p.
18. Sokal R.R. Principles of numerical taxonomy / R.R. Sokal, P.H.A. Sneath. - San Francisco; London: Freeman, 1963. - 359 p.
19. Yasuichi H. A note entropic metrics / H. Yasuichi // Information and
Control. 1973. Vol. 22, N 4. P. 403-404.
© Семкин Б.И., Горшков М.В., 2008 г.