УДК 021.8 + 025.1 ББК 78.34
О СРЕДНИХ ВЕЛИЧИНАХ
Орлов А. И.1
(Московский государственный технический университет им. Н.Э. Баумана, Москва)
Приведены новые результаты в теории средних. Введены взвешенные средние I типа, соответствуют элементам выборки, и II типа, соответствующие членам вариационного ряда. Прослежена эволюция представлений о расстоянии Кемени и медиане Кемени. Предложена модифицированная медиана Кемени, удобная для вычислений и позволяющая избежать эффекта «центра дырки от бублика». Как обобщение медианы Кемени введены и изучены эмпирические и теоретические средние в пространствах произвольной природы. Для них доказаны законы больших чисел.
Ключевые слова: взвешенные средние, расстояние Кемени, медиана Кемени, эмпирические средние, теоретические средние, законы больших чисел.
1. Введение
В системном анализе и теории принятия решений широко используются средние величины [16, 19]. Классические результаты теории средних собраны в монографии главы итальянской статистической школы Коррадо Джини [3]. За прошедшее время получены новые результаты, которым и посвящена статья.
Так, при усреднении чисел обнаружено наличие двух типов взвешенных средних - I типа, соответствующих элементам
1 Александр Иванович Орлов, доктор технических наук, доктор экономических наук, кандидат физико-математических наук, профессор ([email protected]).
выборки, и II типа, соответствующих членам вариационного ряда.
Развитие математического инструментария решения прикладных задач, прежде всего в экспертных технологиях и социологии, привело к необходимости использования средних значений в пространствах нечисловой природы. Сначала в качестве средних значений бинарных отношений применяли медианы Кемени. Затем оптимизационный подход к построению средних величин стал стержнем нечисловой статистики [17] -новой области прикладной математической статистики. Эти новые разделы теории средних величин также рассмотрены в статье.
2. Взвешенные средние I и II типов
Исходные статистические данные, обработка которых необходима для принятия управленческих решений, во многих случаях рассматриваются как выборка х1, х2, ..., хп, т.е. значения п независимых случайных величин для некоторого элемента пространства элементарных событий, на котором они определены. Если упорядочить элементы выборки, то получим вариационный ряд х(1) < х(2) < х(3) < ... < х(п).
Для описания совокупности в целом используют средние величины. При реальных расчетах применяют средние двух типов. Первый тип - степенные средние, частными случаями которых являются среднее арифметическое, среднее квадратиче-ское, среднее гармоническое. Среднее геометрическое является пределом степенного среднего, когда показатель степени стремится к 0). Более общим видом средних являются средние по Колмогорову:
(|) п5*)),
где Е - строго монотонная функция, Е - обратная к ней.
Второй тип - структурные средние, прежде всего медиана и мода, а также члены вариационного ряда, минимум, максимум, квартили, децили.
Применение теории измерений позволило установить, как выбирать средние в соответствии со шкалами, в которых измерены исходные данные [16, 17, 19]. Так, для данных, измеренных в порядковой шкале, допустимыми средними являются только члены вариационного ряда. В частности, при нечетном объеме выборки - выборочная медиана, при четном - левая и правая медианы (т.е. два центральных члена вариационного ряда). В шкале интервалов из всех средних по Колмогорову можно использовать только среднее арифметическое. В шкале отношений из всех средних по Колмогорову допустимы только степенные средние и среднее геометрическое.
Взвешенные средние (синоним: средние взвешенные) - это средние величины, в которых усредняемые величины учитываются по-разному, в соответствии с весовыми коэффициентами. Выделим два типа взвешенных средних. Для средних I типа весовые коэффициенты соответствуют элементам выборки. Для средних II типа весовые коэффициенты соответствуют членам вариационного ряда.
Пусть а1, а2, ..., ап - весовые коэффициенты (веса), т.е. неотрицательные числа, в сумме составляющие 1. Удобно ввести случайные величины X(a1, а2, ..., ап) и Y(a1, а2, ..., ап), такие, что P(X = х1) = а1, Р(Х = х2) = а2, ..., Р(Х = хп) = ап, в то время как Р^ = х(1)) = ах, Р^ = х(2)) = а2, ., Р^ = х(п)) = ап. Таким образом, случайные величины X и Y принимают одни и те же значения (перечисленные в выборке х1, х2, ..., хп), но, вообще говоря, с разными вероятностями. Если все веса равны между собой (и равны 1/п), то распределения случайных величин X и Y совпадают (и называются эмпирическим распределением).
Взвешенные средние легко определить с помощью введенных случайных величин X и Y. Среднее взвешенное арифметическое I типа - это математическое ожидание X, т.е.
(2) М(X) = ^агхг .
г=1
Среднее взвешенное арифметическое II типа - это математическое ожидание Y, т.е.
п
(3) М(7) = Х).
Ясно, что результаты расчетов по формулам (2) и (3), вообще говоря, различны.
Среднее взвешенное по Колмогорову I типа - это
Аналогично вводятся выборочная взвешенная медиана
I типа - медиана случайной величины X, вероятности совпадения которой с элементами выборки равны заданным весам, и выборочная взвешенная медиана II типа - медиана случайной величины 7, вероятности совпадения которой с членами вариационного ряда равны заданным весам.
При использовании взвешенных средних величин в задачах системного анализа и принятия решений необходимо указывать тип средних, поскольку от типа средних зависят численные значения. В Московском государственном техническом университете им. Н.Э. Баумана при преподавании дисциплины «Прикладная статистика» и в Московском физико-техническом институте при преподавании дисциплины «Методы анализа данных» понятия средних взвешенных величин I типа и II типа входят в учебные программы, однако в научной и учебной литературе разделение средних взвешенных величин I типа и
II типа нам не встречалось. Разделение необходимо, поскольку для одних и тех же исходных числовых данных значения одноименных средних взвешенных I и II типов различаются, что при практической работе может привести к недоразумениям.
Среднее взвешенное по Колмогорову II типа - это
3. Расстояние Кемени и медиана Кемени
При анализе истории и нынешнего состояния экспертных оценок в нашей стране [12, 18, 20] выявлена исключительная роль расстояния и медианы Кемени в развитии теории экспертных оценок. Несколько ранее была окончательно сформулирована в развернутом виде современная парадигма прикладной статистики [15, 17], и оказалось, что центральным ядром статистических методов является статистика в пространствах произвольной природы, а центральным результатом - закон больших чисел в таких пространствах, состоящий в стремлении эмпирических средних к теоретическому, причем определение эмпирического среднего является непосредственным обобщением медианы Кемени, построенной с помощью расстояния Кемени. Таким образом, в этих двух взаимосвязанных научно-практических областях центральным понятием является медиана Кемени, что оправдывает ее подробное обсуждение в настоящей статье.
Обсудим, какой смысл вкладывают сегодня в понятие «расстояние Кемени».
Первоисточник - книга Дж. Кемени и Дж. Снелла «Mathematical Models in the Social Sciences» (1963), изданная на русском языке в 1972 г. в переводе Б.Г. Миркина под названием «Кибернетическое моделирование. Некоторые приложения» [6]. В ней рассмотрен класс бинарных отношений, названных «упорядочениями». Различные авторы использовали также названия «ранжировки со связями» [23], «квазисерии» [9], «совершенные квазипорядки» [24]. В настоящее время мы используем термин «кластеризованные ранжировки» [2, 15, 17, 20].
Первое достижение Дж. Кемени - аксиоматическое введение расстояния между кластеризованными ранжировками (из предыдущих работ Дж. Кемени (см., в частности, [26]) ясно, что авторство этого достижения принадлежит именно ему).
Как известно, любое бинарное отношение, определенное на конечном множестве из k элементов, может быть поставлено в соответствие квадратной матрице из 0 и 1 порядка k. Пусть A и
B - два бинарных отношения, которым соответствуют матрицы ||a(i,j)|| и ||b(i,j)|| соответственно. В [6] приведена система аксиом, из которой выведен вид расстояния d(A, B) между кластеризованными ранжировками A и B:
(6) d(A,B) = X W, j) - b(i, j)|
i<;, j <k
(вид расстояния из [6] приведен с точностью до множителя). Этот результат Дж. Кемени породил большое число аналогичных исследований, посвященных выводу вида тех или иных расстояний в различных пространствах из подходящих систем аксиом. Так, Б.Г. Миркин и Л.Б. Черный вывели расстояние (6) между упорядоченными [10] и неупорядоченными [11] разбиениями, автор этой статьи - между толерантностями (см., например, [15, 17]). В сводке (не вполне полной) работ по этому направлению [22] приведена 161 литературная ссылка.
Автор настоящей статьи должен взять на себя ответственность за перенос названия «расстояние Кемени» на расстояния вида (6) в произвольных пространствах бинарных отношений. Именно такое определение мы включили в энциклопедию «Вероятность и математическая статистика» [1, с. 230].
Рассмотрим различные варианты медиан Кемени.
Пусть ответы экспертов представлены как упорядочения (кластеризованные ранжировки) A(1), A(2), ..., A(n). В книге Дж. Кемени и Дж. Снелла [6] в качестве итогового мнения комиссии экспертов предложено применять «медиану Кемени», т.е. результат минимизации суммы расстояний Кемени от мнений экспертов до произвольного бинарного отношения X:
(7) med(A(1),A(2),...,A(n)) = argmin X d(A(j),X).
X eZ 1< j <n
В [6] мнения экспертов - кластеризованные ранжировки, минимизация проводится по пространству Z всех кластеризованных ранжировок. Автор настоящей статьи должен взять на себя ответственность за перенос названия «медиана Кемени» на случай произвольных пространств бинарных отношений [1, с. 229-230]. При этом согласно определению в Энциклопе-
дии минимизация проводится по тому же пространству бинарных отношений, в котором лежат мнения экспертов.
Напрашивается следующий шаг в обобщении медианы Ке-мени: пусть ответы экспертов лежат в пространстве W, в то время как минимизация проводится по пространству Z. В общем виде такая постановка впервые обсуждалась в [21].
Если пространства Z и W различны, возникают новые эффекты. Например, если Z - пространство всех бинарных отношений, то согласно формуле (7) медиана Кемени находится элементарно - по правилу большинства (если в определенной клетке описывающих мнения экспертов матриц единиц больше половины, то в итоговой матрице ставим единицу, аналогично для нулей; если ровно половина, то можно поставить либо 0, либо 1, медиана Кемени является множеством из нескольких бинарных отношений). Этот факт с завидной регулярностью обнаруживают и публикуют наивные авторы. В то же время если W и Z - одно и то же пространство кластеризованных ранжировок, то известные алгоритмы Б.Г. Литвака [8] и В.Н. Жихарева [4, 17] нахождения медианы Кемени достаточно сложны.
Множество B, по которому проводится минимизация, может не быть пространством бинарных отношений, а составлено по иным принципам. В педагогических целях мы использовали в учебниках [15, 17, 20] множество B из небольшого числа элементов (порядка 10), что позволяло ограничиться ручным счетом.
Вместо рассмотренной выше классической медианы Кемени предлагаем применять модифицированную медиану Кемени, в которой B = {^(1), Л(2), ..., Л(п)}. Для нее итоговое мнение комиссии экспертов всегда совпадает с мнением одного из экспертов, что позволяет избежать эффекта «центра дырки от бублика» (если предположить, что мнения экспертов равномерно распределены по поверхности тора, то классическая медиана Кемени - центр «дырки от бублика», что делает ее расчет бессмысленным).
Изучение свойств медианы Кемени продолжается [28, 29]. Накапливается опыт ее практического применения [7, 25].
С научной точки зрения актуально сравнение медианы Ке-мени с другими методами нахождения коллективного мнения экспертов, мнения которых выражены бинарными отношениями. В частности, если ответы экспертов - кластеризованные ранжировки, то методы на основе медианы Кемени и модифицированной медианы Кемени целесообразно сопоставить с методами средних арифметических рангов, медиан рангов, согласования кластеризованных ранжировок [2].
4. Эмпирические и теоретические средние
Одна из основных статистических процедур - вычисление средних величин для тех или иных совокупностей данных. Законы больших чисел гласят: эмпирические средние сходятся к теоретическим. В классическом варианте: выборочное среднее арифметическое при определенных условиях сходится по вероятности при росте числа слагаемых к математическому ожиданию. На основе законов больших чисел обычно доказывают состоятельность различных статистических оценок. В целом эта тематика занимает заметное место в теории вероятностей и математической статистике.
Однако математический аппарат при этом основан на свойствах сумм случайных величин (векторов, элементов линейных пространств). Следовательно, он непригоден для изучения вероятностных и статистических проблем, связанных со случайными объектами нечисловой природы. Это такие объекты, как бинарные отношения, нечеткие множества, вообще элементы пространств без векторной структуры. Объекты нечисловой природы все чаще встречаются в прикладных исследованиях. Много конкретных примеров приведено в [15, 17, 20]. Поэтому необходимо научиться усреднять различные нечисловые данные, т.е. определять эмпирические и теоретические средние в пространствах произвольной природы. Кроме того, представля-
ется полезным получение законов больших чисел в пространствах нечисловой природы.
Для осуществления описанной научной программы необходимо решить следующие задачи.
A. Определить понятие эмпирического среднего.
Б. Определить понятие теоретического среднего.
B. Ввести понятие сходимости эмпирических средних к теоретическому.
Г. Доказать при тех или иных комплексах условий сходимость эмпирических средних к теоретическому.
Д. Обобщив это доказательство, получить метод обоснования состоятельности различных статистических оценок.
Е. Дать применения полученных результатов при решении конкретных задач.
Образцом для определения средних величин является медиана Кемени. Пусть X - пространство произвольной природы, x1, x2, x3, ..., xn - его элементы. Чтобы ввести эмпирическое среднее для x1, x2, x3, ..., xn, будем использовать действительнозначную (т.е. с числовыми значениями) функцию fix, y) двух переменных со значениями в X. В стандартных математических обозначениях: f : X ^ R1. Величина f(x, y) интерпретируется как показатель различия между x и у: чем fx, y) больше, тем x и y сильнее различаются. В качестве f можно использовать расстояние в Х (в частности, расстояние Кемени, если X - одно из пространств бинарных отношений), квадрат расстояния и т.п.
Определение 1. Средней величиной для совокупности x1, x2, ... , xn (относительно меры различия f), обозначаемой любым из трех способов: x^ = En(f) = En(x1, x2, x3, ..., xn; f), называем решение оптимизационной задачи
n
(8) X f (x, у) ^ min, y e X.
i=1
Это определение согласуется с классическими определениями средних величин. Если Х = R1, fx, y) = (x - y)2, то x^ -выборочное среднее арифметическое. Если же Х = R1, fx, y) = |x - y|, то при n = 2k + 1 имеем хср = x(k + 1), при n = 2k эмпирическое среднее является отрезком [x(k), x(k + 1)]. Здесь
через x(i) обозначен i-й член вариационного ряда, построенного по x1, x2, ..., xn, т.е. i-я порядковая статистика. Таким образом, при Х = R1, fx, y) = \x - y\ решение задачи (8) дает естественное определение выборочной медианы. Правда, несколько отличающееся от определения, обычно предлагаемого в курсах «Общей теории статистики», в котором при n = 2k медианой называют полусумму двух центральных членов вариационного ряда (x(k) + x(k+1))/2. Иногда x(k) называют левой медианой, а x(k + 1) - правой медианой [17].
Решением задачи (8) является множество En(f), которое может быть пустым, состоять из одного или многих элементов. Выше приведен пример, когда решением является отрезок. Если Х = R1 \ {х0}, fx, y) = (x - y)2, а среднее арифметическое выборки равно х0, то Enf пусто.
При моделировании реальных ситуаций часто можно принять, что Х состоит из конечного числа элементов. Тогда множество Enf) всегда непусто - минимум на конечном множестве обязательно достигается.
Понятия случайного элемента x = x(a>) со значениями в Х, его распределения, независимости случайных элементов используем согласно [1]. Будем считать, что функция f измерима относительно ст-алгебры, участвующей в определении случайного элемента x = x(a>). Тогдаfx(o), y) при фиксированном y является действительнозначной случайной величиной. Предположим, что она имеет математическое ожидание.
Определение 2. Теоретическим средним E(x, f (другими словами, математическим ожиданием) случайного элемента x = x(a>) относительно меры различия f называется решение оптимизационной задачи (9) Mf(x(rn), y) ^ min, y е X.
Это определение, как и для эмпирических средних, согласуется с классическим. Если Х = R1, fx, y) = (x - y)2, то E(x, f = M(x(a>)) - обычное математическое ожидание. При этом Mfx(a>), y) - дисперсия случайной величины x = x(a>). Если же Х = R1, fx, y) = \x - y\, то E(x, f = [a, b], здесь a = sup{i:
F(t) < 0,5}, Ь = т^: F(t) > 0,5}, где F(t) - функция распределения случайной величины х = х(ю). Если график F(t) имеет плоский участок на уровне F(t) = 0,5, то медиана - теоретическое среднее в смысле определения 2 - является отрезком. В классическом случае обычно говорят, что каждый элемент отрезка [а; Ь] является одним из возможных значений медианы. Поскольку наличие указанного плоского участка - исключительный случай, то обычно решением задачи (9) является множество из одного элемента а = Ь - классическая медиана распределения случайной величины х = х(ю).
Теоретическое среднее Е(х, /) можно определить лишь тогда, когда М/(х(а>), у) существует при всех у е X. Оно может быть пустым множеством, например, если Х = Я \{х0}, Дх, у) = = (х - у)2, х0 = М(х(а>)). И то, и другое исключается, если Х конечно. Однако и для конечных Х теоретическое среднее может состоять не из одного, а из многих элементов. Отметим, однако, что в множестве всех распределений вероятностей на Х подмножество тех распределений, для которых Е(х, /) состоит более чем из одного элемента, имеет коразмерность 1, поэтому основной является ситуация, когда множество Е(х, /) содержит единственный элемент.
5. Существование средних величин
Под существованием средних величин будем понимать непустоту множеств решений соответствующих оптимизационных задач.
Если Х состоит из конечного числа элементов, то минимум в задачах (8) и (9) берется по конечному множеству. А потому, как уже отмечалось, эмпирические и теоретические средние существуют.
Ввиду важности проблемы существования средних величин в пространствах общей природы приведем теоремы и их доказательства. Топологические термины и результаты будем использовать в соответствии с классической монографией [5]. Так, топологическое пространство называется бикомпактным в том и
только в том случае, когда из каждого его открытого покрытия можно выбрать конечное подпокрытие [5, с. 183].
Теорема 1. Пусть Х - бикомпактное пространство, функция f непрерывна на Х (в топологии произведения). Тогда эмпирическое и теоретическое средние существуют.
Доказательство. Функция £(х1, у) от у непрерывна, сумма непрерывных функций непрерывна, непрерывная функция на бикомпакте достигает своего минимума, откуда и следует заключение теоремы относительно эмпирического среднего.
Перейдем к теоретическому среднему. По теореме Тихонова [5, с. 194] из бикомпактности Х вытекает бикомпактность Х. Для каждой точки (х, у) из Х2 рассмотрим е/2-окрестность в Х2 в смысле показателя различия £ т.е. множество
(10) и(х,у) = {(х',у') :| £(х,у)) - £(х',у') |< е /2}.
Поскольку £ непрерывна, то множества Щх, у) открыты в рассматриваемой топологии в Х. По теореме Уоллеса [5, с. 193] существуют открытые (в Х) множества V(x) и W(y), содержащие х и у соответственно и такие, что их декартово произведение V(x) х W(y) целиком содержится внутри Щ(х, у).
Рассмотрим покрытие
Х2
открытыми множествами ^х) х W(y). Из бикомпактности Х2 вытекает существование конечного подпокрытия {У(х1) х W(yi), 1 = 1, ..., т}. Для каждого х из Х рассмотрим все декартовы произведения V(xг) х W(yi), куда входит точка (х, у) при каком-либо у. Таких декартовых произведений и их первых множителей У(х1) конечное число. Возьмем пересечение таких первых множителей У(х1) и обозначим его Z(x). Это пересечение открыто, как пересечение конечного числа открытых множеств, и содержит точку х. Из покрытия бикомпактного пространства X открытыми множествами Z(x) выберем открытое подпокрытие Z1, Z2, ..., Zk.
Покажем, что если х(1) и х(2) принадлежат одному и тому же Zj при некотором ], то
(11) sup{| £(х(1),у) - £(х(2),у) |,у е X} < £.
Пусть Zj = Z(x0) при некотором х0. Пусть V(xг■) х W(yi), 1 е I, - совокупность всех тех исходных декартовых произведе-
ний из системы {У(х7) х W(yi), 7 = 1, ..., т}, куда входят точки (х0, у) при различных у. Покажем, что их объединение содержит также точки (х(1), у) и (х(2), у) при всех у. Действительно, если (х0, у) входит в У(х7) х W(yi), то у входит в W(yi), а х(1) и х(2) вместе с х0 входят в У(х7), поскольку х(1), х(2) и х0 входят в Z(x0). Таким образом, х(1) и х(2) принадлежат У(хг) х W(yi), а потому согласно определению У(х7) х W(yi) справедливы неравенства
(12) |/(х(а),у) - /(х,,у,)|< е/2, а = 1,2, откуда и следует неравенство (11).
Поскольку Х - бикомпактное пространство, то функция / ограничена на Х2, а потому существует математическое ожидание М/х(а>), у) для любого случайного элемента х(ю), удовлетворяющего приведенным выше условиям согласования топологии, связанной с / и измеримости, связанной с х(ю). Если XI и х2 принадлежат одному открытому множеству Z^, то М/хь у) - М/х2, у)| < £, а потому функция g(y) = М/х(а), у) непрерывна на Х. Поскольку непрерывная функция на бикомпактном множестве достигает своего минимума, т.е. существуют такие точки г, на которых g(z) = шТ^(у), у е X}, то теорема 1 доказана.
В ряде интересных для приложений ситуаций Х не является бикомпактным пространством. Например, если Х = Я1. В этих случаях приходится наложить на показатель различия / некоторые ограничения, например, так, как это сделано в теореме 2.
Теорема 2. Пусть Х - топологическое пространство, непрерывная (в топологии произведения) функция / X ^ Я1 неотрицательна, симметрична (т.е. /(х, у) = /(у, х) для любых х и у из X), существует число D > 0 такое, что при всех х, у, г из X
(13) /(х,у) < D{/(x,г) + /(г,у)}.
Пусть в Х существует точка х0 такая, что при любом положительном Я множество {х: /(х, х0) < Я} является бикомпактным. Пусть для случайного элемента х(ю), согласованного с топологией в рассмотренном выше смысле, существует g(xo) = М/(х(а), х0).
Тогда существуют (т.е. непусты) математическое ожидание Е(х, £) и эмпирические средние Еп(£).
Замечание. Условие (13) - некоторое обобщение неравенства треугольника. Например, если g - метрика в X, а £ = gp при некотором натуральном р, то для £ выполнено соотношение (13) с D = 2р.
Доказательство. Изучим функцию g(y) = М£х(а>), у). В соответствии с условием (13) имеем (14) £(х(ю),у) < D{f(x(ю),х0) + £(х0,у)}.
Поскольку по условию теоремы g(x0) существует, а потому конечно, то из оценки (14) следует существование и конечность g(y) при всех у из Х. Докажем непрерывность этой функции.
Рассмотрим шар (в смысле меры различия £) радиуса R с центром в х0:, т.е. множество К(Я) = {х: £х, х0) <Я}, R > 0. В соответствии с условием теоремы К(Я) как подпространство топологического пространства Х является бикомпактным. Рассмотрим произвольную точку х из Х. Справедливо разложение £(х(®), у) = £(х(®), у)х(хИ е K(R) + £ (х(®), у )х( х(®) е К (R), где х(С) - индикатор множества С. Из разложения (15) следует, что
(1б) g(y) = М£(х(а>), у)х(х(а>) е К(Я) + М£ (х(©), у )х( х(л) е К (R). Рассмотрим второе слагаемое в (16). В силу (14) £ (х(ю), у )х( х(ю) е К (R)) < D{f (х(ю), х0) х
х( х(®) е К (R)) + £ (х0, у)х( х(ю) е К (R))}.
Возьмем математическое ожидание от обеих частей (17): М£(х(ю),у)х(х(а) е К(Л)) <
(18) +?
D | tdP{f (х(о),х0) < 0 + Ц£(х0,у)Р(х(ю) е К(Я)).
я
В правой части (18) оба слагаемых стремятся к 0 при безграничном возрастании Я: первое - в силу того, что
+ СО
(19) я (х0) = М/ (х(ю), х0) = { tdP(/ (х(ю), х0) < t) <<ю,
0
второе - в силу того, что распределение рассматриваемого случайного элемента сосредоточено на Х и
(20) X \ У К(Я) = 0.
Я>0
Пусть Щ(х) - такая окрестность х (т.е. открытое множество, содержащее х), для которой эир{/у, х), у е Щ(х)} < +<х>. Поскольку /(у, х0) < D(f(x0, х) + /х, у)), то на основе неравенства (18) заключаем, что при безграничном возрастании Я
(21) М/ (х(ю), у)х( х(ю) й К (Я)) ^ 0
равномерно по у е Щ(х). Пусть Я(0) таково, что левая часть (21) меньше е> 0 при Я > Я(0) и, кроме того, у е Щ(х) с К(Я(0)). Тогда при Я > Я(0)
(22) I я (у) - х) |< М/ (х(ю), у )х( х(ю) е К (Я)) -М/ (х(ю), х) %(х(ю) е К (Я)) + 2е.
Нас интересует поведение выражения в правой части формулы (22) при у е Щ(х). Рассмотрим / - сужение функции / на замыкание декартова произведения множеств Щ(х) х К(Я), и случайный элемент х1(ю) = х(ю) х(х(ю) е К(Я)). Тогда
(23) М/(х(ю),у)^(х(ю) е К(Я)) = М1(х»,у) = )
при у е Щ(х), а непрерывность функции я1(у) из (23) была доказана в теореме 1. Последнее означает: существует окрестность Щ\(х) точки х такая, что
(24) | М/1( хДю), у) - М/1( хДю), х)|< е
при у е Щ1(х). Из (22) и (24) вытекает, что
(25) (у) - я(х)|< 3£
при у е Щ(х) п Щ1(х), что и доказывает непрерывность функции я(х).
Докажем существование математического ожидания Е(х, /). Пусть число Я(0) таково, что
(26) Р(х(ю) е К(Я(0))) > 2.
Пусть H - некоторая константа, значение которой будет выбрано позже. Рассмотрим точку х из множества K(HR(0)) -дополнения K(HR(0)), т.е. из внешности шара радиуса HR(0) с центром в х0. Пусть х(ю) е K(R(0)). Тогда в силу неравенства fx0, x) < D{fx0, x(®)) + ßx(a), x)} имеем
(27) f (x(p),x) > D f (xo,x) - f (x0,x(®)) > HRD0L - R(0).
Выбирая H достаточно большим, получим с учетом условия
(26), что при x е K(HR(0))c справедливо неравенство
(28) Mf(x(p), x) > 2^^^ - R(0)
Можно выбрать H так, чтобы правая часть (28) превосходила g(xo).
Сказанное означает, что Argmin g(x) достаточно искать внутри бикомпактного множества K(HR(0)). Из непрерывности функции g вытекает, что ее минимум достигается на указанном бикомпактном множестве, а потому - и на всем Х. Существование (непустота) теоретического среднего E(x, f) доказана.
Докажем существование эмпирического среднего Enf). Есть искушение проводить его дословно так же, как и доказательство существования математического ожидания E(x, f), лишь с заменой 1/2 в формуле (28) на частоту попадания элементов выборки xi в шар K(R(0)). Эта частота, очевидно, стремится к вероятности попадания случайного элемента x в K(R(0)), большей 1/2 в соответствии с (26). Однако это рассуждение показывает лишь, что вероятность непустоты Enf) стремится к 1 при безграничном росте объема выборки. Точнее, оно показывает, что
(29) lim P{En (f) #0д En (f) с K (HR(0))} = 1.
Поэтому пойдем другим путем, не опирающимся к тому же на вероятностную модель выборки. Положим
(30) R(1) = max{ f (xt, x0), i = 1,2,..., я}.
Если х входит в дополнение шара K(HR(1)), то аналогично
(27) имеем
(31) f(Xi, x0) > Ш1- - R(1).
При достаточно большом H из (30) и (31) следует, что
(32) £/(Xi,xo) < nR(1) <£/(Xi,x), x e{K(HR(1))}C.
i=i i=i
Из (32) следует, что Argmin достаточно искать на K(HR(1)). Заключение теоремы 2 вытекает из того, что на бикомпактном пространстве K(HR(1)) минимизируется непрерывная функция.
Теорема 2 полностью доказана. Перейдем к законам больших чисел.
6. О формулировках законов больших чисел
Пусть x, Xi, x2, ..., xn - независимые одинаково распределенные случайные элементы со значениями в Х. Закон больших чисел - это утверждение о сходимости эмпирических средних к теоретическому среднему (математическому ожиданию) при росте объема выборки n, т.е. утверждение о том, что
(33) En (/) = En (xi, x2, x,,..., xn; /) ^ E( x, /).
при n ^ да. Однако и слева, и справа в формуле (33) стоят, вообще говоря, множества. Поэтому понятие сходимости в (33) требует обсуждения и определения.
В силу классического закона больших чисел при n ^ да
1 п
(34) - X /(xi, У) ^ Mf (x, y)
n i=i
в смысле сходимости по вероятности, если правая часть существует (теорема А.Я. Хинчина, 1923 г.).
Если пространство Х состоит из конечного числа элементов, то из соотношения (34) легко вытекает (см., например, [13, с. 192-193]), что
(35) lim P{En (/) с E (x, /)} = 1.
Другими словами, En(f) является состоятельной оценкой E(x, /).
Если E(x, / состоит из одного элемента, E(x, / = {x0}, то соотношение (35) переходит в следующее:
(36) lim P{En (f) = К}} = 1.
n—да
Однако с прикладной точки зрения доказательство соотношений (35)-(36) не дает достаточно уверенности в возможности использования En(f) в качестве оценки E(x, f). Причина в том, что в процессе доказательства объем выборки предполагается настолько большим, что при всех y е X одновременно левые части соотношений (34) сосредотачиваются в непересекающихся окрестностях правых частей.
Замечание. Если в соотношении (34) рассмотреть сходимость с вероятностью 1, то аналогично (35) получим так называемый усиленный закон больших чисел [13, с. 193-194]. Согласно этой теореме с вероятностью 1 эмпирическое среднее Enf) входит в теоретическое среднее E(x, f), начиная с некоторого объема выборки n, вообще говоря, случайного, n = n(a>). Мы не будем останавливаться на сходимости с вероятностью 1, поскольку в соответствующих постановках, подробно разобранных в монографии [13], нет принципиальных отличий от случая сходимости по вероятности.
Если Х не является конечным, например, Х = R , то соотношения (35) и (36) неверны. Поэтому необходимо искать иные формулировки закона больших чисел. В классическом случае сходимости выборочного среднего арифметического к математическому ожиданию можно записать закон больших чисел так: для любого £ > 0 справедливо предельное соотношение
(37) lim P (x е (M(x1) - £,M(x1) + £)} = 1.
n—>да v /
В этом соотношении, в отличие от (35), речь идет о попадании эмпирического среднего En(f), совпадающего в рассматриваемом частном случае со средним арифметическим результатов наблюдений, не непосредственно внутрь теоретического среднего E(x, f), а в некоторую окрестность теоретического среднего.
Обобщим эту формулировку. Как задать окрестность теоретического среднего в пространстве произвольной природы? Естественно взять его окрестность, определенную с помощью какой-либо метрики. Однако полезно обеспечить на ее дополне-
нии до Х отделенность множества значений M/x(a>), y) как функции y от минимума этой функции на всем Х.
Поэтому мы сочли целесообразным определить такую окрестность с помощью самой функции M/x(a>), y).
Определение 3. Для любого s > 0 назовем s-пяткой функции g(x) множество
(38) Ks (g) = {x: g(x) < inf{g(y),y e X} + s, x e X}.
Таким образом, в s-пятку входят все те х, для которых значение g(x) либо минимально, либо отличается от минимального (точнее, от инфимума - точной нижней грани) не более чем на s. Так, для X = R1 и функции g(x) = х2 минимум равен 0, а s-пятка имеет вид интервала (-s0'5; s0'5). В формулировке (37) классического закона больших чисел утверждается, что при любом s > 0 вероятность попадания среднего арифметического в s2-пятку математического ожидания стремится к 1. Поскольку s > 0 произвольно, то вместо s0'5-пятки можно говорить о s-пятке, т.е. перейти от (37) к эквивалентной записи
(39) limP{x e Ks(M[x1(a) - x]2)} = 1.
n^да v /
Соотношение (39) допускает непосредственное обобщение на общий случай пространств произвольной природы. СХЕМА ЗАКОНА БОЛЬШИХ ЧИСЕЛ. Пусть x, x1, x2, ., xn - независимые одинаково распределенные случайные элементы со значениями в пространстве произвольной природы Х с показателем различия / X ^ R1. Пусть выполнены некоторые математические условия регулярности (они формулируются в конкретных теоремах). Тогда для любого s > 0 справедливо предельное соотношение
(40) limP{En(/) с Ks(E(x,/)} = 1.
Аналогичным образом может быть сформулирована и общая идея усиленного закона больших чисел. Ниже приведены две конкретные формулировки «условий регулярности».
7. Теоремы о законах больших чисел
Законы больших чисел. Начнем с рассмотрения естественного обобщения конечного множества - бикомпактного пространства Х.
Теорема 3. В условиях теоремы 1 справедлив закон больших чисел - соотношение (40).
Доказательство. Воспользуемся построенным при доказательстве теоремы 1 конечным открытым покрытием
Х2, ..., 2к} пространства Х таким, что для него выполнено соотношение (11). Построим на его основе разбиение Х на непересекающиеся множества Ж2, ..., (объединение элементов разбиения Ж2, ..., Жт составляет Х). Это можно сделать итеративно. На первом шаге из следует вычесть Z2, ..., 2к - это и будет . Затем в качестве нового пространства надо рассмотреть разность Х и а покрытием его будет {22, ..., 2к}. И так до к-го шага, когда последнее из рассмотренных покрытий будет состоять из единственного открытого множества Остается из построенной последовательности Ж2, ..., Жк вычеркнуть
пустые множества, которые могли быть получены при осуществлении описанной процедуры (поэтому, вообще говоря, т может быть меньше к).
В каждом из элементов разбиения Ж2, ..., Жт выберем по одной точке, которые назовем центрами разбиения и соответственно обозначим w1, w2, ..., Это и есть то конечное множество, которым можно аппроксимировать бикомпактное пространство Х. Пусть у входит в Щ. Тогда из соотношения (11) вытекает, что
Перейдем к доказательству соотношения (40). Возьмем произвольное 3> 0. Рассмотрим некоторую точку Ь из Е(х, /). Доказательство будет основано на том, что с вероятностью, стремящейся к 1, для любого у вне К^(Е(х, /)) выполнено неравенство
1
1
1
1
Для обоснования этого неравенства рассмотрим все элементы разбиения Ж1, Ж2, ..., имеющие непустое пересечение с внешностью 8-пятки К(Е(х, /)). Из неравенства (41) следует, что для любого у вне К(Е(х, /)) левая часть неравенства (42) не меньше
где минимум берется по центрам всех элементов разбиения, имеющим непустое пересечение с внешностью 8-пятки. Возьмем теперь в каждом таком разбиении точку V,, лежащую вне ¿-пятки К(Е(х,/)). Тогда из неравенств (11) и (43) следует, что левая часть неравенства (42) не меньше
В силу закона больших чисел для действительнозначных случайных величин (т.е. обычного закона больших чисел теории вероятностей) каждая из участвующих в соотношениях (42) и (44) средних арифметических имеет своими пределами соответствующие математические ожидания, причем в соотношении (42) эти пределы не менее МДх\, Ь) + 8- 2е, поскольку точки V, лежат вне 8-пятки К8(Е(х,/)). Следовательно, при 8- 2е> 0 и достаточно большом п, обеспечивающем необходимую близость рассматриваемого конечного числа средних арифметических к их математическим ожиданиям, справедливо неравенство (42).
Из неравенства (42) следует, что пересечение Е„(/) с внешностью множества К8(Е(х, /)) пусто. При этом точка Ь может входить в Еп(/), а может и не входить. Во втором случае Е„(/) состоит из иных точек, входящих в К8(Е(х, /)). Теорема 3 доказана.
Если Х не является бикомпактным пространством, необходимо суметь оценить рассматриваемые суммы «на периферии», вне бикомпактного ядра, которое обычно выделяется естествен-
ным путем. Один из возможных комплексов условий сформулирован выше в теореме 2.
Теорема 4. В условиях теоремы 2 справедлив закон больших чисел, т.е. соотношение (40).
Доказательство. Будем использовать обозначения, введенные в теореме 2 и при ее доказательстве. Пусть г и R, г < R, -положительные числа. Рассмотрим точку х в шаре К(г) и точку у вне шара К(Р). ПосколькуДх0,у) <Ъ{Дх0, х) + Дх,у)}, то
1 р
(45) Д(х, у) > - Д(х0,у) - Д(х0, х) > -ъ - г.
Положим
1 п
(46) gn(х) = gn(х,ю) = -Х Д(х,х).
п г=\
Сравним gn(x0) и gn(y). Выборку хь х2, ..., хп разобьем на две части. В первую часть включим те элементы выборки, которые входят в К(г), во вторую - все остальные (т.е. лежащие вне К(г)). Множество индексов элементов первой части обозначим I = 1(п, г). Тогда в силу неотрицательностиДимеем
(47) ^ (у) > - Х Д (xi, у), а в силу неравенства (45)
(48) Х Д(х, у) - г )|/(п, г )|,
где |1(п, г)| - число элементов в множестве индексов 1(п, г). Следовательно, на основе (47) и (48) заключаем, что для определенной формулой (46) функции gn(y) справедливо неравенство
(49) ^ (у >1 (ъ- г)Л
где J = |1(п, г)| - биномиальная случайная величина В(п, р) с вероятностью успеха р = Р{хг(ю) е К(г)}. По теореме Хинчина для gn(x0) справедлив (классический) закон больших чисел. Пусть £ > 0. Выберем щ = п1(£ так, чтобы при п > щ было выполнено соотношение
(50) Р^п(Хо) - g(Хо) > е} < е,
где g(x0) = М/(х\, х0). Выберем г так, чтобы вероятность успеха р > 0,6. По теореме Бернулли можно выбрать натуральное число п2 (как функцию е) так, чтобы при п > п2 было выполнено неравенство
(51) Р{1 > 0,5п} > 1 - е. Выберем R так, чтобы
(52) 2[Ъ - г )> g(Х0)+ е.
Тогда
(53) Ке (g) С К(R)
и согласно (49)-(52) при п > п3 = тах(п1, п2) с вероятностью не менее 1 - е выполнено неравенство gn(y) > gn(x0) для любого у вне К^). Из (53) следует, что минимизировать gn достаточно внутри бикомпактного шара К^), при этом Еп(/) не пусто и
(54) Р{Еп (/) с К(R)} > 1 - 2е.
Пусть Gn и G - сужения gn и g(x) = М/(х(а), х), соответственно, на К^) как функций от х. В силу (53) справедливо равенство
(55) Ке(в) с К(R)
Согласно доказанной выше теореме 3 найдется п4 = п4(ю) такое, что при п > п4
(56) Р{К0(Оп) С Ке(я)} > 1 - е.
Согласно (54) К0^п) = Еп(/) при п > п3 с вероятностью не менее 1 - 2е. Следовательно, при п > п5(е) = тах(п3, п4) имеем
(57) Р{Еп(/) С Ке(Я)} > 1 - 3е,
что и завершает доказательство теоремы 4.
Справедливы и иные варианты законов больших чисел, полученные, в частности, в статье [14]. Первое доказательство закона больших чисел (в весьма частном случае) было получено еще Дж. Кемени [27].
8. Изучение свойств медианы Кемени при конечных объемах выборок
Рассмотрим на основе развитой выше теории частный случай пространств нечисловой природы - пространства бинарных отношений на конечном множестве и медианы Кемени как способ нахождения эмпирического среднего. Поскольку число бинарных отношений на конечном множестве конечно, то эмпирические и теоретические средние для произвольных показателей различия существуют и справедливы доказанные выше законы больших чисел.
Бинарные отношения, в частности, упорядочения, часто используются для описания мнений экспертов. Тогда расстояние Кемени измеряет близость мнений экспертов, а медиана Кемени позволяет находить итоговое усредненное мнение комиссии экспертов. Расчет медианы Кемени обычно включают в информационное обеспечение систем принятия решений с использованием оценок экспертов. Речь идет, например, о математическом обеспечении автоматизированного рабочего места «Математика в экспертизе» (АРМ «МАТЭК») [20], предназначенного, в частности, для использования при проведении экспертиз в задачах экологического страхования. Поэтому представляет большой практический интерес численное изучение свойств медианы Кемени при конечном объеме выборки. Такое изучение дополняет описанную выше асимптотическую теорию, в которой объем выборки предполагается безгранично возрастающим (п ^ да).
С помощью специально разработанной программной системы В.Н. Жихарев вместе с нами провел ряд серий численных экспериментов по изучению свойств выборочных медиан Кеме-ни (в пространстве ранжировок без связей). Представление о полученных результатах дается таблице 1, взятой из статьи [4]. В каждой серии методом статистических испытаний определенное число раз моделировался случайный и независимый выбор экспертных ранжировок, а затем находились все медианы Кеме-ни для смоделированного набора мнений экспертов. При этом в
сериях 1-5 распределение ответа эксперта предполагалось равномерным на множестве всех ранжировок. В серии 6 это распределение являлось монотонным относительно расстояния Кемени с некоторым центром (о понятии монотонности см. [17, гл.1] ), т.е. вероятность выбора определенной ранжировки убывала с увеличением расстояния Кемени этой ранжировки от центра. Таким образом, серии 1-5 соответствуют ситуации, когда у экспертов нет почвы для согласия, нет группировки их мнений относительно некоторого единого среднего группового мнения, в то время как в серии 6 есть единое мнение - описанный выше центр, к которому тяготеют ответы экспертов.
Таблица 1. Результаты вычислительного эксперимента по
изучению медианы Кемени
Номер серии 1 2 3 4 5 6
Число испытаний 100 1000 50 50 1000 1000
Количество объектов 5 5 7 7 5 5
Количество экспертов 10 30 10 30 10 10
Частота непустого пересечения 0,85 0,58 0,52 0,2 0,786 0,911
Среднее отношение диаметров 0,283 0,124 0,191 0,089 0,202 0,044
Средняя мощность медианы 5,04 2,41 6,4 2,88 3,51 1,35
Максимальная мощность медианы 30 14 19 11 40 12
Результаты, приведенные в таблице 1, можно комментировать разными способами. Неожиданным явилось большое число элементов в выборочной медиане Кемени - как среднее, так и особенно максимальное. Одновременно обращает на себя внимание убывание этих чисел при росте числа экспертов и особенно при переходе к ситуации реального существования группового мнения (серия 6). Достаточно часто один из ответов экспертов входит в медиану Кемени (т.е. пересечение множества ответов экспертов и медианы Кемени непусто), а диаметр медианы как множества в пространстве ранжировок заметно меньше диамет-
ра множества ответов экспертов. По этим показателям - наилучшее положение в серии 6. Грубо говоря, всяческие «патологии» в поведении медианы Кемени наиболее резко проявляются в ситуации, когда ее применение не имеет содержательного обоснования, т.е. когда у экспертов нет основы для согласия, их ответы равномерно распределены на множестве ранжировок.
Увеличение числа испытаний в 10 раз при переходе от серии 1 к серии 5 не очень сильно повлияло на приведенные в таблице характеристики, поэтому представляется, что суть дела выявляется при числе испытаний (в методе Монте-Карло), равном 100 или даже 50. Увеличение числа объектов или экспертов увеличивает число элементов в рассматриваемых пространствах ранжировок, а потому уменьшается частота попадания какого-либо из мнений экспертов внутрь медианы Кемени. А также отношение диаметра медианы к диаметру множества экспертов и число элементов медианы Кемени (среднее и максимальное). Можно сказать так: увеличение числа объектов или экспертов уменьшает степень дискретности задачи, приближает ее к непрерывному случаю, а потому уменьшает выраженность различных «патологий».
Есть много интересных направлений исследований, которые здесь не рассматриваем. Они связаны со сравнением медианы Кемени с другими методами усреднения мнений экспертов, например, с нахождением итогового упорядочения по методу средних рангов [20]. А также с использованием малых окрестностей ответов экспертов для поиска входящих в медиану ранжировок (с целью сокращения расчетов). Или с построением теоретических и численных оценок скорости сходимости в законах больших чисел.
Центральная роль в нечисловой статистике эмпирических и теоретических средних, законов больших чисел и их обобщений, предназначенных для изучения решений экстремальных статистических задач, продемонстрирована в [17, 20]. Современная теория экспертных оценок является прикладным «зеркалом» нечисловой статистики. Значение постановок настоящей статьи
для разработки и применения экспертных технологий обсуждается в [18, 20].
Литература
1. Вероятность и математическая статистика: Энциклопедия / Гл. ред. акад. РАН Ю.В. Прохоров. - М.: Большая Российская Энциклопедия, 1999. - 910 с.
2. ГОРСКИЙ В.Г., ГРИЦЕНКО А.А., ОРЛОВ А.И. Метод согласования кластеризованных ранжировок // Автоматика и телемеханика. - 2000. - №3. - С. 179-187.
3. ДЖИНИ К. Средние величины / Пер. с итал. - Москва: Статистика, 1970. - 448 с.
4. ЖИХАРЕВ ВН., ОРЛОВ А.И. Законы больших чисел и состоятельность статистических оценок в пространствах произвольной природы // Статистические методы оценивания и проверки гипотез: межвуз. сб. науч. тр. - Пермь: Изд-во Пермского госуд. ун-та, 1998. - С. 65-84.
5. КЕЛЛИ Дж. Общая топология. - М.: Наука, 1968. - 384 с.
6. КЕМЕНИ Дж., СНЕЛЛ Дж. Кибернетическое моделирование: Некоторые приложения. - М.: Советское радио, 1972. - 192 с.
7. Космонавтика XXI века. Попытка прогноза до 2101 года // Под ред. акад. РАН Б.Е. Чертока. - М.: РТСофт, 2010. -864 с.
8. ЛИТВАК Б.Г. Экспертная информация: методы получения и анализа. - М.: Радио и связь, 1982. - 184 с.
9. МИРКИН Б.Г. Проблема группового выбора. - М.: Наука, 1974. - 256 с.
10. МИРКИН Б.Г., ЧЕРНЫЙ Л.Б. Об измерении близости между разбиениями конечного множества объектов // Автоматика и телемеханика. - 1970. - №5. - С. 120-127.
11. МИРКИН Б.Г., ЧЕРНЫШ Л.Б. Некоторые свойства пространства разбиений // Математический анализ экономических моделей: Ч. III. - Новосибирск: ИЭиОПП СО АН СССР, 1972. - С. 126-147.
12. НОВИКОВ Д.А., ОРЛОВ А.И. Экспертные оценки - инструменты аналитика // Заводская лаборатория. - 2013. -Т. 79, №4. - С. 3-4.
13. ОРЛОВ А.И. Устойчивость в социально-экономических моделях. - М.: Наука, 1979. - 296 с.
14. ОРЛОВ А.И. Асимптотика решений экстремальных статистических задач // Анализ нечисловых данных в системных исследованиях. Сборник трудов. Вып.10. - М.: Всесоюзный научно-исследовательский институт системных исследований, 1982. - С. 4-12.
15. ОРЛОВ А.И. Прикладная статистика. - М.: Экзамен, 2006. - 671 с.
16. ОРЛОВ А.И. Теория принятия решений. - М.: Экзамен, 2006. - 574 с.
17. ОРЛОВ А.И. Организационно-экономическое моделирование: учебник: в 3 ч. Ч.1. Нечисловая статистика. - М.: Изд-во МГТУ им. Н.Э. Баумана, 2009. - 541 с.
18. ОРЛОВ А.И. О развитии экспертных технологий в нашей стране // Заводская лаборатория. - 2010. - Т. 76, №11. -С. 64-70.
19. ОРЛОВ А.И. Организационно-экономическое моделирование: теория принятия решений : учеб. для вузов. - М. : КноРус, 2011. - 568 с.
20. ОРЛОВ А.И. Организационно-экономическое моделирование: учебник: в 3 ч. Ч.2. Экспертные оценки. - М.: Изд-во МГТУ им. Н.Э. Баумана, 2011. - 486 с.
21. ОРЛОВ А.И. Роль медиан Кемени в экспертных оценках и статистическом анализе данных // Теория активных систем: Труды международной научно-практической конференции (14-16 ноября 2011 г., Москва, Россия). Том I. / Под ред. В Н. Буркова, Д.А. Новикова. - М.: ИПУ РАН, 2011. -С. 172-176.
22. РАУШЕНБАХ Г.В. Меры близости и сходства в социологии // Анализ нечисловой информации в социологических исследованиях. - М.: Наука, 1985. - С. 169-203.
23. ХОЛЛЕНДЕР М., ВУЛФ Д. Непараметрические методы статистики. - М.: Финансы и статистика, 1983. - 518 с.
24. ШРЕЙДЕР Ю.А. Равенство, сходство, порядок. - М.: Наука, 1971. - 256 с.
25. JACKSON B.N., SCHNABLE P.S., ALURU S. Consensus Genetic Maps as Median Orders from Inconsistent Sources // IEEE/ACM Transactions on computational biology and bioin-formatics. - 2008. - Vol. 5, №2. - P. 161-171.
26. KEMENY J. Mathematics without Numbers // Daedalus. -1959. - Vol. 88. - P. 577-591.
27. KEMENY J. Generalized random variables // Pacific Journal of Mathematics. - 1959. - Vol. 9. - P. 1179-1189.
28. KLAMLER Ch. Kemeny's rule and Slater's rule: A binary comparison // Economics Bulletin. - 2003. - Vol. 4, №35. -P. 1-7.
29. MERLIN V., SAARI D.G. A geometric examination of Kemeny's rule // Social Choice and Welfare. - 2000. - Vol. 17, № 3. - P. 403-438.
ON MEAN VALUES
Alexander Orlov, Bauman Moscow State Technical University, Moscow Institute of Physics and Technology (State University), Moscow, DSc (economics), DSc (technics), PhD (mathematics), professor ([email protected]).
Abstract: New results in the theory of means (mean values) are given. We introduce the weighted means of type I corresponding to the sample, and those of type II corresponding to the set of order statistics. Evolution of ideas on Kemeny distance and Kemeny median is traced. We also propose a computation-friendly variation of Kemeny median, which avoids the "center of the bagel hole" effect. Then we generalize the Kemeny median by virtue of empirical and theoretical means in abstract spaces and prove the laws of large numbers for them.
Keywords: weighted means, Kemeny distance, Kemeny median, empirical means, theoretical means, laws of large numbers.
Статья представлена к публикации членом редакционной коллегии Д.А. Новиковым
Поступила в редакцию 08.05.2013.
Опубликована 30.11.2013.