ФИЗИКО-МАТЕМАТИЧЕСКИЕ НАУКИ ОМСКИЙ НАУЧНЫЙ ВЕСТНИК №2 (110) 2012
"ДК 519 87 П. А. БАТРАКОВ
А. В. МАЕР В. А. СИМАХИН
Омский государственный технический университет Курганский государственный университет
ОДНОМЕРНЫЙ НЕПАРАМЕТРИЧЕСКИЙ ДАТЧИК С УЧЕТОМ АПРИОРНОЙ ИНФОРМАЦИИ_________________________________________
В работе рассмотрен алгоритм одномерного непараметрического датчика, генерирующий случайную величину с учетом априорной информации различного вида. Проведено моделирование алгоритма датчика и выполнена проверка полученных данных по критериям согласия.
Ключевые слова: непараметрический датчик, априорная информация, случайная величина, функция распределения.
1. Введение
Методы статистического имитационного моделирования нашли широкое распространение как в научных исследованиях, так и в технических приложениях. Именно с их помощью удается получить выводы при исследовании сложных систем, зависящих от большого числа случайных факторов (переменных,
показателей, элементов). Особая роль при таких исследованиях отводится датчикам случайных величин (с.в.), которые должны адекватно отражать суть физических явлений, характерных как для отдельных элементов, так и для системы в целом. Определение функции распределения (ф.р.) Р(х) для корректной работы элемента (системы), фактически определяет задание математической модели физического явле-
Таблица 1
равномерная ф.р.
N = 10 N = 100
э.ф.р. м.э.ф.р. э.ф.р. м.э.ф.р.
М С М С М С М С
симметричная функция 113/ 0,26/ 111/ 0,21/ 10469/ 0,10/ 10461/ 0,07/
относительно точки 127,26/ 0,76/ 127,26/ 0,76/ 10723,75/ 0,22/ 10723,75/ 0,22/
ю о" N рис. 4 рис.4 рис. 4 рис.4 рис. 7 рис.7 рис. 7 рис.7
функция распределения 111/ 0.23/ 105/ 0.17/ 10002/ 0.07/ 10686/ 0.11/
ограничена на отрезке [0,1] 127,26/ 0,76/ 127,26/ 0,76/ 10723,75/ 0,22/ 10723,75/ 0,22/
рис.5 рис.5 рис.5 рис.5 рис.7 рис.7 рис.7 рис.7
известен квантиль М = 0,5 111/ 0.25/ 111/ 0.20/ 10111/ 0.09/ 10921/ 0,08/
(медиана) 127,26/ 0,76/ 127,26/ 0,76/ 10723,75/ 0,22/ 10723,75/ 0,22/
рис. 6 рис.6 рис. 6 рис.6 рис. 7 рис.7 рис. 7 рис.7
Таблица 2
нормальная ф.р.
N = 10 N = 100
э.ф.р. м.э.ф.р. э.ф.р. м.э.ф.р.
М С М С М С М С
симметричная функция 97/ 0.37/ 115/ 0,18/ 10027/ 0,10/ 10494/ 0,07/
относительно точки 127,26/ 0,76/ 127,26/ 0,76/ 10723,75/ 0,22/ 10723,75/ 0,22/
в = 0 рис.10 рис.10 рис.10 рис.10 рис. 13 рис.13 рис. 13 рис.13
функция распределения 93/ 0.31/ 104/ 0.25/ 9589/ 0.14/ 10443/ 0,06/
ограничена на отрезке 127,26/ 0,76/ 127,26/ 0,76/ 10723,75/ 0,22/ 10723,75/ 0,22/
[- 2;2] рис.11 рис.11 рис.11 рис.11 рис.14 рис.14 рис.14 рис.14
известен квантиль 117/ 0,30/ 111/ 0,26/ 10511/ 0,14/ 10052/ 0,12/
М = 0 (медиана) 127,26/ 0,76/ 127,26/ 0,76/ 10723,75/ 0,22/ 10723,75/ 0,22/
рис.12 рис.12 рис.12 рис.12 рис.15 рис.15 рис.15 рис.15
Рис. 1. Теоретическая ф.р, э.ф.р. и м.э.ф.р.: априорная информация - квантиль уровня 0,5 (медиана), объем выборки N = 10
Рис. 2. Теоретическая ф.р, э.ф.р. и м.э.ф.р.: априорная информация - симметричная функция относительно точки в = 0,5, объем выборки N = 10
ния, и тем самым определяет адекватность получаемых решений. Если известен вид ф.р. Р(х) случайной величины, то применяются стандартные параметрические датчики [1, 2]. Но при параметрическом подходе имеется ряд трудно формализуемых моментов (например, выбор вида распределения Р(х), задание его параметров, критерий адекватности и т.д.), которые могут привести к неизвестному смещению при окончательных выводах. Если о виде ф.р. ничего не известно, то для получения непараметрического датчика используется эмпирическая функция распределения (э.ф.р.) Рм(х) и ее сглаженные варианты [3, 4].
В действительности почти всегда что-нибудь известно об оцениваемом распределении. Эти знания составляют дополнительную априорную информацию о распределении, которая может быть учтена при разработке алгоритма датчика, например, информация: о непрерывности; симметрии относительно известного или неизвестного центра; о квантилях и моментах; функциональном виде и т.д., а также различные комбинации этих сведений. Наличие априорной информации позволяет уменьшить дисперсию оценки неизвестной ф.р. Р(х) по сравнению с э.ф.р. Рм(х) [5, 6]. Оценку ф.р. Р(х), полученную на основе априорной информации, будем называть модифицированной эмпирической функцией распределения (м.э.ф.р.) Р^(х) Ёы(х).
В данной работе рассмотрены основные принципы построения одномерных непараметрических датчиков с учетом дополнительной априорной информации на основе модифицированных оценок эмпирической функции распределения.
2. Постановка задачи и алгоритм датчика
Пусть априори известно, что Р(х) удовлетворяет условиям
5] =У((х^Р(х) = 0, I = 1.....г, (1)
где у уг — известные функции.
Пусть 5] = 1у1(х)у](x)dР(x) < ¥, I,] = 1,...,г и образуемая ими матрица Л не вырождена.
Задание априорной информации в виде (1) позволяет учесть широкий спектр априорной информации о Р(х), как количественного, так и качественного характера. Рассмотрим примеры.
1) Пусть известен квантиль М уровня р. В этом случае, г = 1, Р(М) = р; $[С(М - х) - р^Р(х) = 0. Таким образом, г = 1,у(х) = С(М - х) - р. С(х) — функция «единичного скачка» (функция Хевисайда).
2) Пусть известно, что Р(х)—симметричная функция относительно точки 0 — информация качественного характера. В этом случае имеем г = 1, Р(х) =
= 1 - Р(2в - х). Или Р(х) = 1 [Р(х) +1 - Р(2в - х)]. По-
2
следнее равенство представим в виде | [С(х - у) +1 -1
- С(2в - х - у)]—^(у) = 0. Таким образом, у(у,х, в) =
= -[С(х - У) +1 - С(2в - х - У)]
2
3) Пусть известно, что случайная величина определена на [а,Ь], ограниченный носитель. В этом
ОМСКИЙ НАУЧНЫЙ ВЕСТНИК №2 (110) 2012 ФИЗИКО-МАТЕМАТИЧЕСКИЕ НАУКИ
ФИЗИКО-МАТЕМАТИЧЕСКИЕ НАУКИ ОМСКИЙ НАУЧНЫЙ ВЕСТНИК №2 (110) 2012
Рис. 3. Теоретическая ф.р, э.ф.р. и м.э.ф.р.: априорная информация - ф.р. ограничена на отрезке [0,1], объем выборки N = 10
Ь ¥
случае имеем г = 1, | dР(x) = 1 или г = 1, | [С(Ь - х) -
а -¥
- С(а - х) - 1^-Р(х) = 0. Таким образом, у(у,х,в) = = [С(Ь - х) - С(а - х) - 1].
На рис. 1—3 приведены теоретическая функция распределения Р(х), эмпирическая функция распределения Рм(х) и модифицированная эмпирическая функция распределения РN (х) с учетом различного рода дополнительной информации.
Построение непараметрической оценки Р(х) с учетом априорной информации сводится к модификации
э.ф.р. pN (х) и приводит к асимптотически нормальным и оптимальным в смысле минимума дисперсии оценкам [5]. Опуская последовательность логических рассуждений и выводов, запишем оценку м.э.ф.р. в общем виде
pN(x) = pN (х) -
-\\^Wi(У)dpN(У)\\ Л^|| I С(х - y)W](y)dpN(y)\\ (2)
где ||...|| — вектор столбец, штрих означает транспонирование, а Лн матрица с элементами 5](РЪ1), и
Рис. 12
Рис. 13
FN(x) — э.ф.р. Функция FN(x) обладает следующими свойствами [5]:
1) асимптотически несмещенная оценка;
2) состоятельная оценка;
3) асимптотически оптимальная оценка;
4) л/N \Fn(x) - F(x)\ имеет асимптотически нормальное распределение Ф(0,стх2), где
s'2 = F(x) - F2(x) - ||JC(x -
- yУi(y)dF(y)\'Л-ЦJC(x - yyj(y)dF(y)\\. (3)
Анализ (3) показывает, что величина ||J C(x -
- y)Wi(y)dF(y)\\ Л_1||JC(x - y)yj(y)dF(y)\\ > 0, и, кро-
ме того, она является неубывающей функцией по г. Следовательно, введение дополнительной априорной информации может лишь улучшить свойства оценки Рм(х) по сравнению с э.ф.р., т.е. ОРм(х) < ОРм(х) .
Для построения непараметрического датчика с учетом априорной информации воспользуемся стандартным методом генерирования с.в. с помощью преобразования [7]
и = Р(Х). (4)
Как известно [7], случайная величина и будет независима и равномерно распределена на [0, 1]. С помощью обратного преобразования уравнения (4)
ОМСКИЙ НАУЧНЫЙ ВЕСТНИК №2 (110) 2012 ФИЗИКО-МАТЕМАТИЧЕСКИЕ НАУКИ
ФИЗИКО-МАТЕМАТИЧЕСКИЕ НАУКИ ОМСКИЙ НАУЧНЫЙ ВЕСТНИК №2 (110) 2012
Рис. 16. Теоретическая ф.р, э.ф.р. и м.э.ф.р.: априорная информация - квантиль уровня 0,5 (М=0,7),
объем выборки N = 100
Х=Р-1(и) и получают датчики случайных величин. Метод получения непараметрического датчика с учетом априорной информации заключается в следующем. Вместо неизвестной ф.р. Р(х) в (4), подставляют непараметрическую оценку м.э.ф.р. pN (х) и затем решается уравнение (4). Для решения уравнения воспользуемся алгоритмом стохастической аппроксимации [8]
х[т] = х[т - 1] - ут(^(х[т - 1]) - и). (5)
Данные теоретические результаты и позволяют практически создавать алгоритмы непараметрических датчиков с учетом априорной информации.
3. Моделирование.
В рамках исследования в качестве теоретической ф.р. рассматривались равномерная в [0, 1] ф.р. и нормальная ф.р. с параметрами сдвига 0 и масштаба 1. Выборки, полученные с помощью э.ф.р. и м.э.ф.р., проверялись на однородность с исходной выборкой по непараметрическим критериям Манна-Уитни-Уил-коксона [9] и Смирнова [10]. Результаты моделирования с.в. с учетом априорной информации приведены в табл. 1—2. В таблицах критерий Манна-Уитни-Уил-коксона обозначен как «М», а критерий Смирнова— «С». Полученные значения статистик и выборки приведены в виде число1/число2/график, где число! — вычисленное значение критерия, число2— пороговое значение критерия, график-рисунок с соответствующим номером, на котором изображены
данные полученные непараметрическим датчиком без учета априорной информации (точки, выделенные красным) и непараметрическим датчиком с учетом априорной информации (точки, выделенные синим). Для других законов распределения с.в. получаются аналогичные результаты. Отметим, что при этом алгоритм работы непараметрического датчика не изменяется.
4. Заключение
В условиях, когда количество натурных экспериментов ограничено малыми объемами N«10^15, использование априорной информации позволяет получать эффективные оценки неизвестной ф.р., непараметрический датчик с учетом этой информации приводит к лучшим результатам по сравнению с э.ф.р. (рис. 1-2, 4-6, 10-12). При увеличении объема экспериментальной выборки (N = 100) оценки э.ф.р. и м.э.ф.р. практически совпадают (рис. 79, 13-15).
Важно подчеркнуть, чтобы априорная информация была достоверной. На рис. 16 приведен график
э.ф.р. и м.э.ф.р. в случае, когда медиана М = 0,7 (истинная М = 0,5). Нетрудно заметить, что происходит смещение оценки, причем данное смещение не исчезает и с увеличением объема выборки.
Библиографический список
1. Симахин, В.А Непараметрические датчики случайных величин / В. А. Симахин, Е. Р. Терещенко // Датчики и средства первичной обработки информации. - Курган, 1990. - С. 110-112.
2. Маер, А. В. Параметрические и непараметрические датчики для моделирования надежности сложных технических систем / А. В. Маер // Молодежь и наука: реальность и будущее : II Межд. науч.-практ. конф. — Невинномысск, 2009. — С. 478-481.
3. Боровков, А. А. Математическая статистика / А. А. Боровков. — М. : Наука, 1984. — 472 с.
4. Мания, Г. М. Статистическое оценивание распределений вероятностей / Г. М. Мания. — Тбилиси : Изд-во Тбилис. унта, 1974. — 238 с.
5. Дмитриев, Ю. Г., Статистическое оценивание распределений вероятностей с использованием дополнительной информации / Ю. Г. Дмитриев, Ю. К. Устинов. — Томск : ТГУ, 1988. — 194 с.
6. Симахин, В. А Непараметрическая статистика. В 2 ч. Ч. I. Теория оценок / В. А. Симахин. — Курган : КГУ, 2004. — 216 с.
7. Ермаков, С. М., Курс статистического моделирования / С. М. Ермаков, Г. А. Михайлов — М. : Наука, 1976. — 320 с.
8. Цыпкин, Я. 3. Адаптация и обучение в автоматических системах / Я. 3. Цыпкин. — М. : Наука, 1968. — 399 с.
9. Хеттманспергер, Т. П. Статистические выводы, основанные на рангах / Т. П. Хеттманспергер, — М. : Финансы и статистика, 1987. — 334 с.
10. Бoльшeв, Л. Н. Taблицы мaтeмaтичecкoй ^aracra^ / Л. Н. Бoльшeв, Н. В. Cмиpнoв. — M. : Hayxa, 1983. — 41б c.
БАТРАКОВ Петр Андреевич, аспирант кафедры «Теплоэнергетика» Омского государственного технического университета.
МАЕР Алексей Владимирович, аспирант, преподаватель кафедры «Программное обеспечение автоматизированных систем» Курганского государственного университета.
СИМАХИН Валерий Ананьевич, кандидат физикоматематических наук, профессор кафедры «Программное обеспечение автоматизированных систем» Курганского государственного университета.
Адрес для переписки: e-mail: [email protected]
Статья поступила в редакцию 27.09.2011 г.
©П. А. Батраков, А. В. Маер, В. А. Симахин
Книжная полка
51/Г55
Гмурман, В. Е. Руководство к решению задач по теории вероятностей и математической статистике : учеб. пособие для вузов / В. Е. Гмурман. - 11-е изд., перераб. и доп. - М. : Юрайт, 2011. -404 с. - 1БВЫ 978-5-9916-1266-1. -978-5-9692-1180-3.
В пособии приведены необходимые теоретические сведения и формулы, даны решения типовых задач, помещены задачи для самостоятельного решения, сопровождающиеся ответами и указаниями. Большое внимание уделено методам статистической обработки экспериментальных данных.
51/Ш63
Шипачев, В. С. Высшая математика. Базовый курс : учеб. пособие для вузов / В. С. Шипачев ; под ред. А. Н. Тихонова. - 8-е изд., перераб. и доп. - М. : Юрайт, 2011. - 447 с. - 1БВЫ 978-5-9916-0822-0. -978-5-96920970-1.
В пособии изложен общий курс математики для студентов вузов. Основная особенность книги — сочетание необходимого теоретического материала с широким использованием методов решения основных типов задач по всем разделам курса. Пособие отличается высоким уровнем строгости и методической продуманности изложения, точностью формулировок основных понятий и теорем, краткостью и доступностью доказательств.
51/В29
Вентцель, Е. С. Исследование операций: задачи, принципы, методология : учеб. пособие / Е. С. Вент-цель. - 5-е изд., стер. - М. : КНОРУС, 2010. - 191 с. - 1БВЫ 978-5-406-00682-5.
Популярно изложены основы исследования операций — науки о выборе разумных, научно обоснованных решений во всех областях целенаправленной человеческой деятельности. Главное внимание уделяется не математическому аппарату, а вопросам методологии.
531/П54
Поляхов, Н. Н. Теоретическая механика : учеб. для вузов по направлениям и специальностям «Математика» и «Механика» для бакалавров / Н. Н. Поляков, С. А. Зегжда, М. П. Юшков ; под ред. П. Е. Тов-стика. - 3-е изд., перераб. и доп. - М. : Юрайт, 2012. - 593 с. - 1БВЫ 978-5-9916-1469-6.
В книге наряду с традиционными разделами теоретической механики охвачен широкий круг специальных вопросов (нелинейные колебания, устойчивость движения, динамика полета, интегральные инварианты, оптико-механическая аналогия, теория удара механических систем с идеальными связями); используется нетрадиционный подход к выводу уравнений динамики как голономных, так и неголономных систем; подробно анализируется понятие «идеальность связей»; показано логическое единство дифференциальных вариационных принципов механики. Интегральные вариационные принципы получены из выражения для вариаций действия по Гамильтону. Соответствует Федеральному государственному образовательному стандарту ВПО третьего поколения.
ОМСКИЙ НАУЧНЫЙ ВЕСТНИК №2 (110) 2012 ФИЗИКО-МАТЕМАТИЧЕСКИЕ НАУКИ