Научная статья на тему 'Проверка гипотезы о распределениях случайных величин на основе непараметрического метода доверительного оценивания плотности вероятности'

Проверка гипотезы о распределениях случайных величин на основе непараметрического метода доверительного оценивания плотности вероятности Текст научной статьи по специальности «Математика»

CC BY
81
18
i Надоели баннеры? Вы всегда можете отключить рекламу.
Область наук
Ключевые слова
ПРОВЕРКА ГИПОТЕЗ / ПЛОТНОСТИ ВЕРОЯТНОСТИ / ОЦЕНКА РОЗЕНБЛАТТА-ПАРЗЕНА / АСИМПТОТИЧЕСКИЕ СВОЙСТВА / ДОВЕРИТЕЛЬНОЕ ОЦЕНИВАНИЕ / TESTING OF HYPOTHESIS / PROBABILITY DENSITIES / ROSENBLATT-PARZEN'S ASSESSMENT / ASYMPTOTIC PROPERTIES / CONFIDENCE ESTIMATION

Аннотация научной статьи по математике, автор научной работы — Лапко А. В., Лапко В. А., Юронен Е. А.

Предлагаются алгоритмический подход проверки гипотезы о тождественности законов распределения случайных величин. Его основу составляет методика построения доверительных границ для плотности вероятности.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Лапко А. В., Лапко В. А., Юронен Е. А.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Testing hypothesis of random variables independence on the basis of nonparametric method of confidence estimation of probability density

The paper proposes algorithmic approach of hypothesis testing of identity of distribution laws of random values. Its basis is developed by a technique of creation of confidence borders for a probability density.

Текст научной работы на тему «Проверка гипотезы о распределениях случайных величин на основе непараметрического метода доверительного оценивания плотности вероятности»

<Тешетневс^ие чтения. 2016

сти независимых случайных величин // Информатика и системы управления. 2012. № 1(31). С. 166-174.

5. Lapko A. V., Lapko V. A. Optimal selection of the number of sampling intervals in domain of variation of a one-dimensional random variable in estimation of the probability density // Measurement Techniques. 2013. Vol. 56, No. 7. Рр. 763-767.

References

1. Lapko A. V., Lapko V. A. Nonparametric algorithms of pattern recognition in the problem of testing a statistical hypothesis on identity of two distribution laws of random variables. Optoelectronics, Instrumentation and Data Processing, 2010. Vol. 46, No. 6, pp. 545-550.

2. Lapko A. V., Lapko V. A. Comparison of empirical and theoretical distribution functions of a random variable on the basis of a nonparametric classifier. Optoelectro-

nics, Instrumentation and Data Processing, 2012. Vol. 48, No. 1, pp. 37-41.

3. Epanechnikov V. A. [Nonparametric estimator of multidimensional probability density]. Teoriya veroyatnosti i ee primeneniya. 1969, Vol. 14, No. 1, pp. 156-161 (In Russ.).

4. Lapko A. V., Lapko V. A. [Properties of nonparametric estimates of multidimensional probability density of independent random variables]. Informatika i systemy upravleniya. 2012, Vol. 31, No. 1, pp. 166-174 (In Russ.).

5. Lapko A. V., Lapko V. A. Optimal selection of the number of sampling intervals in domain of variation of a one-dimensional random variable in estimation of the probability density. Measurement Techniques. 2013. Vol. 56, No. 7, pp. 763-767.

© HanKO A. B., HanKO B. A., MpoHeH E. A., 2016

УДК 519.24

ПРОВЕРКА ГИПОТЕЗЫ О РАСПРЕДЕЛЕНИЯХ СЛУЧАЙНЫХ ВЕЛИЧИН НА ОСНОВЕ НЕПАРАМЕТРИЧЕСКОГО МЕТОДА ДОВЕРИТЕЛЬНОГО ОЦЕНИВАНИЯ ПЛОТНОСТИ

ВЕРОЯТНОСТИ1

А. В. Лапко1, 2*, В. А. Лапко1, 2, Е. А. Юронен1

Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнева Российская Федерация, 660037, г. Красноярск, просп. им. газ. «Красноярский рабочий», 31 2Институт вычислительного моделирования СО РАН Российская Федерация, 660036, г. Красноярск, Академгородок, 50/44 E-mail: [email protected]

Предлагаются алгоритмический подход проверки гипотезы о тождественности законов распределения случайных величин. Его основу составляет методика построения доверительных границ для плотности вероятности.

Ключевые слова: проверка гипотез, плотности вероятности, оценка Розенблатта-Парзена, асимптотические свойства, доверительное оценивание.

TESTING HYPOTHESIS OF RANDOM VARIABLES INDEPENDENCE ON THE BASIS OF NONPARAMETRIC METHOD OF CONFIDENCE ESTIMATION OF PROBABILITY DENSITY

A. V. Lapko1, 2*, V. A. Lapko1, 2, E. A. Yuronen1

1Reshetnev Siberian State Aerospace University 31, Krasnoyarsky Rabochy Av., Krasnoyarsk, 660037, Russian Federation

2Institute of Computational Modeling SB RAS 50/44, Akademgorodok, Krasnoyarsk, 660036, Russian Federation E-mail: [email protected]

The paper proposes algorithmic approach of hypothesis testing of identity of distribution laws of random values. Its basis is developed by a technique of creation of confidence borders for a probability density.

Keywords: testing of hypothesis, probability densities, Rosenblatt-Parzen's assessment, asymptotic properties, confidence estimation.

1 Работа выполнена в рамках базовой части государственного задания Минобрнауки РФ (СибГАУ № Б121/14) и программы СО РАН IV.35.1.

Математические методы моделирования, управления и анализа данных.

Задачи проверки гипотез о распределениях случайных величин являются одними из основных в теории математической статистики. Для их решения широко используется критерий согласия К. Пирсона [1]. Однако методика формирования этого критерия содержит трудно формализуемый этап разбиения области значений случайных величин на интервалы. Перспективной является методика, основанная на замене задачи проверки гипотез о распределениях случайных величин задачей проверки гипотезы о равенстве вероятностей ошибки распознавания образов пороговому значению [2; 3].

Задачи проверки статистических гипотез о распределениях случайных величин тесно связаны с построением доверительных областей для их плотностей вероятности либо функций распределения [1].

В данной работе предлагается и исследуется алгоритмический подход проверки гипотезы о распределениях случайных величин, использующий доверительные границы их плотностей вероятности. Основу подхода составляет регрессионная оценка плотности вероятности. Полученные результаты имеют важное значение при обработке данных дистанционного зондирования Земли.

Пусть имеются две независимые выборки

Ух = (, I = 1, п1 ) и У2 = (, I = 1, п2 ) одномерных

случайных величин, извлечённых из генеральных совокупностей Х1, Х2, которые характеризуются неизвестными плотностями вероятности р1 (х), р2 (х). Необходимо подтвердить либо опровергнуть гипотезу Н0 о тождественности их законов распределения.

В работе [4] предложена методика построения доверительных границ плотности вероятности, которая основывается на регрессионной оценки плотности вероятности [5].

Обозначим через О,, t = 1, 2 доверительные области для плотностей вероятности р{ (х), , = 1, 2, при заданном коэффициенте доверия у .

Тогда выполнение гипотезы Н0 определяется следующим правилом:

"12

(Г):

гипотеза Н0 справедлиа, если

О1 с О2 либо О2 сП1,

в противном случае гипотеза Н0 отвергается.

Лг):

Для реализации данного правила в соответствии с результатами работы [4] построим для плотностей вероятности р1 (х), р2 (х) доверительные границы

рв (х), ррн (х), , = 1, 2, с коэффициентом доверия у.

Пусть V7 - множество значений случайной величины х1 & Vt, 1 = 1, И,, попадающих в доверительную область плотности вероятности р{ (х), , = 1,2, при заданном коэффициенте доверия у . Формирование множества V/ осуществляется на основе следующего решающего правила:

m, (xS): xj eV/ , pВ (xj )> pt (xj )> p'B (xj), j = 1, nt, t = 1, 2.

Нетрудно заметить, что множество V/ представляет собой оценку доверительной области Qt, t = 1, 2 . Поэтому появляется возможность вместо m12 (г) использовать правило

гипотеза H0 справедлива, если Рн2 (xj )> pн (xj ) и ppB2 (xj )< pi (xj ) V xj e V2 либо

pн (xj )> pн2 (xj ) и pi (xj )< p2B (xj ) V xj e V1 .

Данное правило основано на замене операций с доверительными областями Qt, t = 1, 2, заданных

множествами Vf, t = 1, 2, на проверку соотношений

между их границами pв (x), p(x), t = 1, 2.

Структура регрессионной оценки плотности вероятности позволяет на её основе решить проблему доверительного оценивания плотности вероятности. Идея предлагаемого подхода состоит в декомпозиции исходных статистических данных и последующем анализе вероятностных характеристик получаемых множеств случайных величин. На этой основе, используя непараметрическую оценку кривой регрессии, осуществляется синтез доверительных границ плотности вероятности. Размеры области, определяемые доверительными границами, зависят от количества интервалов дискретизации случайных величин, их вероятностных характеристик и объёма n исходных статистических данных.

Если доверительная область плотности вероятности включает доверительную область другой сравниваемой плотности, то они являются тождественными. В противном случае гипотеза о тождественности законов распределения случайных величин отвергается.

Предложенный подход открывает возможность обобщения полученных результатов на проверку гипотез о распределениях многомерных случайных величин.

Библиографические ссылки

1. Пугачёв В. С. Теория вероятностей и математическая статистика. М. : Физматлит, 2002. 496 с.

2. Lapko A. V., Lapko V. A. Nonparametric algorithms of pattern recognition in the problem of testing a statistical hypothesis on identity of two distribution laws of random variables // Optoelectronics, Instrumentation and Data Processing. 2010. Vol. 46. No. 6. Рр. 545-550.

3. Lapko A. V., Lapko V. A. Comparison of empirical and theoretical distribution functions of a random variable on the basis of a nonparametric classifier // Optoelectronics, Instrumentation and Data Processing. 2012. Vol. 48, No. 1. Рр. 37-41.

Решетневс^ие чтения. 2016

4. Lapko A. V., Lapko V. A. Construction of Confidence Limits for the Probability Density Function on the Basis of Nonparametric Estimation of the Function // Measurement Techniques. 2014. Vol. 56. No. 12. Pp. 1354-1357.

5. Lapko A. V., Lapko V. A. Regression estimate of the multidimensional probability density and its properties // Optoelectronics, Instrumentation and Data Processing. 2014. Vol. 50. No. 2. Pp. 148-153.

References

1. Pugachev V. S. Teoriya veroyatnostey i matemati-cheskaya statistika [Probability Theory and Mathematical Statistics]. Moscow, Fizmatlit Publ., 2002, 496 p.

2. Lapko A. V., Lapko V. A. Nonparametric algorithms of pattern recognition in the problem of testing a statistical hypothesis on identity of two distribution laws

of random variables. Optoelectronics, Instrumentation and Data Processing, 2010. Vol. 46, No. 6, pp. 545-550.

3. Lapko A. V., Lapko V. A. Comparison of empirical and theoretical distribution functions of a random variable on the basis of a nonparametric classifier. Optoelectronics, Instrumentation and Data Processing, 2012. Vol. 48, No. 1, pp. 37-41.

4. Lapko A. V., Lapko V. A. Construction of Confidence Limits for the Probability Density Function on the Basis of Nonparametric Estimation of the Function. Measurement Techniques, 2014. Vol. 56, No. 12, pp. 1354-1357.

5. Lapko A. V., Lapko V. A. Regression estimate of the multidimensional probability density and its properties. Optoelectronics, Instrumentation and Data Processing, 2014. Vol. 50, No. 2, pp. 148-153.

© HanKO A. B., HanKO B. A., MpoHeH E. A., 2016

УДК 004.891.3

ПРОГРАММНАЯ СИСТЕМА ОПРЕДЕЛЕНИЯ СТЕПЕНИ ТЯЖЕСТИ ПЕРИТОНИТА

Л. В. Липинский1, Т. В. Кушнарева1*, Е. В. Дябкин2

1Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнева Российская Федерация, 660037, г. Красноярск, просп. им. газ. «Красноярский рабочий», 31 2Красноярский государственный медицинский университет имени профессора В. Ф. Войно-Ясенецкого Российская Федерация, 660022, г. Красноярск, ул. Партизана Железняка, 1 E-mail: [email protected]

Рассматриваются вопросы разработки и применения программных систем в медицинской сфере. Дистанционные и автоматизированные средства диагностики здоровья являются актуальной научной задачей, особенно для ракетно-космической отрасли.

Ключевые слова: деревья принятия решений, медицинская диагностика.

SOFTWARE SYSTEM DETERMINING THE SEVERITY OF PERITONITIS

L. V. Lipinskiy1, T. V. Kushnareva1*, E. V. Dyabkin2

1Reshetnev Siberian State Aerospace University 31, Krasnoyarsky Rabochy Av., Krasnoyarsk, 660037, Russian Federation

2Krasnoyarsk State Medical University 1, Partizana Zheleznyaka Str., Krasnoyarsk, 660022, Russian Federation E-mail: [email protected]

The paper discusses issues related to the development and application of software systems in the medical field. Remote and automated health diagnostic tools are significant scientific task especially for the space industry.

Keywords: decision trees, medical diagnosis.

Введение. Авторами была разработана программная система «Определение степени тяжести перитонита», которая позволит повысить эффективность диагностики заболевания. Система не подвержена человеческому фактору, скорость расчета значений показателей выше, чем у специалиста-врача, ошибка классификации степени тяжести составила 0 % на

тестовой выборке, предоставленной медицинскими специалистами, что гарантирует качественную постановку диагноза. В программе предусмотрено определение степени тяжести перитонита как у одного пациента, так у группы. Сам алгоритм программы представляет дерево принятия решений (рис. 1), полученное с помощью программной системы, зарегистриро-

i Надоели баннеры? Вы всегда можете отключить рекламу.