Математика и механика
УДК 519.2
К ВОПРОСУ О ТОЧНОСТИ АСИМПТОТИЧЕСКИХ ПРИБЛИЖЕНИЙ ФОРМУЛЫ БЕРНУЛЛИ
И.Г. Карпов, А.Н. Грибков
Тамбовский государственный технический университет E-mail: [email protected]
Предложены выражения для аппроксимации формулы Бернулли, позволяющие более точно определять вероятности появления события A ровно k раз при большом количестве независимых испытаний, если в каждом из них событие A наступает с вероятностью p.
Ключевые слова:
Формула Бернулли, независимые испытания, аппроксимация. Key words:
Bernoulli's formula, independent trials, approximation.
В теории вероятностей при решении целого ряда практических задач приходится сталкиваться со следующей схемой проведения испытаний: производится N независимых испытаний, в результате каждого из них происходит либо событие А с вероятностью р, либо противоположное ему событие С с вероятностью д=1-р. Два исхода каждого испытания (наступление события А либо события С) обычно обозначают символами «1» и «0» или называют «успехом» и «неудачей». Такая схема испытаний впервые была рассмотрена Я. Бернулли и носит его имя [1-3].
Вероятность Р^к) того, что событие А при N испытаниях наступит ровно к раз (к=1,2,...,^) определяется по формуле Бернулли [1-3]
Pn (k) =
NI
(N — к )1к I
к/і \N —к p (І — p* •
(l)
представляющей собой биномиальное распределение. Основными числовыми характеристиками распределения (1) являются математическое ожидание т, дисперсия Б, коэффициент асимметрии Ка и коэффициент эксцесса Кэ, определяемые соотношениями [4]:
1 - 6 рд
m = Np; D = Npq; Ka =
q—p ,
j^pq;
K =
Npq
С помощью формулы Бернулли можно вычислять вероятности появления событий при произ-
вольном, в том числе большом, числе испытаний N. Однако ее практическое использование сопряжено с трудностями уже при N>10, что вызвано необходимостью проведения операций над очень большими числами. Эти трудности можно преодолеть, например, путем использования специальных рекуррентных алгоритмов вычисления факториалов и степеней больших чисел, но это сопряжено с увеличением объемов вычислений и не всегда практически удобно. Значительного упрощения удается достичь также применением программных систем компьютерной математики. Однако и этот путь не может в полной мере решить проблему размерности задач и операций над весьма большими числами, возникающую, например, при анализе нескольких десятков и сотен испытаний. В то же время исследования асимптотического поведения вероятностей Рд(к) появления ровно к раз события А при N испытаниях при стремлении N к бесконечности дают возможность получать приближенные, но достаточно точные с практической точки зрения, значения этих вероятностей по значительно более простым выражениям, чем формула Бернулли (1).
В настоящее время в качестве асимптотических (приближенных) формул для вычисления вероятностей Рд(к) используют формулу
Pn (к)‘
І
Npq
exp
(к — Np)2 2 Npq
(2)
которая является следствием локальной теоремы Муавра-Лапласа, а также формулу Пуассона при р<0,05 [4]
Рк (к )>
(Мр)к к!
ехр[-Мр].
(3)
В течение последних 30 лет пристальное внимание многих исследователей привлекает семейство обратно гауссовских распределений [4-7]. В качестве аппроксимирующего распределения из этого семейства распределений широко используется распределение Вальда
0,5с
Р( х) =
х ехр
с -Я( х -р) -
■^пЯ( х-р.) 0,25с2
Я (х - р)
х > р,
(4)
Рм (к) =
р (N +1 - к) (1- р) к
Рм (к -1), Рм (0) = (1 - р)М; (5)
Рм (к) =
(1 - р)( к +1)
Рм (к +1), Рм (М) = рМ. (6)
А ровно к раз при различных значениях вероятности р, если количество независимых испытаний N>10:
1. Пусть 0<р<0,02. В этом случае можно использовать формулу Пуассона (3).
2. Если 0<р<0,45; М>6/рд, то для аппроксимации формулы (1) можно использовать распределение Вальда (4)
Р„ (к ) ' ^ х
х ехр
Я =
у]я Я (к - р)
0,25с2
с - Я () к - р-1,5
где с>0, Я>0, -ю<р<ю - параметры распределения (4). Оно имеет асимметричную форму с Ка>0 и также, как гауссовское и пуассоновское распределения, является безгранично делимым распределением.
Основная цель данной работы - предложить выражения, аналогичные (2) и (3), для аппроксимации формулы Бернулли (1), которые позволят более точно определять вероятности Рд(к) появления события А ровно к раз при большом количестве независимых испытаний, если в каждом из них событие А наступает с вероятностью р, а также рассмотреть условия, при которых возможен точный расчет вероятности Р^(к) без особых затруднений.
Отметим сразу, что если количество независимых испытаний N<10, то расчет вероятности Р^(к) появления события А ровно к раз можно производить точно по формуле Бернулли (1) либо с помощью рекуррентных формул
1 - 2 р р = Мр -
с =
Я (к - р)
9(N + 0,5)рд т
(9)
(1 - 2 р)2 9( N + 0,5) рд
1 - 2 р
3. Если 0,45<р<0,55; М>6/рд, то для аппроксимации формулы (1) используется гауссовское распределение
Рм (к )'■
1
-у/2п (N + 0,5) рд
ехр
(к - Мр)2 2( N + 0,5) рд
. (10)
Оно отличается от распределения (2) величиной дисперсии, что позволяет обеспечить более высокую точность аппроксимации распределения (1).
Таблица. Значения параметров N ир, при которых выполняются условия (7) или (8)
Условия (7) Р 0,001 0,002 0,005 0,01 0,02 0,05 0,1 0,15 0,2
N 1500 900 300 190 100 44 24 17 14
Условия (8) Р 0,999 0,998 0,995 0,99 0,98 0,95 0,9 0,85 0,8
N 1500 900 300 190 100 44 24 17 14
р (N - к)
Если количество независимых испытаний N>10, то удобнее прямые вычисления вероятности Рц(к) появления события А ровно к раз производить по рекуррентным формулам (5) и (6). При этом если выполняются условия
Рм(к) > 0,0001; 0 < к <10, (7)
то используется рекуррентная формула (5).
При выполнении условий
Рм (к) > 0,0001; N-10 < к < N (8)
используется рекуррентная формула (6). Верхние граничные значения параметров N и р, при которых еще выполняются условия (7) или (8), приведены в таблице.
Рассмотрим теперь приближенные формулы для расчета вероятности Р^(к) появления события
4. Если 0,55<р<1; №>6/рд, то для аппроксимации формулы (1) используется распределение Вальда (4) с Ка<0
0, 5с
Рм (к )>
х ехр
Я =-
Я(р- к) 0,25с2
с - Я (р - к) -1,5
2 р-1 р = Мр +
Я(р- к) 9(М + 0,5) рд (1 - 2 р)2 9( N + 0,5) рд
с =
2 р -1
5. Пусть 0,98<р<1; N>10. В этом случае для аппроксимации формулы Бернулли (1) можно использовать распределение Пуассона с Ка<0
(Мд)М-к
Рм (к )>
М (М - к)!
Рассмотрим два примера
ехр[-Мд].
Пример 1. Вероятность изделия некоторого производства оказаться бракованным равна 0,005. Чему равна вероятность того, что из 10000 наудачу отобранных изделий окажется ровно 55 бракованных изделий?
Решение. В соответствии с условием примера имеем p=0,005, N=10000, Р(А)=Рд(55). Прямые вычисления по формуле Бернулли (1) возможны только с использованием компьютерных технологий. Так, например, в среде МаШсаё имеется встроенная функция ёЫпош, с помощью которой можно вычислить вероятность Р(А)=Рд(55). При этом получим PN(55)=dbinoш(55,N,p)=0,042. Так как p=0,005, N>6^=1206, то в качестве приближенных формул используем формулы (3) и (9). Расчет по ним приводит к тому же результату. С помощью формулы (2) получим Рд(55)=0,044. Здесь появляется погрешность в третьем знаке после запятой.
Пример 2. Вероятность p появления события А при каждом испытании равна 0,45. Производится 150 независимых испытаний. Определить вероят-
СПИСОК ЛИТЕРАТУРЫ
1. Гнеденко Б.В. Курс теории вероятностей. - М.: Наука, 1988. -448 с.
2. Левин Б.Р. Теоретические основы статистической радиотехники. - М.: Радио и связь, 1989. - 656 с.
3. Вероятность и математическая статистика / гл. ред. Ю.В. Прохоров. - М.: Большая Российская энциклопедия, 1999. - 910 с.
4. Вадзинский Р.Н. Справочник по вероятностным распределениям. - СПб.: Наука, 2001. - 296 с.
5. Джонсон Н.Л., Коц С., Балакришнан Н. Одномерные непрерывные распределения. Ч. 1. - М.: БИНОМ. Лаборатория знаний, 2010. - 703 с.
ность Рд(к) того, что событие А наступит ровно 80 раз.
Решение. В соответствии с условием примера имеем p=0,45, N=150, Р(А)=Рд(80). Прямые вычисления по формуле Бернулли (1) в среде Mathcad позволяют найти вероятность Р(А)=РМ(80). При этом получим Рл(80)=8,057-10-3. Расчет по формуле (2) дает РЛ(80)=7,983-10-3, по формуле (9) - Рд<80)=8,078-10-3 ипо формуле (10) - Рд(80)=8,025-10-3. Следовательно, формулы (9) и (10) позволяют точнее производить расчет вероятности Рм(к), чем формула (2).
Выводы
Предложены выражения, аналогичные (2) и (3), для аппроксимации формулы Бернулли (1). Они позволяют более точно определять вероятности Рм(к) появления события А ровно к раз при большом количестве независимых испытаний, если в каждом из них событие А наступает с вероятностью р. Рассмотрены также условия, при которых возможен точный расчет вероятности Рм(к) по формуле Бернулли без особых затруднений.
6. Истигечева Е.В. Оценивание параметров гиперболического и обратного гауссовского распределений // Известия Томского политехнического университета. - 2006. - Т. 309. - № 6. -С. 11-13.
7. Бостанджиян В.А. Распределение Пирсона, Джонсона, Вей-булла и обратное нормальное. Оценивание их параметров. -Черноголовка: Редакционно-издательский отдел ИПХФ РАН, 2009. - 240 с.
Поступила 14.05.2012 г.