К вопросу о точности асимптотических приближений формулы Бернулли

Карпов Иван Георгиевич; Грибков Алексей Николаевич

Математика и механика

УДК 519.2

К ВОПРОСУ О ТОЧНОСТИ АСИМПТОТИЧЕСКИХ ПРИБЛИЖЕНИЙ ФОРМУЛЫ БЕРНУЛЛИ

И.Г. Карпов, А.Н. Грибков

Тамбовский государственный технический университет E-mail: [email protected]

Предложены выражения для аппроксимации формулы Бернулли, позволяющие более точно определять вероятности появления события A ровно k раз при большом количестве независимых испытаний, если в каждом из них событие A наступает с вероятностью p.

Ключевые слова:

Формула Бернулли, независимые испытания, аппроксимация. Key words:

Bernoulli's formula, independent trials, approximation.

В теории вероятностей при решении целого ряда практических задач приходится сталкиваться со следующей схемой проведения испытаний: производится N независимых испытаний, в результате каждого из них происходит либо событие А с вероятностью р, либо противоположное ему событие С с вероятностью д=1-р. Два исхода каждого испытания (наступление события А либо события С) обычно обозначают символами «1» и «0» или называют «успехом» и «неудачей». Такая схема испытаний впервые была рассмотрена Я. Бернулли и носит его имя [1-3].

Вероятность Р^к) того, что событие А при N испытаниях наступит ровно к раз (к=1,2,...,^) определяется по формуле Бернулли [1-3]

Pn (k) =

NI

(N — к )1к I

к/і \N —к p (І — p* •

(l)

представляющей собой биномиальное распределение. Основными числовыми характеристиками распределения (1) являются математическое ожидание т, дисперсия Б, коэффициент асимметрии Ка и коэффициент эксцесса Кэ, определяемые соотношениями [4]:

1 - 6 рд

m = Np; D = Npq; Ka =

q—p ,

j^pq;

K =

Npq

С помощью формулы Бернулли можно вычислять вероятности появления событий при произ-

вольном, в том числе большом, числе испытаний N. Однако ее практическое использование сопряжено с трудностями уже при N>10, что вызвано необходимостью проведения операций над очень большими числами. Эти трудности можно преодолеть, например, путем использования специальных рекуррентных алгоритмов вычисления факториалов и степеней больших чисел, но это сопряжено с увеличением объемов вычислений и не всегда практически удобно. Значительного упрощения удается достичь также применением программных систем компьютерной математики. Однако и этот путь не может в полной мере решить проблему размерности задач и операций над весьма большими числами, возникающую, например, при анализе нескольких десятков и сотен испытаний. В то же время исследования асимптотического поведения вероятностей Рд(к) появления ровно к раз события А при N испытаниях при стремлении N к бесконечности дают возможность получать приближенные, но достаточно точные с практической точки зрения, значения этих вероятностей по значительно более простым выражениям, чем формула Бернулли (1).

В настоящее время в качестве асимптотических (приближенных) формул для вычисления вероятностей Рд(к) используют формулу

Pn (к)‘

І

Npq

exp

(к — Np)2 2 Npq

(2)

которая является следствием локальной теоремы Муавра-Лапласа, а также формулу Пуассона при р<0,05 [4]

Рк (к )>

(Мр)к к!

ехр[-Мр].

(3)

В течение последних 30 лет пристальное внимание многих исследователей привлекает семейство обратно гауссовских распределений [4-7]. В качестве аппроксимирующего распределения из этого семейства распределений широко используется распределение Вальда

0,5с

Р( х) =

х ехр

с -Я( х -р) -

■^пЯ( х-р.) 0,25с2

Я (х - р)

х > р,

(4)

Рм (к) =

р (N +1 - к) (1- р) к

Рм (к -1), Рм (0) = (1 - р)М; (5)

Рм (к) =

(1 - р)( к +1)

Рм (к +1), Рм (М) = рМ. (6)

А ровно к раз при различных значениях вероятности р, если количество независимых испытаний N>10:

1. Пусть 0<р<0,02. В этом случае можно использовать формулу Пуассона (3).

2. Если 0<р<0,45; М>6/рд, то для аппроксимации формулы (1) можно использовать распределение Вальда (4)

Р„ (к ) ' ^ х

х ехр

Я =

у]я Я (к - р)

0,25с2

с - Я () к - р-1,5

где с>0, Я>0, -ю<р<ю - параметры распределения (4). Оно имеет асимметричную форму с Ка>0 и также, как гауссовское и пуассоновское распределения, является безгранично делимым распределением.

Основная цель данной работы - предложить выражения, аналогичные (2) и (3), для аппроксимации формулы Бернулли (1), которые позволят более точно определять вероятности Рд(к) появления события А ровно к раз при большом количестве независимых испытаний, если в каждом из них событие А наступает с вероятностью р, а также рассмотреть условия, при которых возможен точный расчет вероятности Р^(к) без особых затруднений.

Отметим сразу, что если количество независимых испытаний N<10, то расчет вероятности Р^(к) появления события А ровно к раз можно производить точно по формуле Бернулли (1) либо с помощью рекуррентных формул

1 - 2 р р = Мр -

с =

Я (к - р)

9(N + 0,5)рд т

(9)

(1 - 2 р)2 9( N + 0,5) рд

1 - 2 р

3. Если 0,45<р<0,55; М>6/рд, то для аппроксимации формулы (1) используется гауссовское распределение

Рм (к )'■

1

-у/2п (N + 0,5) рд

ехр

(к - Мр)2 2( N + 0,5) рд

. (10)

Оно отличается от распределения (2) величиной дисперсии, что позволяет обеспечить более высокую точность аппроксимации распределения (1).

Таблица. Значения параметров N ир, при которых выполняются условия (7) или (8)

Условия (7) Р 0,001 0,002 0,005 0,01 0,02 0,05 0,1 0,15 0,2

N 1500 900 300 190 100 44 24 17 14

Условия (8) Р 0,999 0,998 0,995 0,99 0,98 0,95 0,9 0,85 0,8

N 1500 900 300 190 100 44 24 17 14

р (N - к)

Если количество независимых испытаний N>10, то удобнее прямые вычисления вероятности Рц(к) появления события А ровно к раз производить по рекуррентным формулам (5) и (6). При этом если выполняются условия

Рм(к) > 0,0001; 0 < к <10, (7)

то используется рекуррентная формула (5).

При выполнении условий

Рм (к) > 0,0001; N-10 < к < N (8)

используется рекуррентная формула (6). Верхние граничные значения параметров N и р, при которых еще выполняются условия (7) или (8), приведены в таблице.

Рассмотрим теперь приближенные формулы для расчета вероятности Р^(к) появления события

4. Если 0,55<р<1; №>6/рд, то для аппроксимации формулы (1) используется распределение Вальда (4) с Ка<0

0, 5с

Рм (к )>

х ехр

Я =-

Я(р- к) 0,25с2

с - Я (р - к) -1,5

2 р-1 р = Мр +

Я(р- к) 9(М + 0,5) рд (1 - 2 р)2 9( N + 0,5) рд

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

с =

2 р -1

5. Пусть 0,98<р<1; N>10. В этом случае для аппроксимации формулы Бернулли (1) можно использовать распределение Пуассона с Ка<0

(Мд)М-к

Рм (к )>

М (М - к)!

Рассмотрим два примера

ехр[-Мд].

Пример 1. Вероятность изделия некоторого производства оказаться бракованным равна 0,005. Чему равна вероятность того, что из 10000 наудачу отобранных изделий окажется ровно 55 бракованных изделий?

Решение. В соответствии с условием примера имеем p=0,005, N=10000, Р(А)=Рд(55). Прямые вычисления по формуле Бернулли (1) возможны только с использованием компьютерных технологий. Так, например, в среде МаШсаё имеется встроенная функция ёЫпош, с помощью которой можно вычислить вероятность Р(А)=Рд(55). При этом получим PN(55)=dbinoш(55,N,p)=0,042. Так как p=0,005, N>6^=1206, то в качестве приближенных формул используем формулы (3) и (9). Расчет по ним приводит к тому же результату. С помощью формулы (2) получим Рд(55)=0,044. Здесь появляется погрешность в третьем знаке после запятой.

Пример 2. Вероятность p появления события А при каждом испытании равна 0,45. Производится 150 независимых испытаний. Определить вероят-

СПИСОК ЛИТЕРАТУРЫ

1. Гнеденко Б.В. Курс теории вероятностей. - М.: Наука, 1988. -448 с.

2. Левин Б.Р. Теоретические основы статистической радиотехники. - М.: Радио и связь, 1989. - 656 с.

3. Вероятность и математическая статистика / гл. ред. Ю.В. Прохоров. - М.: Большая Российская энциклопедия, 1999. - 910 с.

4. Вадзинский Р.Н. Справочник по вероятностным распределениям. - СПб.: Наука, 2001. - 296 с.

5. Джонсон Н.Л., Коц С., Балакришнан Н. Одномерные непрерывные распределения. Ч. 1. - М.: БИНОМ. Лаборатория знаний, 2010. - 703 с.

ность Рд(к) того, что событие А наступит ровно 80 раз.

Решение. В соответствии с условием примера имеем p=0,45, N=150, Р(А)=Рд(80). Прямые вычисления по формуле Бернулли (1) в среде Mathcad позволяют найти вероятность Р(А)=РМ(80). При этом получим Рл(80)=8,057-10-3. Расчет по формуле (2) дает РЛ(80)=7,983-10-3, по формуле (9) - Рд<80)=8,078-10-3 ипо формуле (10) - Рд(80)=8,025-10-3. Следовательно, формулы (9) и (10) позволяют точнее производить расчет вероятности Рм(к), чем формула (2).

Выводы

Предложены выражения, аналогичные (2) и (3), для аппроксимации формулы Бернулли (1). Они позволяют более точно определять вероятности Рм(к) появления события А ровно к раз при большом количестве независимых испытаний, если в каждом из них событие А наступает с вероятностью р. Рассмотрены также условия, при которых возможен точный расчет вероятности Рм(к) по формуле Бернулли без особых затруднений.

6. Истигечева Е.В. Оценивание параметров гиперболического и обратного гауссовского распределений // Известия Томского политехнического университета. - 2006. - Т. 309. - № 6. -С. 11-13.

7. Бостанджиян В.А. Распределение Пирсона, Джонсона, Вей-булла и обратное нормальное. Оценивание их параметров. -Черноголовка: Редакционно-издательский отдел ИПХФ РАН, 2009. - 240 с.

Поступила 14.05.2012 г.

К вопросу о точности асимптотических приближений формулы Бернулли Текст научной статьи по специальности «Математика»

Аннотация научной статьи по математике, автор научной работы — Карпов Иван Георгиевич, Грибков Алексей Николаевич

Похожие темы научных работ по математике , автор научной работы — Карпов Иван Георгиевич, Грибков Алексей Николаевич

Текст научной работы на тему «К вопросу о точности асимптотических приближений формулы Бернулли»