Шашков В.Б.
НЕКОТОРЫЕ РЕЗУЛЬТАТЫ КОМПЬЮТЕРНЫХ ЭКСПЕРИМЕНТОВ, МОДЕЛИРУЮЩИХ ПРОЦЕДУРЫ ОЦЕНИВАНИЯ ПАРАМЕТРОВ
РАСПРЕДЕЛЕНИЯ
Разработана программная модель процедур статистического оценивания параметров распределения, включающая оригинальные уравнения для критических точек 1- и У ^-распределений. Получены уравнения и оценена сила стохастической связи между точностью выборочных оценок Мх* и Эх', объемом выборок и генеральной дисперсией. Получены количественные показатели эффективности интервальных оценок, построенных по усредненным данным нескольких выборок.
Разработана программная модель выполнения статистических процедур, которая позволяет:
- создавать большие (например, по десять тысяч элементов) нормально распределенные массивы, моделирующие генеральные совокупности с заданными значениями математического ожидания и дисперсии;
- извлекать из этих совокупностей заданное количество выборок заданного объема (например, сто выборок объемом по сто элементов) с получением точечных и интервальных оценок параметров распределения при вероятностях 0,95; 0,90 и 0,80. При этом оценки по выборкам могут быть получены как «индивидуальные», так и «общие», т. е. усредненные по всей совокупности выборок;
- проводить массовые статистические эксперименты с целью получения экспериментальных данных, количество которых достаточно для построения соответствующих эмпирических формул, отражающих стохастические или функциональные зависимости между величинами - объектами эксперимента.
Первой задачей, возникающей при создании такой программной модели, является необходимость представления в ней материала статистических таблиц, содержащих критические точки распределения Стьюдента, у2-распре-деления Пирсона и т. п. В некоторых случаях содержание таких таблиц в подпрограммы вводится непосредственно (см., например, [1], с. 338). Более удобной и компактной формой является представление этих данных в аналитическом виде. С этой целью при выполнении настоящей работы были выведены эмпирические уравнения, воспроизводящие табличные данные с высокой точностью.
Использовались два вида эмпирических формул. Для нахождения уравнений нелинейной парной зависимости существует метод подбора наиболее подходящей формулы из на-
бора наиболее часто применяемых функций типа
1 1 х
у = Ь„ х Ьх или у =-и т. п.
01 Ь0 +^хх
При этом функции линеаризуются, а коэффициенты Ь находят методом наименьших квадратов [2]. Такие уравнения будем называть парными зависимостями. Точность отражения экспериментальных данных их расчетными значениями будем оценивать значениями их коэффициентов корреляции.
Второй вид используемых уравнений - алгебраические степенные полиномы регрессии. Согласие между экспериментальными (или табличными) и расчетными данными при использовании полиномов будем оценивать по принятым показателям [3]. К ним относится остаточная дисперсия уравнения регрессии:
81
11 ^ (у§ - уО2
.§=1
(1)
п - (к+1)
где у^- экспериментальное или табличное значение функции, аппроксимируемое полиномом регрессии;
уг^- рассчитанное по полиному значение функции;
g - номер строки таблицы данных; п - количество строк в таблице; (к+1) - количество коэффициентов регрессии в полиноме.
В качестве второго показателя качества полинома регрессии использовалось корреляционное отношенее /3/, которое по существу является коэффициентом функциональности рассматриваемого уравнения
КО =
^(У§- Уг§)2
(2)
1 (У§- у§)
§=1
где уЁ - среднее арифметическое вектора экспериментальных значений аппроксимируемой функции.
2
Следующим показателем качества полинома явилась интервальная оценка для математического ожидания расчетного значения функции М{у^} (чем уже интервал, тем уравнение регрессии точнее [4]).
При построении уравнений для критических границ доверительных интервалов пользовались данными статистических таблиц источника [2].
Для критических точек распределения Стьюдента были найдены парные зависимости вида
t =
V
(3)
Ь1 'V-Ь0 где V - число степеней свободы,
Ь. - эмпирические коэффициенты.
Для всех принятых вероятностей коэффициент корреляции табличных и расчетных данных для этих уравнений был более 0,99999. Значения коэффициентов Ь. составили:
- при р=0,95 Ь0= - 0,6130; Ь1= 0,5101;
- при р=0,90 Ь0= - 0,5618; Ь1= 0,6079;
- при р=0,80 Ь0= - 0,5151: Ь1=0,7803.
Эти уравнения и были введены в программную модель.
При определении критических точек X -распределения Пирсона при значении числа степеней свободы V до тридцати используют табулированные данные; если же п>30, критическое значение X рассчитывают по уравнению Уил-сона - Гилферти
2 2 С2 =V(1^:2 ± Uj—)3,
(4)
где U
9v 4V9V квантиль нормального стандартного
распределения при данном уровне значимости.
При проведении настоящей работы для двусторонних границ доверительных интервалов X2 -распределения (при р = 0,95; 0,90 и 0,80) получены уравнения регрессии для чисел степеней свободы V от четырех до ста. Уравнения выведены следующим образом. Значения критических границ X -распределения при числе степеней свободы от 4 до 40 были заимствованы из работы [2]. Для значений V от 35 до 100 они были рассчитаны по уравнению (4). Затем эти данные были объединены в единую задачу регрессии, где числа V играли роль табличноза-данных аргументов, а значения С - таблично-заданных функций. Зависимость между ними искалась в виде полинома
у=Ь0+Ь1 V +Ь2 V 2+.........+Ьк Vк, (5)
где индекс при коэффициенте Ь показывает степень аргумента.
Для трех двусторонних интервальных оценок (при р = 0,95; 0,90 и 0,80) были получены шесть полиномов регрессии: три - для левой и три для правой границы. По своим качественным показателям каждое уравнение было «на 100% функцией»: остаточная дисперсия во всех случаях равнялась нулю, корреляционное отношение (коэффициент функциональности) составило единицу, а максимальная ширина интервала для математического ожидания расчетного значения х2 (т. е. величины М{ X2 расчет}) равнялась 0,007 - т. е. лежала в пределах погрешности расчетов.
Приводим значения коэффициентов Ь для всех шести уравнений (левые и правые границы) для возможного использования другими исследователями.
Индекс в скобках указывает степень аргумента V:
b_lv80[0 b_lv80[l b_lv80[2 b_lv80[3 b_lv80[4 b_lv80[5 b_lv80[6
b_lv90[0 b_lv90[l b_lv90[2 b_lv90p b_lv90[4 b_lv90[5 b_lv90[6
b_lv95 [0 b_lv95[l b_lv95 [2 b_lv95 [3 b_lv95 [4 b_lv95 [5 b_lv95 [б
=-1.38524144760049E+0000 b_pr80[0
= 5.28109666031924E-0001 b_pr80[l
= 1.21238672340382E-0002 b_pr80[2
=-2.55061285392433E-0004 b_pr80[3
= 3. 19677527367557E-0006 b_pr80[4
=-2.12292825597135E-0008 b_pr80[5
= 5.73811784322987E-0011 b_pr80[6
=-1.31244621625228E+0000 b_pr90[0
= 4.03992189796554E-0001 b_pr90[l
= 1.51475995524208E-0002 b_pr90[2
=-3.18112800786086E-0004 b_pr90[3
= 3.99105805552052E-0006 b_pr90[4
=-2.65509656004030E-0008 b_pr90[5
= 7.18948434340249E-0011 b_pr90[6
=-1. 17186016907363E+0000 b_pr95[0
= 3.00517778137419E-0001 b_pr95[l
= l .76379571363725E-0002 b_pr95[2
=-3.70927740472204E-0004 b_pr95[3
= 4.66940739029392E-0006 b_pr95[4
=-3.l 1663587672026E-0008 b_pr95[5
= 8.46228740605203E-0011 b_pr95[6
= 2.22954056056187E+0000 = l .47302074603431E+0000 =-l .21636478039306E-0002 = 2.55576622646636E-0004 =-3.19720082513422E-0006 = 2.11929940036504E-0008 =-5.7l897286853806E-00ll
= 3.50512875343338E+0000 = 1.60420421066738E+0000 =-l.55lll79203ll64E-0002 = 3.26197400868367E-0004 =-4.086855295l6l45E-0006 = 2.71315541907908E-0008 =-7.33l5873328537lE-00ll
= 4.78564764668408E+0000 = 1.71713127667135E+0000 =-l.84446730l92l78E-0002 = 3.90010160589593E-0004 =-4.9l42288l467724E-0006 = 3.27872658620007E-0008 =-8.896l530350l84lE-00ll
Уравнения позволяют строить интервальные оценки по выборкам, содержащим до ста элементов.
Построение нормально распределенных массивов (играющих роль генеральных совокупностей) объемом в десять тысяч элементов проводилось по известной методике в соответствии с теоремой Ляпунова, т. е. случайные величины создавались как суммы слагаемых функции random. Соответствие распределения нормальному проверялось по значению математического ожидания и дисперсии нормированного массива (близость этих показателей нулю и единице), а также по значению коэффициентов асимметрии и эксцесса.
Объектом исследования явились закономерности, связывающие параметры генеральных совокупностей и их оценок.
Введем некоторые обозначения. Оцениваемый параметр теоретического распределения обозначим как 0, а его выборочную оценку как 0*. Математическое ожидание и дисперсию генеральных совокупностей обозначим как МхО и БхО, а их оценки как МхУ и БхУ.
Проводили исследование зависимости разности Д0 = 0 - 0* от объема выборок и от генеральной дисперсии. Выборки разного объема, от пяти до ста элементов, извлекались случайным образом из генеральной нормально распределенной совокупности объемом десять тысяч элементов с математическим ожиданием 149,65 и дисперсией 2399,12. Образование выборок каждого объема дублировалось девять раз для сглаживания разбросов случайных результатов, перекрывающих влияние увеличения объема выборок. Данные эксперимента сводились в таблицу, где объем выборок играл роль аргумента, а разность Д 0 являлась функцией.
Результаты эксперимента сведены в таблицу 1. Для одиннадцати групп выборок таблица экспериментальных данных содержала девяносто девять строк наблюдений (по девять наблюдений на каждую группу). Табличные функции (МхО - МхУ) и (БхО - БхУ) были приняты за показатели точности выборочных оценок.
В столбце 3 таблицы 1 из девяти параллельных наблюдений разности (МхО - МхУ) по каждой группе выборок представлены два значе-
Таблица 1. Зависимость разности Д0 = 0 - 0* от объема выборок
№ ПП Объем выборок п Д Мх экспериментальная Д Мх по урав. (8) Д Мх по урав. (9) Д Бх экспериментальная Д Бх по урав. (6) Д Бх по урав. (7)
1 5 8,27 36,92 16,42 17,06 470,58 2299,91 1514,37 1602,04
2 10 1,71 23,63 13,25 13,62 10,00 951,39 836,23 607,05
3 20 3,58 23,42 10,07 9,22 18,65 1277,25 497,15 599,80
4 30 0,21 20,66 8,21 7,09 12,39 655,94 384,13 323,77
5 40 1,07 15,66 6,89 6,20 8,48 655,73 327,61 306,18
6 50 0,33 9,12 5,87 5,80 67,49 1112,84 293,71 376,56
7 60 0,22 12,07 5,04 5,39 9,17 676,46 271,10 374,08
8 70 0,21 9,87 4,33 4,77 2,71 781,68 254,95 293,25
9 80 0,05 6,43 3,72 3,96 30,78 450,15 242,85 239,58
10 90 0,99 8,59 3,18 3,27 56,44 324,05 233,43 183,90
11 100 0,02 6,03 2,69 3,29 0,92 471,41 225,89 175,23
ния - минимальное и максимальное. В столбце 6 аналогичные данные приведены для разности (БхО - БхУ). Эти наблюдения имели большой разброс значений, отражающих случайный характер величин, который часто перекрывал эффект увеличения объема выборки. Приведем максимальный пример такого «несоответствия» - разности (БхО - БхУ) для выборок с объемом сорок (первая строка) и пятьдесят (вторая строка) элементов:
8,5 11,5 24,0 32,7 126,3 146,4 254,4 379,1 655,7 67,5 82,4 295,2 445,2 453,4 621,1 650,1 832,9 1112,8.
Как видим, выборки меньшего объема в данном случае имеют более хорошие показатели точности оценок. Этот пример наглядно демонстрирует, что даже девятикратное дублирование наблюдений не исключает «перевеса» фактора случайного разброса значений.
Приняв данные столбца два таблицы 1 за аргументы, а столбцов три и шесть за функции, нашли для зависимостей д Мх = Дп) и д Бх = g(n) по два вида уравнений: наилучшую парную зависимость из набора разных функций и полином регрессии с максимальными показателями качества - остаточной дисперсии уравнения 82 и корреляционного отношения КО.
ост ^ ^
Для разности д Бх = (БхО - БхУ) получена парная зависимость вида
Д Бх = 158,077+6781,484/п (6)
при коэффициенте корреляции, равном 0,765.
Наилучший из ряда найденных полином регрессии имеет довольно сложную форму (см. табл.)
д Бх=Ь0+Ь1п+Ь2 п2+Ь3 п3+Ь4.
п9+Ь5 п10+Ь6 п11+Ь7 п12+Ь8 п13 (7)
при корреляционном отношении КО, равном 0,790.
Для разности (МхО - МхУ) уравнения имели вид:
Д Мх = 23,799 - 4,583 1п(п) (8)
при коэффициенте корреляции, равном -0,607, и д Мх = Ь0+Ь1п+Ь2 п2+Ь3 п3+Ь4 п4 (9) при корреляционном отношении КО, равном 0,610.
Значения коэффициентов корреляции и корреляционного отношения показывают, что полученные уравнения довольно далеки от функциональной связи и отражают стохастическую связь между величинами со случайным разбросом значений. С другой стороны,
они достаточно убедительно свидетельствуют о наличии несомненной количественной зависимости между точностью оценки д 0 и объемом выборки. При этом показатели этой связи объективны и устойчивы, так как совпадают у обоих видов полученных уравнений, т. е. и у парных зависимостей, и у полиномов регрессии.
Результаты расчета по полученым уравнениям представлены в таблице 1. Они показывают, что полиномы более «гибко» описывают случайный разброс данных, тогда как парные зависимости этот разброс сглаживают соответственно расчетной кривой элементарной функции.
Описанный выше эксперимент провели повторно, дублируя наблюдения по данной группе выборок не девять раз, а двукратно. Были получены уравнения такого же вида (при других значениях эмпирических коэффициентов). Показатели силы стохастической связи при этом составили соответственно: для Д М^ - 0,745 и 0,789; а для Д Dx 0,832 и 0,850. Как видим, результаты обоих экспериментов близки и отражают стохастический характер зависимостей.
При исследовании зависимости Д 0 = f (DxG) были построены девятнадцать генеральных нормально распределенных совокупностей с разными дисперсиями DxG: от 100 до 10000. Математические ожидания у всех массивов были одинаковы и составили величины около 150 с небольшим разбросом, неизбежным при приближенном разыгрывании нормальной случайной величины. Из каждой совокупности последовательно извлекались по три выборки. Результаты эксперимента сведены в таблице 2.
Для зависимости д Dx = f (DxG) получено уравнение вида
Д Dx = 0,488•DxG0,888 (10)
при коэффициенте корреляции, равном 0,816, и полином вида
д Dx = b0+b1DxG+b2 DxG2+b3 DxG3+b4 DxG4 (11) при корреляционном отношении KO, равном 0,696.
Для разности д Mx = f (DxG) получена парная зависимость вида
Д Mx = 0,116•DxG0,562 (12)
при коэффициенте корреляции, равном 0,708, и полином вида
д Мx = b0+b1DxG+b2DxG2+b3DxG3+
+Ь DxG9+bDxG10+b DxG11 (13)
4 5 6
при корреляционном отношении KO, равном 0,666.
Таким образом, характеристики стохастической связи для зависимостей д 0 = f (п) и д 0 = f (DxG) в отношении количественных показателей близки и устойчивы.
Все вышеизложенное посвящено вопросам точности точечных оценок. Но отдельная - единичная - точечная оценка не несет никакой информации о степени своей достоверности. Считается, что положение исправляет интервальная оценка, построенная на основании этой точечной:
х - ич^< Мх <х + (14)
где U - квантиль нормального распределения стандартной формы х; q - уровень значимости. Утверждается, что «...если многократно извлекать выборки объемом N и с помощью не-
а х
< Мх<х + и
а х
Таблица 2. Зависимость разности д 0 от генеральной дисперсии
№ пп Ген. дисп. БхО д Мх экспериментальная д Мх по урав. (12) д Мх по урав. (13) д Бх экспериментальная д Бх по урав. (10) д Бх по урав. (11)
1 100,1 0,56 3,11 1,55 1,03 25,53 59,46 22,37 -14,94
2 200,0 1,02 3,40 2,28 2,31 17,47 62,20 53,84 32,67
3 400,6 1,98 3,36 3,37 4,28 17,95 225,05 99,74 119,94
4 610,2 2,46 6,50 4,27 5,70 65,65 205,05 144,91 199,06
5 807,0 4,37 15,12 5,00 6,63 132,25 343,66 185,72 263,39
6 995,4 3,36 13,07 5,62 7,27 178,28 302,67 223,75 317,12
7 1195,0 6,18 10,15 6,23 7,79 116,38 487,33 263,16 366,71
8 1383,8 2,37 15,66 6,77 8,20 112,64 689,41 299,75 407,71
9 1605,3 3,60 13,38 7,35 8,67 194,49 751,40 341,98 449,64
10 1824,9 3,01 16,54 7,90 9,18 690,49 1007,06 383,21 485,98
11 2000,8 5,11 11,72 8,32 9,66 201,20 602,59 415,83 512,19
12 2203,0 3,99 22,05 8,79 10,29 306,24 822,05 459,92 539,96
13 2399,1 7,96 11,54 9,22 10,79 436,33 1669,39 484,54 565,31
14 2680,5 2,27 17,34 9,81 12,13 201,88 439,18 539,06 600,44
15 2821,7 2,50 23,39 10,10 12,74 158,52 755,56 564,22 618,07
16 2986,1 10,34 18,27 10,42 13,44 203,66 1662,31 593,31 639,03
17 3629,1 13,32 16,51 11,63 15,44 236,38 992,27 705,44 731,56
18 6474,2 9,20 24,65 16,10 16,50 714,74 3205,70 1179,27 1598,23
19 10155,6 6,40 25,83 20,74 18,44 811,52 7018,21 1758,63 3251,98
равенства (14) определять доверительный интервал, то в среднем 100р% построенных таким способом интервалов содержит истинное значение Мх» [4]. Однако в применении к единичной выборке это положение не увеличивает нашего знания_о точности оценки. Если случайная величина x в неравенстве (14) есть среднее арифметическое ОДНОЙ выборки, то построение интервала с центром x ничего не скажет нам о степени близости оценки 0* к оцениваемому параметру 0. И если оценка 0* ошибочна, то построение интервала на это не укажет.
Проанализируем данные, приведенные в таблице 3. Из генеральной совокупности объемом десять тысяч элементов и с параметрами МхО = 149,56 и БхО = 3629,10 извлекли четыре выборки по десять элементов. По выборочным данным построили доверительные интервалы для обоих параметров распределения при вероятностях 0,80; 0,90 и 0,95. Как следует из результатов этого эксперимента, интервальные оценки для БхО на шестой, восьмой, девятой и двенадцатой стороках таблицы 3 не накрыли оцениваемый параметр БхО, имеющий значение 3629,10. Эти данные выделены полужирным шрифтом.
Были вычислены средние значения оценок МхУ и БхУ для всех четырех выборок. По ним при вероятности р = 0,90 были построены доверительные интервалы. Точечные оценки БхУ выборок №2 и №3 не попали в интервал, построенный по среднему значению БхУ для четырех выборок.
Результаты эксперимента, представленные в таблице 3, показывают, что информационная ценность интервальных оценок резко возрастает, если они построены хотя бы по небольшому количеству усредненных данных. Такая интер-
Таблица 3. Результаты интервального оценивания по отдельным и усредненным выборочным данным
№ выб. Оценка MxV Оценка DxV Вер. Р Интервальные оценки
Для MxG Для DxG
Лев. гр. Пр. гр. Лев. гр. Пр. гр.
1 169,80 5012,59 0,95 0,90 0,80 119,13 128,76 138,83 220,46 210,83 200,76 2374,41 2669,57 3075,62 16586,33 13494,09 10783,40
2 157,50 1541,96 0,95 0,90 0,80 129,39 134,74 140,32 185,60 180,26 174,67 730,41 821,20 946,11 5102,24 4151,01 3317,16
3 146,09 1323,97 0,95 0,90 0,80 120,05 125,00 130,18 172,13 167,18 162,01 627,15 705,11 812,36 4380,92 3564,17 2848,20
4 127,81 6648,73 0,95 0,90 0,80 69,45 80,54 92,14 186,16 175,07 163,47 3149,43 3540,93 4079,52 22000,20 17898,63 14303,15
Ср. 150,30* 3631,81* 0,90 115,37* 185,23* 1934,21* 9777,53*
вальная оценка будет единым обобщенным «измерителем пригодности» для всех выборок из данной генеральной совокупности. В этом случае интервальная оценка и будет работать в полном соответствии с цитатой. С целью практической количественной оценки положения, высказанного в данной цитате, провели эксперимент, результаты которого представлены в таблицах 4 и 5.
Было образовано пятнадцать нормально распределенных генеральных совокупностей. Математическое ожидание у всех массивов составило величину, близкую к 150, генеральная дисперсия возрастала от ста до 10000. Из каждой совокупности извлекали последовательно по сто выборок, объемом сто элементов каждая. Для всей совокупности выборок рассчитывались средние значения выборочных средних х (т. е. среднее из средних) и среднее из выборочных дисперсий. При таком количестве выборок и их объемах эти усредненные оценки 0*практически не отличались от оцениваемых параметров 0. По всем ста выборкам фиксировали размах выборочных показателей 0*min и 0* (чтобы иметь возможность сравнить его с
max v г
шириной доверительных интервалов). Наблюдение по ста выборкам из данного массива проводили дважды. По_усредненным выборочным характеристикам MxV и DxV строили интервальные оценки и фиксировали количество выборок, характеристики которых не попадали в доверительные интервалы. Эти данные представлены в таблицах 4 и 5. Как следует из анализа данных, несмотря на существенный случайный разброс значений отдельных наблюдений, формулировка [4] «...то в среднем 100-р% построенных таким способом интервалов...» полностью подтвердилась.
Результаты настоящей работы позволяют сделать следующие выводы.
1. С помощью методов линеаризации элементарных функций в сочетании с методом наименьших квадратов получены уравнения парной связи для критических точек t-распределе-ния Стьюдента. Для соответствующих показателей %2-распределения Пирсона получены полиномы регрессии шестой степени. Эти зависимости получены в виде отдельных уравнений для вероятностей 0,80; 0,90 и 0,95 и позволяют работать с выборками объемом до ста элементов. Полученные уравнения функциональны и отражают данные статистических таблиц с высокой точностью.
Таблица 4. Количество выборок, отсеянных по интервальным оценкам МхО при вероятностях 0,95 и 0,90
Среднее значение MxV Размах MxV max-min Интервальные оценки
DxG P=0 ,95 P=0,90
массива Ширина интервала Отсеяно Выборок Ширина интервала Отсеяно выборок
101,1 149,83 5,68 4,06 3 3,39 12
150,21 4,60 3,93 4 3,29 10
200,0 150,07 7,16 5,64 4 4,71 11
149,99 7,01 5,62 3 4,90 10
400,6 149,80 10,06 7,91 5 6,62 10
149,90 6,66 7,86 0 6,57 1
610,2 149,64 12,66 9,77 8 8,17 16
149,29 9,92 9,85 2 8,24 4
807,0 149,63 12,71 11,20 4 9,37 10
149,49 14,60 11,29 4 9,44 9
995,4 149,96 15,32 12,67 6 10,56 10
150,15 13,10 12,56 1 10,51 5
1195,0 150,45 18,37 13,81 5 11,55 7
149,92 17,17 13,70 5 11,46 11
1605,3 149,85 20,31 15,96 7 13,35 9
150,08 21,06 15,79 9 13,20 16
2000,8 150,72 20,71 17,60 4 14,72 9
150,67 25,02 17,33 4 14,83 8
2399,1 150,07 26,64 19,40 6 16,23 11
150,21 23,27 19,39 1 16,22 8
2821,7 150,61 38,17 20,89 5 17,47 8
149,30 30,58 21,26 5 17,79 10
2986,1 149,43 34,75 21,89 5 18,31 11
149,35 29,41 21,58 8 18,05 15
3629,1 150,79 35,01 23,84 5 19,94 10
148,99 29,17 24,08 6 20,14 12
6474,2 153,09 39,66 31,92 4 26,70 6
152,11 49,45 31,65 3 26,48 11
10155,6 148,78 44,37 40,13 6 33,56 10
146,81 56,59 40,02 5 33,47 11
Итого в среднем отсеяно выборок 4,57% 9,70%
Таблица 5. Количество выборок, отсеянных по интервальным оценкам ОхО при вероятностях 0,95 и 0,90
DxG массива Среднее значение DxV Размах DxV max-min Интервальные оценки
P=0,95 P=0,90
Ширина интервала Отсеяно выборок Ширина интервала Отсеяно выборок
101,1 104,43 97,90 72,24 74,20 58,61 56,65 4 7 47,92 47,13 9 12
200,0 201,52 200,69 131,74 135,68 116,59 116,11 4 4 97,01 96,61 6 8
400,6 397,39 391,59 347,03 303,69 229,82 226,57 4 5 191,31 188,52 8 8
610,2 605,62 616,29 501,45 479,04 350,40 356,57 3 7 291,56 296,69 13 13
807,0 796,15 808,62 494,36 629,15 460,64 467,85 7 10 383,28 389,27 11 15
995,4 1011,19 1001,32 769,91 811,55 585,06 579,35 6 5 486,81 482,05 7 11
1195,0 1210,60 1191,40 831,62 741,23 700,43 689,32 8 6 582,80 573,56 16 13
1605,3 1615,80 1581,20 1194,98 1031,44 934,87 914,85 7 9 777,88 761,22 14 18
2000,8 1966,27 1995,36 1094,84 1445,81 1137,65 1154,48 7 11 946,60 960,60 11 17
2399,1 2388,63 2386,19 1991,49 1802,21 1382,02 1380,61 7 4 1149,93 1148,76 11 13
2821,7 2767,88 2869,28 2071,83 2180,89 1601,45 1660,11 9 4 1332,51 1381,32 16 10
2986,1 3040,42 2954,52 1720,81 2201,55 1759,13 1709,43 2 8 1463,72 1422,36 5 13
3629,1 3606,74 3678,05 2336,63 2684,86 2086,80 2128,06 3 5 1736,35 1770,68 12 9
6474,2 6465,54 6357,54 4365,63 3435,24 3740,85 3678,36 4 2 3112.63 3060.64 7 4
10155,6 10218,14 10161,89 8126,35 6648,35 5912,04 5879,49 7 4 4919,21 4892,13 13 12
Итого в среднем отсеяно выборок 5,76% - 11,17%
2. Построены уравнения, отражающие стохастическую связь:
- между точностью статистических оценок в виде разности (0 - 0*) и объемом выборок;
- между точностью статистических оценок в виде разности (0 - 0*) и значением генеральной дисперсии.
Получены количественные характеристики силы такой связи в виде показателей степени функциональности уравнения. Ряд экспериментов как с одинаковыми, так и разными условиями проведения показал, что степень функциональности стохастических зависимостей (0 - 0*)
= f (п) и (0 - 0*) = g (DxG) устойчиво держится в пределах от >0,60 до 0,85.
3. Показано, что информативность и «отсеивающая эффективность» интервальных оценок обеспечивается только при построении их по усредненным показателям нескольких выборок, извлеченных из данной генеральной совокупности.
4. При проведении массовых статистических экспериментов получены количественные показатели отсева выборок по интервальным оценкам в зависимости от принятой вероятности.
Список использованной литературы:
1. Плис А.И., Сливина H.A. Лабораторный практикум по высшей математике. Учебное пособие. - М.: Высшая школа, 1994. -416 с., ил.
2. Львовский E.H. Статистические методы построения эмпирических формул. - М.: Высшая школа, 1988. - 239 с., ил.
3. Пустыльник Е.И. Статистические методы анализа и обработки наблюдений. - М.: Наука, 1968. - 288 с., ил.
4. Бородюк В.П., Вощинин А.П., Иванов А.З. и др. Статистические методы в инженерных исследованиях. - М.: Высшая школа, 1983. - 216 с., ил.