Научная статья на тему 'Сравнение относительной частоты с заданным значением'

Сравнение относительной частоты с заданным значением Текст научной статьи по специальности «Электротехника, электронная техника, информационные технологии»

CC BY
172
26
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
СХЕМА БЕРНУЛЛИ / БИНОМИАЛЬНЫЙ ТЕСТ / МОЩНОСТЬ / РАЗМЕР ВЫБОРКИ / СТАТИСТИЧЕСКОЕ МОДЕЛИРОВАНИЕ / ПРОВЕРКА ГИПОТЕЗ

Аннотация научной статьи по электротехнике, электронной технике, информационным технологиям, автор научной работы — Попов Александр Михайлович

В статье методами статистического моделирования исследуется эффективность биномиального теста и его аналога в форме нормальной аппроксимации для выборок среднего и большого объема; приводится таблица со значениями для объемов выборок, необходимых для выявления заданной минимальной величины эффекта.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Сравнение относительной частоты с заданным значением»

Сравнение относительной частоты с заданным значением

Попов А. М.

Попов Александр Михайлович /Popov Aleksandr Mihajlovich - кандидат технических наук,

доцент, кафедра высшей математики, Балтийский государственный технический университет «ВОЕНМЕХ» им. Д. Ф. Устинова,

г. Санкт-Петербург

Аннотация: в статье методами статистического моделирования исследуется эффективность биномиального теста и его аналога в форме нормальной аппроксимации для выборок среднего и большого объема; приводится таблица со значениями для объемов выборок, необходимых для выявления заданной минимальной величины эффекта.

Ключевые слова: схема Бернулли, биномиальный тест, мощность, размер выборки, статистическое моделирование, проверка гипотез.

В медицинской практике часто возникает задача по сравнению двух методов лечения. Пусть основной метод лечения эффективен в 6 2 % случаев, и предлагается новая методика лечения. Для оценки ее эффективности проводят исследование, в результате которого из 8 0 пациентов, лечившихся новым методом, выздоровели 6 3 . Можно ли по относительной частоте 0 . 7 9 сделать вывод о том, что новый метод лечения эффективнее основного?

С формальной точки зрения проводят статистический анализ данных, полученных в результате повторных независимых испытаний (схемой Бернулли) и сравнивают вероятность «успеха» р в одном испытании с заданным значением р0. Для решения указанной задачи можно применить точный тест, основанный на биномиальном распределении, или общий тест, основанный на нормальной аппроксимации (далее -z-test) [1, стр. 269].

В работе при основной нулевой гипотезе и двусторонней альтернативе

сравниваются указанные тесты при средних от до и больших от до 1 5 0 объемах выборки в диапазоне р0 от 0 . 1 до 0 . 9 .

Биномиальный тест применяется при следующих условиях: в каждом испытании регистрируется только одно из двух возможных значений; вероятность «успеха» р в каждом испытании одинакова; испытания взаимно независимы, т. е. «успех» одного испытания не влияет на результат других. Приведенные минимальные метрологические и математические требования к модели позволяют получить наиболее надежные выводы.

Биномиальные вероятности рассчитывается по формуле

Р г (/с,п,р ) = С,крк ( 1 - р ) "" k (1)

где - число испытаний, - число успехов, - число сочетаний из по . В качестве оценки параметра распределения Бернулли используют выборочную частоту р = /с/п. При двухстороннем варианте теста точное значение p -value рассчитывают по формуле

Рг ( | р-ро |>| р-р о I ) ^ (2)

где - представляет все возможные значения , а соответствующие вероятности рассчитаны по формуле (1). В статистическом пакете R [2] биномиальный тест реализован в виде функции binom.test {stats}.

При значениях и при условии , случайная величина с

достаточной точностью аппроксимируется нормальным распределением с

„ p(i-P)

математическим ожиданием р и дисперсией-.

Отсюда следует, что если нулевая гипотеза верна, то статистика

i, — I — (3)

Po(i-Po)

у n

имеет распределение близкое к распределению Гаусса N ( 0 , 1 ) . Критическая область критерия при уровне значимости а для двухстороннего варианта теста

определяется неравенством | ze| > u.a. В статистическом пакете R [2] z-test

2

реализован в виде функции prop.test {stats}.

Надежность обоих тестов оценивалась по величине рассчитанного методом статистического моделирования уровня значимости. Для этого при каждой комбинации влияющих факторов (значения р0 в диапазоне от 0 . 1 до 0 . 9 , значения п в диапазоне от 3 0 до 1 5 0 ) генерировалось 1 0000 выборок, реализующих схему Бернулли. В каждой выборке фиксировалась частота успеха р, после чего при доверительной вероятности 0 . 9 5 рассчитывалось значение p-value для обоих тестов. Соответствующие доли отклонения нулевой гипотезы для биномиального теста представлены в таблице 1, для z-test - в таблице 2. Значения в диапазоне 0. 0 5 + выделены.

Таблица 1. Расчетные значения уровня значимости для биномиального теста

n = 30 n = 40 n = 50 n = 60 n = 100 n = 150

Ро

0.1 0.0252 0.0309 0.0298 0.0492 0.0472 0.0364

0.2 0.0390 0.0482 0.0469 0.0362 0.0431 0.0395

0.3 0.0490 0.0381 0.0412 0.0519 0.0513 0.4070

0.4 0.0364 0.0335 0.0456 0.0506 0.0410 0.0438

0.5 0.0420 0.0361 0.0323 0.0258 0.0349 0.0452

0.6 0.0396 0.0331 0.0469 0.0461 0.0398 0.0469

0.7 0.0464 0.0351 0.0441 0.0493 0.0504 0.0402

0.8 0.0344 0.0485 0.0496 0.0312 0.0433 0.0404

0.9 0.0271 0.0296 0.0309 0.0454 0.0460 0.0372

Таблица 2. Расчетные значения уровня значимости az для z-test

n = 30 n = 40 n = 50 n = 60 n = 100 n = 150

Po

0.1 0.0252 0.0606 0.0298 0.0492 0.0640 0.0364

0.2 0.0390 0.0718 0.0469 0.0362 0.0573 0.0510

0.3 0.0724 0.0546 0.0412 0.0692 0.0655 0.4070

0.4 0.0364 0.0335 0.0593 0.0506 0.0518 0.0513

0.5 0.0420 0.0361 0.0655 0.0514 0.0567 0.0452

0.6 0.0396 0.0331 0.0601 0.0461 0.0488 0.0584

0.7 0.0714 0.0511 0.0441 0.0653 0.0650 0.0402

0.8 0.0344 0.0735 0.0496 0.0312 0.0563 0.0505

0.9 0.0217 0.0557 0.0309 0.0454 0.0660 0.0372

Если в результате исследования различия не обнаружены, необходимо сделать вывод об их отсутствии (получить отрицательный результат). Для этого на этапе планирования эксперимента следует определить минимальную величину эффекта, которая должна быть выявлена в ходе исследования, и для этой величины при приемлемой мощности критерия рассчитать требуемый объем выборки.

Расчет мощности биномиального критерия проведен численно для простой правосторонней альтернативной гипотезы Я2: р = рх. Величина ошибки второго рода /? равна вероятности, с которой распределенная по Бернулли В (р х.п) случайная величина попадет в ограниченный сверху квантилем порядка распределения

В (ро. п) интервал. При этом мощность критерия составит 1 — /?.

График зависимости мощности от числа наблюдений п при уровне значимости а = 0 . О 5 и ро = 0 . 2 , рх = 0 . 3 5 представлен на рисунке 1.

Рис. 1. График зависимости мощности

По графику видно, что, начиная с объема выборки п = 5 9 , все последующие значения п имеют мощность большую 0 . 8. Найденный таким образом объем выборки можно рекомендовать в качестве минимального, при котором для заданных р0, р а достигнут уровень мощности 0 . 8.

Мощность критерия (3) при правосторонней альтернативе равна

Р V VPi (1-Р 1) ) ( ;

где Ф (х) - функция стандартного нормального распределения N ( 0 , 1 ) , za -квантиль стандартного нормального распределения уровня .

Результат расчетов минимального объема выборок п при применении биномиального теста (верхнее значение) и z-test (нижнее значение) для различных р0 и р ь при а = 0 . 0 5 , 1 — /? = 0. 8 приведен в таблице 3.

Ро Р1 0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.40 0.45 0.50

0.10 191 150

0.15 59 44 299 253

0.20 33 22 89 69 381 342

0.25 21 14 44 33 110 91 458 419

0.30 18 9 29 20 55 43 127 109 522 483

0.35 22 13 31 25 59 50 141 125 566 534

0.40 16 10 38 29 68 57 155 136 610 573

0.45 24 19 41 32 72 62 165 145 634 600

0.50 19 13 28 21 43 35 77 65 164 151 647 615

0.55 19 15 27 22 45 37 75 67 168 154 654 617

0.60 16 11 19 16 28 23 44 38 76 68 169 153

0.65 13 8 16 11 21 16 44 38 76 67

0.70 12 9 15 12 27 24 42 37

0.75 21 16 28 23

Ро Р1 0.55 0.60 0.65 0.70 0.75 0.80 0.85 0.90

0.60 639 606

0.65 165 149 617 583

0.70 73 65 157 142 569 548

0.75 42 35 71 61 146 133 530 501

0.80 26 22 39 33 62 56 130 119 463 441

0.85 18 14 24 20 35 30 57 50 117 103 398 368

0.90 17 13 33 26 50 42 94 83 304 283

0.95 19 15 37 32 68 60 203 184

Полученные результаты позволяют сделать следующие выводы: 1. Во всем диапазоне исследуемых значений п и р0, биномиальный тест является консервативным, т. е. его доверительный интервал, содержащий истинное значение оцениваемой вероятности, несколько шире соответствующего истинного

доверительного интервала. При увеличении п консервативность биномиального теста уменьшается.

2. Нормальная аппроксимация применима при объемах выборки >50 и величине доли р0 из диапазона 0.2 — 0.8. При меньших объемах выборки или экстремальных значениях р0 следует применять биномиальный тест.

3. Объем выборки, рассчитанный для биномиального теста, несколько больше соответствующего объема, рассчитанного для z-test.

4. В практически важных случаях, когда различие между р0 и р1 невелико, требуется планировать значительное число испытаний.

Литература

1. Ефимов А. В., Поспелов А. С. Сборник задач по математике для втузов. В 4 частях. Ч. 4. - М.: Издательство Физматлит, 2003.

2. R Core Team. R: A Language and Environment for Statistical Computing. R Foundation for Statistical Computing, 2015.

К вопросу о создании двухчастотного питания для индукторов

Исаев И. Н.

Исаев Игорь Николаевич /Isaev Igor Nikolaevich - кандидат технических наук, доцент; кафедра мехатроники, автоматизации и электроники, Нижнетагильский технологический институт (филиал) Уральского федерального университета, г. Нижний Тагил

Аннотация: в статье рассмотрена одна из возможных систем для индукционного нагрева металлов. Автор предлагает оригинальную конструкцию источника электрических сигналов для управления автономными инверторами. Такой источник позволяет получать частоты управляющих сигналов в большом диапазоне. При этом появляются дополнительные возможности для системы питания индуктора практически без искажений тока.

Ключевые слова: актуальный способ индукционного нагрева; анализ нелинейности намагничивающего тока.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Анализ необходимости применения двухчастотного нагрева металлов в индукторе выполнен во многих современных работах, например в [1,2]. Показано, что наиболее эффективными источниками питания индукторов являются системы с двумя преобразователями частоты: для низкой и высокой. В настоящей статье реализован тот же принцип, но с существенными отличиями.

Общий вид предлагаемой системы показан на рис.1. При этом использована модель в программе MatLAB, которая применялась при проведении экспериментов и представлении основных результатов. Силовая часть включает индуктор и его источники питания. При выполнении моделирования и расчётов индуктор, как обычно, представляется в виде RL - нагрузки. В качестве источников питания применяются два преобразователя частоты: INV1 - для низкой частоты и INV2 - для высокой частоты. В качестве выпрямителей для этих преобразователей в модели использованы источники постоянного равного напряжения. В [1] обоснована необходимость трансформаторной потенциальной развязки источников питания и нагрузки. В [3] для этой цели, а также для согласования напряжений этих элементов силовой части показана эффективность применения трансформаторов с магнитопроводами на базе аморфных или нанокристаллических сплавов. Это

i Надоели баннеры? Вы всегда можете отключить рекламу.