УДК 519.6
В. И. Пагурова1
О ВЫБОРОЧНОМ КОНТРОЛЕ ПО КОЛИЧЕСТВЕННОМУ ПРИЗНАКУ
В выборочном контроле по количественному признаку распределение качественной характеристики изделия принадлежит двупараметрическому семейству, зависящему от неизвестных параметров сдвига и масштаба. Для проверки гипотезы о доле дефектных изделий в партии рассмотрены равномерно наиболее мощные (р. н. м.) инвариантные критерии. Предложен асимптотический подход и рассмотрен случайный объем выборки.
Ключевые слова: выборочный контроль по количественному признаку, двупараметри-ческое семейство распределений, р. н. м. инвариантные критерии, асимптотический подход, случайный объем выборки.
1. Введение. Рассматривается ситуация, в которой партия некоторых изделий принимается или отвергается на основе качественной характеристики каждого изделия. Будем считать, что каждое изделие классифицируется как годное или дефектное. Качество изделия характеризуется некоторой случайной величиной X, и изделие считается годным, если значение X попадает в заданный интервал. Из партии изделий производится выборка, величина X измеряется для каждого изделия в выборке, и решение принять или отвергнуть партию основывается на этих измерениях. В выборочном контроле по качественному признаку решение принять или отвергнуть партию основывается только на числе дефектных изделий в выборке, и выборочный контроль должен гарантировать отклонение партии с высокой вероятностью, если достаточно большая доля дефектных изделий превышает заданный уровень. Выборочный контроль по количественному признаку основан на использовании распределения качественной характеристики X и имеет тот же уровень контроля с меньшим объемом выборки. В данной работе предполагается, что распределение X принадлежит двупараметрическому семейству, зависящему от неизвестных параметров сдвига и масштаба. Для проверки гипотезы о доле дефектных изделий в партии рассмотрены р. н. м. инвариантные критерии, асимптотический подход и случайный объем выборки. Рассмотрена также задача сравнения долей дефектных изделий в двух партиях изделий.
Пусть Хх,..., Хп независимы и одинаково распределены (н. о. р.) с общей непрерывной плотностью
/((ж — а)/Ь)/Ь, |а| < сю, Ь > 0, а и Ь неизвестны, ^ X^ ^ ... ^ Х^ означает соответствующий
вариационный ряд. Будем считать, что изделие дефектно, если X ^ и, тогда
X
p = P{X^U} = l-F((U-a)/b), F(x)= j f(y)
dy.
Задача состоит в проверке гипотезы Н: р = ра против альтернативы К: р > р0. Так как величина и задана, то без нарушения общности можно считать, что и = 0, поэтому гипотеза Н эквивалентна гипотезе й = (¿о, альтернатива К — альтернативе й > (¿о, где 4 = а/Ь, (¿о = — ро)- Обозначим
п п
г= 1 i= 1
Y^ ^ Y^ ... ^ Yn— соответствующий вариационный ряд, величины zp, Ф(ж), <р(х) являются р-квантилью, функцией распределения и плотностью распределения соответственно стандартного нормального закона.
2. Р. н. м. инвариантные критерии.
Теорема 1. Пусть /(ж) = (2ж)~1^2 ехр(^ж2/2), тогда для проверки гипотезы р ^ ро против альтернативы р > ро критерий с критической областью
{^Хп/вп > С'} (1)
1 Факультет ВМК МГУ, ст. науч. сотр., к.ф.-м.н., e-mail: pagurovaQyandex.ru 7 ВМУ, вычислительная математика и кибернетика, № 4
является р. н. м. инвариантным критерием [1]. Постоянная С находится из условия Р{Л/пХп/Зп ^ ^ С\ <1 = (¿о) = а.
2. Пусть /(ж) = е~х, ж > О, тогда для проверки гипотезы р ^ Ра против альтернативы р > ра критерий с критической областью
{Х^КХп-Х^^С} (2)
является р. н. м. инвариантным критерием [2]. Постоянная С находится из условия
Р{х[п)/(хп - Х^) ^С'\(1 = (1о} = а.
3. Пусть /(ж) = 1 при 0 ^ х ^ 1, тогда для проверки гипотезы р ^ ра против альтернативы р > Ра критерий с критической областью
{х[п)/(Х^^ х[п)) ^ С}
является р. н. м. инвариантным критерием [2]. Постоянная С находится из условия
Р{Х[П)/(Х™ - х[п)) ^ С\ й = 4} = а.
Распределение левой части соотношения (1), являющееся нецентральным распределением Стью-дента, исследуется в работах [3, 4].
3. Асимптотический подход
3.1. В предположениях введения обозначим
ЕГ1=/х, Т>Ух=а2, т,- = Щ(У1 -ц)/о)', М =
а
Пусть существует Е .V и выполняются соотношения
Ш4 > т\ + 1, (3)
А{й) = 1 Мт3 + М2(ш4 - 1)/4. (4)
Предложение 1. При п —> оо имеем (Хп /Бп - М)у/й/у/ДЩ -А ЩО, 1). Условие (3) гарантирует, что А(<1) > 0 при всех значениях а > 0, /х и (1.
Следствие. Для проверки гипотезы Н против альтернативы К критерий с критической областью
| (Хп/Бп - л/п/^/АЩ > z1-a} (5)
имеет асимптотический при п ^ оо уровень значимости а.
В случае нормального распределения /х = 0, а = 1, гпз = 0, т^ = 3, критерий с критической областью (5) является асимптотическим аналогом р. н.м. инвариантного критерия (1) и совпадает с модернизированным асимптотически оптимальным С(а)-критерием Д. Неймана [5-7].
3.2. Пусть /(ж) > 0 при х ^ 0, /(ж) = 0 при ж < 0, Нт ж~й^(ж) = с > 0 для некоторого 0 < 6 < 2
х—>-0
и существует ЕХ2. Обозначим ЕУх = /х, Т>Ух = о2. Предложение 2. При п —> оо
(х[п)/(хп - X- (¿//х)/х2^/Ы) А Л/"(0,1) при йф О,
—сг ), г ^ 0, при (1 = 0.
Замечание. Можно считать, что при установившемся технологическом режиме значения ро близки к нулю, следовательно, значения (¿о отделены от нуля, поэтому область допустимых значений ё не включает нуль.
Следствие. Для проверки гипотезы Н против альтернативы К критерий с критической областью
{(Х^п)/(Хп - X¡п)) - 4//х)/Х2^/Мо) ^ ¿1-«} (6)
имеет при п ^ оо асимптотический уровень значимости а.
В случае экспоненциального распределения /(ж) = е Ж,ж>0, <5=1,/х = 1,ст = 1,и критерий с критической областью (6) является асимптотическим аналогом р.н.м. инвариантного критерия (2).
3.3. Пусть предположения относительно моментов распределения в пп. 3.1, 3.2 раздела 3 не удовлетворяются или условия существования асимптотически оптимального С(а)-критерия Д. Неймана не выполняются. В этой ситуации в предположении введения рассмотрим асимптотический при п ^ оо критерий для проверки гипотезы Н против альтернативы К, основанный на центральных порядковых статистиках
Х[(А1)п] + 1' Х[х1п] + 1 И Х[АПзп]+1' 0 < А! < А2 < Аз < 1,
построенных на основе исходной выборки п. о. р. величин Х\,..., Хп с общей плотностью распределения /((ж — а)/Ь)/Ь, |а| < оо, Ь > 0, параметры а и Ь неизвестны.
Обозначим = А*, 1 = 1,2,3, Уг = (Х^ — а)/Ь, 1 = 1 ,...,п. При условии 0 < /(Сл4) <
¿ = 1,2, 3, совместное асимптотическое распределение величин
Ог,п = + 1 - СА4 )/(СА4 )/л/Лг(1 ~ А*), % = 1,2,3,
' [Л4п] + 1
при п ^ оо является трехмерным нормальным распределением с вектором нулевых математических ожиданий и ковариационной матрицей
^«Нй^/' <,i=1,2,3
(см. [8, теорема 10.3]). Рассмотрим статистику и величины
у(п) i J /T-7Z-Г-^Г
rp _ [Л2п]+1 _ [А2п]+1 т и R _ уАг(1 - Ai) . _
л[аш]+1 л[а3п]+1 [ain]+1 [лзп] + 1 jk^j
Предложение 3. При п оо имеем
((Cai - Саз)Тп{Х) - (Са2 + d))^/V(d) А ЛЛ(0,1),
где
г i\ р2 , (Сл2 + d? (Р2 , р2 9Я Я Л \ Ч(х2 + d)(B1B2A12 ^ В2В3А23) V (а) = В2 + —-—-~(В1 + В3 - 2В1В3А13)--—-—-. (7)
(Çai — СА3 J (Сах — ÇA3)
Следствие. Для проверки гипотезы H против альтернативы К критерий с критической областью
{((Са, - Са3)Тп(Х) - Са2 - do)V^/V(do) ^ *!-«} (В)
имеет при п ^ оо асимптотический уровень значимости а. Величина V(d) определяется соотношением (7).
3.4. Пусть объем выборки, на основании которой строится критерий для проверки гипотезы о доле дефектных изделий в партии, является случайной величиной. Как влияет распределение этой случайной величины на распределение статистики критерия? Предварительно рассмотрим некоторые вспомогательные утверждения.
Лемма. Пусть случайные величины Тп и Нп независимы, — неотрицательная целочисленная случайная величина, Тп Т, оо при п ^ оо. Тогда Тдтп Т.
Предложение!. Пусть Тп и Нп независимы, Нп — целочисленная неотрицательная случайная величина, при п ^ оо
Р{у/пТп < ж} Ф(ж), оо.
Если существует случайная величина Р{£ > 0} = 1, такая, что
^п ^ ^ гп\
--> £ при п оо, (9)
п
тогда
Р{уЪТМп ^ ж} = Р| у^Лх, < ху/Ып/п} ЕФ(ж^£), (10)
Р{пТМп/^Д^ ^ ж} = Р| \ДГ,Т\„ < хИп/п} ЕФ(ж£), (И)
< ж} = Р| < х/^Мп/п} ЕФ(ж/^£) (12)
(см. также [9-11]).
Предложение 5. Пусть Т1)П1, Т2)П2, ^2,П2 независимы, ЛГ1)П1 и — целочисленные
неотрицательные случайные величины,
Р^ ж} Ф(ж), -> ОО при Иг —У оо, г = 1,2.
Если существуют случайные величины ¿ц и £2, Р{6 > 0} = 1, такие, что
-¿У"г,п» (I , Щ
то при П1,П2 —> оо имеем
при Tlj —> ОО, / 1. 2,
± v/TTTV-j. v., < ж} = Р ^ ,N2T2,N2i ТТГ
к у iVl>»i V 2.
= ). (13)
к + L а/ L + L
Р | iVi.n^i.iv, ± ^2,га2т2,лг2 ^ ж Еф ; (14)
уйТ учгг
Аналогичным образом
Р ^^ ± ^ Л ЕФ I I . (15)
Здесь Ni = NitTli, г = 1,2, rji и щ — независимые стандартно нормально распределенные случайные величины.
Теперь рассмотрим частный случай, когда Nn имеет отрицательное биномиальное распределение b(r,r/n) с параметрами (г,r/n), т.е.
P{Nn = k}= + {^У А; = 0,1,..., l^r<n, г — целое. (16)
Вычисляя характеристическую функцию фп (t) величины Nn/n и устремляя п к бесконечности, найдем, что
Фп$) (l " f
Предельная характеристическая функция является характеристической функцией гамма-распределения с плотностью
=rr7r(:"'r^'. * > о- (14
Теорема непрерывности соответствия между функциями распределения и соответствующими характеристическими функциями устанавливает сходимость распределения Nn/n к гамма-распределению с плотностью (17), или, что то же самое, к распределению величины х|г./(2?-), где х\ имеет распределение хи-квадрат с к степенями свободы. Таким образом, величина определяемая соотношением (9), в случае, когда Nn имеет отрицательное биномиальное распределение (16), имеет распределение величины х!поэтому правая часть соотношения (10) является функцией распределения Стьюдента
с 2г степенями свободы, так как
ЕФ(ж^) = Р{г?/^х1/(2г) < ж},
где г] ~ Л/*(0,1) г] и х\г независимы.
Теперь рассмотрим предельные распределения в правой части соотношений (11), (12). Будем считать, что Нп имеет геометрическое распределение с параметром 1/п, т.е.
Р{Мп = к} = - (г - -А; = 0,1,... . (18)
п \ п/
Тогда величина £ из соотношения (9) имеет стандартное показательное распределение с плотностью /¿(ж) = е~х, ж > 0, и
ЕФ(жС)= /Ф(^)е"и^= + пРиа^°> (19)
7 [ | при х = 0.
Для получения представления величины ЕФ(х/у/£) проще всего найти предельную плотность 1?1((р(х/л/£)/л/£), которая имеет вид
оо сю
ЩФ/уД)/уД) = /ехр - ^ = ^ /ехр ^ ^ = ехр(^л/2|ж|) (20)
о о
[12, 13, гл. 29], т.е. величина ЫпТ^п/у/п в пределе при п ^ оо имеет распределение Лапласа с плотностью ехр(^у/2|ж|). Полученные представления (19) и (20) можно обобщить на случай, когда £ имеет гамма-распределение с плотностью (17).
Рассмотрим также предельное распределение в правой части соотношения (14), когда имеет геометрическое распределение (18) с параметром 1 /щ, г = 1,2. Так как величины NlJnlTl^1/у/п\ и /у/Щ независимы и в пределе при П\,П2 ^ оо каждая величина имеет распределение
Лапласа с плотностью ехр(—\/2|ж|), то
ЕФ ( . Ж ) = ЕФ ( -5= ) * ЕФ
+ \VfiJ
где знак * означает свертку двух распределений, и
'—7= ехр(у/2ж)(у/2 — ж), ж < 0,
ЕФ ' Ж \
л/^1 + 6/ [1 - ^-ехр(-л/2а;)(л/2 + а;), ж^0.
Аналогичным образом можно рассмотреть также предельные распределения в правой части соотношений (13) и (15) как свертки соответствующих распределений.
3.5. Вернемся к п. 3.1 раздела 3 данной работы, где рассмотрен асимптотический подход к построению критерия для проверки гипотезы Н против альтернативы К. Мы находимся в условиях введения. Кроме того, рассмотрена целочисленная неотрицательная случайная величина величины Л 1, • • •, Л'„, Нп независимы. Исследуем влияние распределения случайного объема Нп выборки Хх,..., Х]уп на предельное распределение статистики критерия. Если считать, что имеет отрицательное биномиальное распределение (16) и учесть предложение 4, тогда критерий (5) заменяется на критерий с критической областью
| (х^/Б^ - у/п/у/АЩ ^ ¿1_в)2г} , (21)
при п ^ оо имеющий асимптотический уровень значимости а. Здесь означает р-квантиль распределения Стьюдента с к степенями свободы, величина А(й) определяется соотношением (4).
Аналогично в условиях п. 3.2 раздела 3, когда объем выборки Х\,..., имеет отрицательное биномиальное распределение (16) и с учетом предложения 4, критерий (6) заменяется на критерий с критической областью
{{Х[Мп)/{ХНп - х[Мп)) - 4//х)/Х2^/Ыо) > Ь-а,2г}, (22)
при п ^ оо имеющий асимптотический уровень значимости а.
Наконец, в п. 3.3 раздела 3 мы строили критерий, основанный на центральных порядковых статистиках. Когда объем выборки ..., Х^п является случайной величиной с отрицательным биномиальным распределением (16) и с учетом предложения 4, мы строим статистику
гр /"у-\ _ -^(-^п) _ у(ЛГ'г) ^
основанную на центральных порядковых статистиках, построенных по выборке Х\,..., Х^п случайного объема Нп. Для проверки гипотезы Н против альтернативы К вместо критерия (8) получаем критерий с критической областью
{((Са1 - Сх3)Тмп(Х) - Са2 - о) ^ ¿1-в)2г}, (23)
при п ^ оо имеющий асимптотический уровень значимости а. Величина Х?(<1) определяется соотношением (7).
Предложение 4 носит достаточно общий характер. Если известно предельное распределение при п ^ оо отношения Нп/п для случайного объема Нп выборки Хх,..., Х^п, то предложение 4 дает возможность строить асимптотический критерий для проверки гипотезы Н против альтернативы К, учитывая влияние величины на предельное распределение статистики критерия. Для этого достаточно вычислить квантиль уровня 1 — а предельного распределения статистики критерия. Получим критерии вида (21), (22) или (23), где в правой части стоит квантиль уровня 1 — а предельного распределения статистики критерия.
4. Случай двух партий изделий. Пусть Хц, ... ,ХхП1, Л'-л......V •_.,,„ независимы, Х^ имеет
плотность распределения /((ж — ] = 1,... |«г| < оо, ^ > 0, с^ = а^/Ьг, Рг = 1 — с^),
х
г = 1,2, .Р(ж) = / /(у) (¿у, параметры сц, а2, Ь\, Ь2 неизвестны. Обозначим
—ос
Пг Пг
¡.п, = ^ ^ Х^/щ, = ^ — Хг,Пг) / (Щ ~ 1); = (Хц — 0,г)/Ьг, ] = . . .
3=1 3=1
(п) (п)
Х^ ^ ... ^ Х\п — вариационный ряд, построенный по наблюдениям Хц,..., Л',-,,.. ¿ = 1,2.
Рассмотрим асимптотический подход в задаче сравнения двух партий изделий для проверки гипотезы Hi~.pi = Р2 против альтернативы К\ \ р\ > р2.
4.1. Пусть существует ЕУД и соотношение (3) имеет место. Обозначим ЕУц = /х, Т>Уц = с2, гп1 = Е((Уц — /х)/ст)г. При щ оо имеем = оХг^н/— /х / 1.2. и при гипотезе Н\
величина й = (п^ + п2^2)/(п1 + п2) является состоятельной оценкой общего параметра й = = (¿2. Для проверки гипотезы Н\ против альтернативы К\ критерий с критической областью
{Хг^/Бг^ - Х2)П2/%,П2) /{ЩЩ > (24)
при П1,П2 —> оо имеет асимптотический уровень значимости а. Величина А(й) определяется соотношением (4).
Если /(ж) = ехр(^ж2/2), то критерий (24) совпадает с модернизированным асимптотически оптимальным критерием Д. Неймана [7].
4.2. Пусть /(ж) > 0 при ж ^ О, /(ж) = 0 при ж < 0, lim ж äF(ж) = с > 0 для некоторого 0 < S < 2
х—>-0
и существует ЕУ^. Обозначим ЕУц = /х, DYn = с2,
di = fi(X¡^/(Xitni - Х^)), i = 1,2, d = (nidi + n2d2)/{ni + n2). Для проверки гипотезы l?i против альтернативы К\ критерий с критической областью
{(x™/(xltni - X(?>) - xfr>/(x2,na - xir}))ß2/ + > *-«}
имеет при n\,n2 ^ оо асимптотический уровень значимости а.
4.3. В п. 3.3 раздела 3 мы строили асимптотический критерий для проверки гипотезы Н о доле дефектных изделий в партии, основанный на центральных порядковых статистиках. Аналогичным образом при сравнении долей дефектных изделий в двух партиях изделий для проверки гипотезы Hi против альтернативы К\ построим асимптотический критерий, основанный на центральных порядковых статистиках. Рассмотрим статистику
у(?Н) V(ni) , J
т (y\_ "Ч[А2г^]+1 _ Ii,[X2 '-lo
(щ) _у{щ) ~ у(гц) _ у(щ) '
лг,[А1П»] + 1 лг,[А3п»] + 1 1 ¿,[Ain¿] + l 1¿,[A3ni]+l
О < Ai < Х2 < Аз < 1, F((xj) = Aj. Будем считать, что 0 < /(Caj) < j = 1,2,3. Обозначим
di = (Caí — Ca3)Ti,m(X) — Са2; i = 1; 2, d = {п\й\ + п2й2)/{п\ + п2). Для проверки гипотезы Н\ против альтернативы К i критерий с критической областью
(Са, - СА3){Тг,П1{Х)^Т2,П2{Х))! + ^ %1—с
имеет асимптотический при п\,п2 ^ оо уровень значимости а. Величина определяется соотношением (7).
4.4. Рассмотрим пример построения асимптотического критерия для проверки гипотезы Н\ против альтернативы К\ на основе двух выборок случайных объемов. Пусть 1ц,..., Х\П1, Х2\,..., Х2п,л, независимы, N1^, — целочисленные неотрицательные величины и существуют величины ¿л и такие, что
рч < ; |
? <511 1 - } }
п
при п ^ оо. Относительно распределений величин Хц,..., Л',-,,.. г = 1,2, указано в начале раздела 4. Мы находимся в условиях п. 4.1 раздела 4. Для проверки гипотезы Н\ против альтернативы К\ в случае, когда объем выборки является случайной величиной, при п ^ оо рассмотрим величины
Пь (aYa-M.A, - = + 1)) i = 1,2
L, ¿J,
771, 772 — независимые стандартно нормально распределенные величины. Обозначим
-
/'S'i.JVi - X2jN,JS2jN,¿)/\JA(d), (25)
д, = ((¿1 + d2)/2, ^ = aXiíNi/SiíNi — //,¿ = 1,2, величина А(с^) определяется соотношением (4). Предположим, что N1 = ш Н2 = Ж2)П имеют геометрическое распределение (18), тогда для проверки гипотезы Н\ против альтернативы К\ критерий, основанный на выборках Хц,..., Хцу1 и Х2\,..., Х2^2 случайных объемов N1^ и Ж2)П соответственно, имеет критическую область {Тп ^ 1\-а} и ПРИ п ^ оо имеет асимптотический уровень значимости а. Здесь Тп определяется правой частью соотношения (25), 1Р является р-квантилью распределения, являющегося сверткой двух распределений Стью-дента с 2 степенями свободы (см. п. 3.4 раздела 3).
СПИСОК ЛИТЕРАТУРЫ
1. Леман Э. Проверка статистических гипотез. М.: Наука, 1979.
2. Пагурова В. И., Нестерова С. А. Выборочный контроль по количественному признаку и критерии для коэффициентов вариации // Вестн. Моск. ун-та. Сер. 15. Вычисл. матем. и киберн. 1991. № 1. С. 57-63.
3. Lieberman G. J., Resnikoff G.J. Sampling plans for inspection by variables // J. Amer. Statist. Assoc. 1955. 50. P. 457-515.
4. Gohnson N. L., Welch B.L. Applications of the noncentral t-distribution // Biometrika. 1940. 31. P. 362.
5. Neyman J. Optimal asymptotic tests of composite statistical hypotheses // Probability and Statistics. New Jersey: Wiley, 1959. P. 213-234.
6. Moran P. A. D. On asymptotically optimal tests of composite hypotheses // Biometrika. 1970. 57. N 1. P. 4755.
7. Pagurova V.I. On asymptotically optimal tests in problems of sampling inspection by variables //J. Math. Sciences. 2002. 112. N 2. P. 4168-4173.
8. David H. A., Nagaraja H.N. Order Statistics. Wiley, 2003.
9. Embrechts P., Kluppelberg C., Mikosch T. Modelling Extremal Events for Insurance and Finance. Berlin: Springer, 1997.
10. Прохоров А. В., Ушаков В. Г., Ушаков Н. Г. Задачи по теории вероятностей. М.: Наука, 1986. Н.Королев В.Ю., Соколов И. А. Математические модели неоднородных потоков экстремальных событий. М.: Торус Пресс, 2008.
12. Бенинг В.Е., Королев В.Ю. Об использовании распределения Стьюдента в задачах теории вероятностей и математической статистики // Теория вероятн. и ее примен. 2004. 49. № 3. С. 417-435.
13. Справочник по специальным функциям с формулами, графиками и математическими таблицами / Под ред. М. Абрамовича, И. Стиган. М.: Наука, 1979.
Поступила в редакцию 18.02.14
ON SAMPLING PLANS FOR INSPECTION BY VARIABLES
Pagurova V. I.
Consider the setting in which a lot of items is to be either accepted or rejected based on a quality characteristic X that can be measured on each item in the lot. A sample of items is drawn from the lot, and the measurement X is made on each item sampled. A distribution of X follows the two-parameter family of distributions. To test the hypotheses concerning a proportion of nonconforming items in the lot we consider uniformly most powerful invariant tests, an asymptotic approach and a random size of the sample.
Keywords: sampling plans for inspection by variables, uniformly most powerful invariant tests, asymptotic approach, random size of the sample.