С. В. Бухарин,
доктор технических наук, профессор, ВГТА
С. А. Бабкин
УСТАНОВЛЕНИЕ ОДНОРОДНОСТИ РАДИОТЕХНИЧЕСКИХ ТОВАРОВ (РАБОТ, УСЛУГ) НА ОСНОВЕ КРИТЕРИЯ ЗНАКОВ
DEFINITION OF HOMOGENITY OF RADIO PRODUCTS (SERVICES) BASED ON SIGNS CRITERION
Рассматривается возможность разработки рациональных алгоритмов установления однородности радиотехнических устройств на основе критерия знаков при построении экспертных систем, основанных на применении методов математической статистики.
The possibility of developing a rational algorithm of establishing the homogeneity of radio devices based on the criterion of signs in the building of expert systems based on mathematical statistics application is considered.
Одной из актуальных задач развития как производств, так и современных научноисследовательских работ является приобретение у поставщиков и подрядчиков качественных радиотехнических устройств. Доказано, что одним из эффективных путей решения этой задачи является использование экспертных систем, основанных на применении методов математической статистики [1,2]. Одним из важнейших этапов построения таких систем является разработка рациональных алгоритмов установления однородности товаров (работ, услуг). В качестве объектов, для которых необходимо определение однородности, могут выступать различные технические приборы (спутниковые телефоны, мобильные телефоны, телевизионная и компьютерная техника, приборы охраннопожарной сигнализации, радиостанции и т.д.). При этом в качестве признаков могут выступать как технические, так и экономические характеристики приборов, т.е. задача носит комплексный технико-экономический характер. Следуя терминологии ст. 40 Налогового кодекса РФ [3], сравнивая различные приборы и устройства, мы зачастую будем называть их обобщающим понятием «товары».
Для проверки гипотезы об однородности технических средств предложим использовать свободный от распределения процедуры математической статистики критерий знаков [4,2].
Пусть для оценки однородности двух товаров выбрано m признаков: x1(1), x21),...,— для первого товара; x1(2),x22),...,x^ — для второго. Для крите-
рия знаков ситуации
x« > x(2) (1)
приписывается знак «+», или +1, а ситуации
x(ll) <x(i2) (2)
— знак «-», или -1. В том случае, если соответствующие признаки могут быть сопоставлены количественно, это просто неравенства. Если же признаки носят качественный
характер, под символами «>» или «<» в формулах (1), (2) понимается «лучше» или «хуже». Если в качестве статистики критериев выбрать среднее арифметическое, то для однородных товаров она будет распределена около нуля.
Так называемый критерий знаков для значения квантиля непрерывного распределения был, по-видимому, первым из когда-либо использовавшихся свободных от распределения критериев, но современный интерес к нему берёт начало с работ Кокрэ-на В. и Смирнова В.Г.
Предположим, что функция распределения наблюдений есть ^я) и что
F(ХР) = р , (3)
так что Хр есть р-квантиль этого распределения, т.е. значение, ниже которого лежит 100р процентов распределения. Для любого р, 0 < р < 1 значение Хр есть характеристика положения распределения. Мы хотим проверить гипотезу
Но : Хр = хо, (4)
где хо — некоторое заданное значение. (Если для удобства принять х 0 за начало отсчёта, то мы хотим проверить равенство Хр нулю.)
Если имеется выборка из п наблюдений, то мы знаем, что выборочная функция распределения будет сходиться по вероятности к функции распределения наблюдений. Отметим соотношение между порядковыми статистиками х (1), х(2), ..., х (П) и гипотетическим значением Хр, подлежащим проверке. Сосчитаем, сколько наблюдений в выборке попадает ниже х0, т.е. образуем статистику
^ к(х0 - х() ) =]Т к(х0 - х ^ (5)
I =1 I=1
Г1, 2 > 0,
где к (г) = \
[0, г < 0.
Статистика £ считает число положительных значений среди разностей (х 0-хг), и поэтому критерий, основанный на £, называется критерием знаков. Сразу видно, что £ имеет биномиальное распределение, поскольку £ есть сумма п независимых наблюдений над (0—1) — случайной величиной к(х0 - х) с вероятностью
Р{к(х0 - х) = 1} = Р{х < х0}.
Обозначим Р{х<х0} = Р. Тогда гипотеза (4) сводится к
Н0: Р = р, (6)
и мы просто проверяем гипотезу о биномиальном параметре р. Нас могут интересовать односторонние или двусторонние альтернативы к (6).
Если мы больше ничего не знаем относительно функции распределения F(x), то
интуитивно полагаем, что мы не можем получить ничего лучшего, чем £, в качестве
статистики критерия, и мы находим из биномиальной теории, что для односторонней альтернативы Н1 : Р > р критическая область, состоящая из больших значений £, является равномерно наиболее мощной (РНМ), а для двусторонней альтернативы Н 2 : Р ф р двусторонняя критическая область является равномерно наиболее мощной несмещённой (РНМН).
В наиболее важном для практики случае, когда Р = 1/2 и мы проверяем медиану распределения, мы имеем для £ симметричное биномиальное распределение и РНМН критическая область против гипотезы Н2 симметрична.
Таким образом, при малом объёме выборки п таблицы биномиального распределения достаточны как для определения размера критерия знаков, так и для определения его мощности против любого конкретного альтернативного значения р, а следовательно, и его функции мощности для альтернатив Н1 или Н2. Когда п возрастает,
сходимость биномиального распределения к нормальному позволяет нам сказать, что 1 / 2
(Б - пр)/{пр( 1 - р} 2 имеет стандартное нормальное распределение. Если мы пользуемся поправкой на непрерывность, то это сводится к замене | £ - пр \ на | £ - пр \ -1 / 2 при условии выполнения критерия.
В случае медианы, когда мы проверяем гипотезу Р = 1/2, сходимость к нормальности настолько быстрая, что здесь, скорее всего, вовсе не потребуются специальные таблицы, поскольку нам нужно только сравнить значение
(
с 1 Л----п
2
(7)
с подходящим стандартным нормальным отклонением.
Приближённая мощность критерия знаков также легко устанавливается с помощью нормальной аппроксимации. Пренебрегая поправкой на непрерывность, указанной в (6), поскольку она мала при больших выборках, мы видим, что критической областью одностороннего критерия для Р = 1/2 против Р > 1/2 является
£ > — п + ё 1 п12,
2 а 2
где ёа — подходящее нормальное отклонение для критерия размером а. Известно,
что функция мощности приближённо равна [4]:
Оі(Р)-
I {2кпР(1 - Р)} 17 2 вхр\-
1 / 2
1 (и - пР)
2пР( 1 - Р)
ши
п17 2 (Ї - Р
( 2р ) 17 2 ехр(-1 і2 )&■■
О
п
1 / 2
[Р(1 - Р)]
1 / 2
(8)
,1 / 2
{Р( 1-Р)}1
где О{х} — нормальная функция распределения. Из (8) сразу следует, что при п ®¥ мощность ® 1 для любого Р > 1/2, так что критерий состоятелен. Аналогично находим, что функция мощности двустороннего симметричного критерия с критической областью
с 1 Л — п 2
^ а а/ 2 •1 п 1/2
равна
б2(Р) = О
п1/2 Р -1) - Їс ■ + О- п1/2 2 - Р) - ^
[Р(1 - Р )]1/2 [ Р(1 - Р)]1/2
(9)
и стремится к 1 для любого Р Ф1/2 при п ® ¥. Этим устанавливается состоятельность двустороннего критерия против других альтернатив.
Функции мощности (8) и (9) выражаются через значение Р, задаваемое альтернативной гипотезой. Если мы теперь желаем рассматривать эффективность критерия знаков в конкретных ситуациях, нам нужна дальнейшая конкретизация распределения. Если мы вернемся к первоначальной формулировке гипотезы (4) и ограничимся случаем медианы ^0,5, которую будем обозначать М, то наша задача состоит в проверке гипотезы
1
а
а
2
Но : М = М0. (10)
Если функция распределения наблюдений, как и раньше, равна Е(х), а плотность распределения вероятности равна /(х), то мы имеем для значения Р
М о
Р = ¥(Мо ) = |/(х)ёх. (11)
— ¥
Предположим, что нас интересует относительная эффективность критерия знаков, когда известно, что функция распределения Е «симметрична», так что её среднее и медиана М совпадают. Мы можем в этой ситуации проверять гипотезу (10), пользуясь в качестве статистики критерия выборочным средним х . Если Е имеет конечную дисперсию а2, то х асимптотически нормальна со средним Ми дисперсией а2/п, и при больших выборках оно эквивалентно статистике Стьюдента
х — М
t =------177 ,
5 /(п —1)1/2
где 52 — выборочная дисперсия. Для х мы имеем
Л - - 2
(х\М) = 1, Б(х\М) = о /п,
ЭМ так что
2
г_э ...... .л
м (х|м»
ЭМ I п
-----=------- =~Т. (12)
Дх\М) о2 ’
Для статистики критерия знаков нам будет удобно принять М за начало отсчёта, так что
М 0 —М
М (Б \ Р) = пР = п | /(х)ёх
и, следовательно,
| ЩШ. I =—п/(0 ).
I ЭМм = м 0
Кроме того, В( Б \ М0 ) = 1 п.
Таким образом, в первоначальной системе отсчёта
ЭМ(Б\М)'
Эм J м-м^ = 4п{/(М)}2 (13)
В(Б\М 0 )
Из (12), (13) находим, что эффективность критерия знаков равна
АБ,х = 4°2 {/(М)} 2. (14)
В нормальном распределении /(М) = (2 ро2 )_1 / 2, так что (14) принимает зна-
чение 2/р. Поскольку мы проверяем здесь симметрию относительно Мо, то можем также использовать альтернативный критерий Вилкоксона, имеющий асимптотическую относительную эффективность (АОЭ), равную 3/р в нормальном случае.
В качестве примера применения критерия знаков выберем компьютерную систему. Тогда в качестве количественных признаков могут рассматриваться: объём опе-
ративной памяти, объём дисковой памяти, тактовая частота и т.д. Качественными при-
знаками могут служить: вид принтера (лазерный или струйный; чёрно-белый или цветной), страна-производитель, тип корпуса (горизонтальный или вертикальный) и т.д.
Пусть для попарного сравнения различных устройств выбираются 10 признаков. Тогда, если при их сопоставлении первое устройство получает 5 «плюсов» и 5 «минусов», можно считать их однородными, и вопрос о предпочтении одного устройства другому определяется лишь их ценой. Приведённая выше методика позволяет сделать вывод о том, что утверждение об однородности справедливо с вероятностью более 0,91.
Если же при их сопоставлении первое устройство получает 4 «плюса» и 6 «минусов», всё-таки можно считать их однородными, однако с меньшей вероятностью (0,73). Разумеется, приведённые значения вероятностей в определённой мере неточны. Это обусловлено размытостью и субъективностью оценок «лучше» или «хуже» для качественных признаков.
ЛИТЕРАТУРА
1. Бешелев, С.Д. Математико-статистические методы экспертных оценок / С. Д. Бешелев, Ф.Г. Гурвич. — М.: Статистика, 1980.
2. Экспертные системы в организации налогового учёта: монография / С.В. Бухарин [и др.]; под ред. проф. С. В Бухарина. — Липецк: Изд-во Липецкого гос. техн. унта, 2003. — 146 с.
3. Налоговый кодекс Российской Федерации. Ч. 1 и 2. — М.: ОМЕГА- Л, 2005.— 640 с.
4. Кендалл, М.Дж. Статистические выводы и связи / М.Дж. Кендалл,
А. Стьюарт.— М.: Наука, 1973.— 899 с.