Статистический анализ выборок курсов валют с помощью ранговых
критериев
М.А.Власов
Одна из самых обычных задач в математической статистике - это задача о сравнении двух выборок. В отличие от обычных критериев [1,8], использование ранговых критериев не накладывает никаких ограничений на тип распределения случайной величины. В ранговых критериях можно различать три группы. Критерии первой группы проверяют гипотезу о совпадении центральных тенденций сравниваемых совокупностей, второй-гипотезу о равенстве размахов варьирования, третьей- гипотезу о равенстве законов распределения[1]. Нулевая гипотеза для критериев первой группы формулируется как Н0: ц = цп , где ц и цп - характеристики центров распределения случайных величин £, и ц соответственно, реализациями которых являются выборочные значения х и у. Альтернативами будут: Н1:
Ф ЦП ; Н2: Н3: < ЦП .
Критерий Вилкоксона.
Пусть имеются две выборки: х1, х2,... хт и у1, у2,... уп , причем их объёмы не обязательно должны быть одинаковыми. Объединим обе выборки в одну и упорядочим её. В качестве меры близости центральных тенденций двух выборок можно взять сумму рангов значений, принадлежащих каждой исходной выборке. Эта величина называется статистикой (критерием)
Вилкоксона. Итак, имеем две величины:
т * п * * *
Жх = Е -К(х.) Ж У = Е -К(У ), где Я(х*), Я(у .) - ранги значений иксов и игреков в общей
1=1 1=1 1 1
упорядоченной выборке.
В том случае, если объёмы выборок одинаковы, с критическим значением сравнивается меньшая сумма рангов. Нулевая гипотеза отвергается, когда Жх(или ЖУ)<Ж(а) , где Ж(а)-критическое значение статистики Вилкоксона. Для выборок с неодинаковыми объёмами вычисляют “дополнение”[1,6].
В тех случаях, когда выборка образована значениями случайной величины с нормальным распределением, лучше воспользоваться более чувствительным критерием, а именно Х-критерием Ван дер Вардена[1,5].
Критерий Ван дер Вардена.
Пусть имеются две выборки: хь х2,... хт и уь у2,... уп. Проделаем ту же процедуру, что и в случае критерия Вилкоксона. Разделим теперь ранги значений на N+1, где И=п+ш, и вычислим сумму
(
Я( х *)
N +1
V J
и = ЁЁк}> где к} = <
і=і ]=і
, где ¥( ) - обратная функция стандартного нормального распределения.
Значения Хх и Ху различаются лишь по знаку, поэтому удобнее рассчитывать статистику для выборки меньшего объёма. В зависимости от альтернативы нулевая гипотеза отвергается с уровнем значимости а, если \Х\>Х(а) для альтернатив Н2 и Н3 и если \Х\>Х(2а) для альтернативы Н1.
Критерий Манна-Уитни.
Для проверки гипотезы сдвига Манн и Уитни предложили ранговый критерий, основанный на статистике [2]:
1 х, < у,;
0 х, > у,-
Если и1(а)<и< и2(а), гипотеза сдвига отклоняется (и1(а) и и2(а)-критические значения, берущиеся из таблицы).
Статистический анализ часто проводится в банковских операциях[7,9,10]. Рассмотрим примеры и применим ранговые критерии к сравнению двух выборок х и у-курсов валют за два соседних дня в девяти коммерческих банках. Были исследованы четыре базовых примера:
1) Курсы продажи доллара США за 17-18.12.2003. При этом курс Центрального Банка России(ЦБ) уменьшился, значит следует ожидать отклонение гипотезы о равенстве центральных тенденций двух выборок.
2) Курсы продажи доллара за 25-26.12.2003. В эти два дня курс ЦБ не изменился, следовательно нужно ожидать подтверждение нулевой гипотезы.
3) Курсы покупки доллара за 17-18.12.2003.
4) Курсы покупки доллара за 25-26.12.2003.(См.таблицу)
Курс доллара США к рублю.
Банки 17.12.2003 18.12.2003 25.12.2003 26.12.2003
Покупка Продажа Покупка Продажа Покупка Продажа Покупка Продажа
1 28 29,7 27,7 29,3 28 29,27 28 29,25
2 28,8 29,48 28,8 29,4 28,2 29,28 28,7 29,3
3 28,1 29,57 28 29,3 27,5 29,29 27 29,27
4 29 29,4 28,7 29,3 28,1 29,23 27,9 29,4
5 28,2 29,32 28,3 29,3 28 29,25 28 29,26
6 29,1 29,59 28,3 29,3 28 29,39 28 29,59
7 28,9 29,3 28,7 29,25 28,9 29,28 28,9 29,25
8 29 29,6 28,5 29,35 27,5 29,2 27,5 29,1
9 28 29,37 27,7 29,3 28 29,27 28 29,25
Курс ЦБ 29,3 29,25 29,245 29,245
Применение к примерам 1-4 критериев дало следующие результаты:
1) Меньшая сумма рангов Ж=53,5<Ж(а), Х=5,22> Х(а),и=8< и1(а) для всех
а. Нулевая гипотеза отвергается. 2) Ж=80>Ж(а), Х=0,631< Х(а),и1(а)<и=26< и2(а)для всех а. Нулевая гипотеза не отвергается. 3) Ж=70,5>Ж(а),Х=2,79< Х(а), и1(а)<и=24< и2(а)для всех а. Нулевая гипотеза не отвергается.
4) Ж=80,5>Ж(а),Х=0,844< Х(а),и1(а)<и=34< и2(а) для всех а. Нулевая гипотеза не отвергается. Критические значения брались из таблиц [1,2]. Распределения могут отличаться не только средним значением, но и разбросом, в качестве меры которого обычно выступает дисперсия. Нулевая гипотеза для критериев второй группы формулируется так:
Но :а2х = а2у противоднойизальтернатив Н1 :оХ * о\; Н2 '-о1 > о\; Нз '-о1 < о\ в предположении, что центры распределения практически совпадают.
Модификация Сиджела-Тьюки критерия Вилкоксона Поступим с выборками х и у так же, как и в случае критерия Вилкоксона. Ранги после этого определим по правилу чередования [4]. Обозначим $>х и 8У суммы рангов для выборок х и у соответственно. Пусть £-меньшая из сумм 8х и 8У и 8,=т1п(т,п)(Ы+1)-8. (Здесь К=п+т). Нулевая гипотеза отвергается , если 5 и 5' оказываются меньше критического
значения Ж(а) для статистики Вилкоксона. Применение к примерам 1-4 критерия Сиджела-Тьюки дало следующие результаты:
1) 5х=75, 5у=96, 5=75, 5'=96> Ж(а) для всех а. Нулевая гипотеза не отвергается. 2) 5х=98, 5у=73, 5=73, 5'=98> Ж(а) для всех а. Нулевая гипотеза не отвергается. 3) 5х=67, 5у=104, 5=67, 5'=104> Ж(а) для всех а. Нулевая гипотеза не отвергается. 4) 5х=89, 5у=82, 5=82, 5'=89> Ж(а) для всех а. Нулевая гипотеза не отвергается.
Нулевая гипотеза для критериев третьей группы формулируется как Н0: Р(х) = Р(у) против альтернатив Н1: Р(х) * Р(у); Н2: Р(х) > Р(у); Н3: Р(х)
Критерий Колмогорова-Смирнова.
Критерий основан на сравнении рядов накопленных частот обеих совокупностей. Пусть Р](х) и Р](у)- накопленные относительные частоты выборок х и у; где > номер значения в общем вариационном ряду. Максимальная по величине разность В = тахр (х) - р (у)] может служить мерой близости двух распределений. При больших объёмах совокупностей (т,п>100) если В больше критического значения В(а), то нулевая гипотеза о равенстве распределений отвергается. Если объёмы совокупностей малы, приходится вводить поправки [3,6]. Применение к примерам 1-4 критерия Колмогорова-Смирнова дало везде ожидаемые результаты. Таким образом можно сделать следующий вывод после применения всех ранговых критериев: лишь для примера 3 все критерии первой группы дали неверный результат. Во всех остальных случаях все критерии подтвердили ожидания.
Литература.
1. Благовещенский Ю.Н., Самсонова В.П., Дмитриев Е.А. Непараметрические методы в почвенных исследованиях. [Текст]: Монография/ Ю.Н.Благовещенский и др. - Москва: ”Наука”, 1987. - 98 с.
2. Кобзарь А.И. Прикладная математическая статистика. [Текст]: Монография/ А.И.Кобзарь - Москва: Физматлит, 2006, - 816 с.
3. Хеттманспергер Т. Статистические выводы,основанные на рангах.
[Текст]: Монография/ Т.Хеттманспергер - Москва: "Финансы и
статистика”, 1987, - 333 с.
4. Орлов A^. Эконометрика. [Текст]: МонографияА.И.Орлов - Москва: Экзамен, 2006, - 576 с.
5. Gibbons J. D., Chakraborti S. Nonparametric Statistical Inference, 4th Ed. — CRC, 2003 — 608 с.
6. Hajek J., Sidak Z., Sen K. P. Theory of rank tests(second edition). — Academic Press, 1999. - 450 p.
7. Пучков Е.В. Разработка системы поддержки принятия решений для
управления кредитными рисками банка. [Электронный ресурс]// «Инженерный вестник Дона», 2011, №1. - Режим доступа:
http://ivdon.ru/magazine/archive/n1y2011/377 (доступ свободный) - Загл. с экрана. - Яз. рус.
8. Галушка В.В., Фатхи ВА. Формирование обучающей выборки при
использовании искусственных нейронных сетей в задачах поиска ошибок баз данных. [Электронный ресурс] // «Инженерный вестник Дона», 2013, №2. - Режим доступа:
http://ivdon.ru/magazine/archive/n2y2013/1597 (доступ свободный) -Загл. с экрана. - Яз. рус.
9. Волосатова ТА. Явление агрессивной скупки акций на российском финансовом рынке. [Текст] // Математические методы в современных и классических моделях экономики и естествознания: материалы региональной научно-практической конференции ППС и молодых учёных / Рост.гос.экон.ун-т “РИНХ”-Ростов н/Д., 2009. - С.142-146.
10.Данекянц A.r. Различные модели осуществления скупки акций.
[Текст] // Математические методы в современных и классических моделях экономики и естествознания: материалы региональной научнопрактической конференции ППС и молодых учёных / Рост.гос.экон. ун-т “РИНХ”-Ростов н/Д., 2009. - С. 146-149.