Научная статья на тему 'К оценке устойчивости двухфакторных зависимостей'

К оценке устойчивости двухфакторных зависимостей Текст научной статьи по специальности «Науки о Земле и смежные экологические науки»

CC BY
45
8
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ПАРНАЯ РЕГРЕССИЯ / ПАРНАЯ И ЧАСТНАЯ КОРРЕЛЯЦИЯ / УСТОЙЧИВОСТЬ КОРРЕЛЯЦИИ / МОДЕЛИРОВАНИЕ ПОКАЗАТЕЛЕЙ / TWIN REGRESSION / TWIN AND PARTICULAR CORRELATION / STABILITY OF CORRELATION / MODELING OF INDICES

Аннотация научной статьи по наукам о Земле и смежным экологическим наукам, автор научной работы — Авров Андрей Петрович

Рассматривается методика анализа устойчивости парных регрессионно-корреляционных зависимостей на основе моделирования вариантов поведения признака результата. Полученные результаты исследования в целом соответствуют известной методике теоретической оценки статистической значимости показателей корреляции и регрессии на основе принятия или отказа от так называемой «нуль-гипотезы».

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по наукам о Земле и смежным экологическим наукам , автор научной работы — Авров Андрей Петрович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

THE ESTIMATION OF THE STABILITY OF TWO-FACTOR CORRELATIONS

The method of the analysis of stability of twin regression correlation relations in the modeling of sign behavior variants is considered. The result obtained in whole corresponds with one of the well known methods of theoretical estimation of statistical significance of both correlation and regression indices, testing so called -hypothesis.

Текст научной работы на тему «К оценке устойчивости двухфакторных зависимостей»

ТЕОРЕТИЧЕСКИЕ ПОИСКИ И ПРЕДЛОЖЕНИЯ

хцк 311.16

К ОЦЕНКЕ УСТОЙЧИВОСТИ ДВУХФАКГОРНЫХ ЗАВИСИМОСТЕЙ

А.П. Авров

Казахский экономический университет им. Т. Рыскулова E-mail: [email protected]

Рассматривается методика анализа устойчивости парных регрессионно-корреляционных зависимостей на основе моделирования вариантов поведения признака результата. Полученные результаты исследования в целом соответствуют известной методике теоретической оценки статистической значимости показателей корреляции и регрессии на основе принятия или отказа от так называемой «нуль-гипотезы».

Ключевые слова: парная регрессия, парная и частная корреляция, устойчивость корреляции, моделирование показателей.

THE ESTIMATION OF THE STABILITY OF TWO-FACTOR CORRELATIONS

A.P. Avrov

Khazakh Economics University named after Ryskulov E-mail: [email protected]

The method of the analysis of stability of twin regression correlation relations in the modeling of sign behavior variants is considered. The result obtained in whole corresponds with one of the well known methods of theoretical estimation of statistical significance of both correlation and regression indices, testing so called «null-hypothesis».

Key words: twin regression, twin and particular correlation, stability of correlation, modeling of indices.

В статье излагаются результаты исследования, являющиеся продолжением работы [1]. Как и в предыдущей работе, при моделировании устойчивости применялся подход на основе случайных возмущений, влияющих на величину зависимой переменной.

© Авров А.П., 2010

Расчеты проводились на основе дополненной программы, используемой при изучении устойчивости параметров парной прямолинейной регрессии [1, с. 4], дополнения связаны с необходимостью оценки устойчивости частных коэффициентов корреляции и регрессии.

Основные ее характеристики:

• общая величина Eidyi абсолютных отклонений зависимой переменной y является результатом прочих изменений (колеблемости) значений прочих неучтенных факторов;

• максимально возможная величина отклонений (max.dy);

• минимально возможная величина (шаг), min.dy.

Файл случайных возмущений (dy) создавался на основе максимальных и минимальных значений dy или на основе первоначального файла относительных возможных значений (kpr), а затем значения dy получались как произведение kpr на соответствующее значение y. И в том, и в другом случае использовались три варианта формирования файла случайных возмущений: положительных и отрицательных значений (±dy и ±kpr); только из положительных значений (+dy и +kpr); только из отрицательных значений (-dy и -kpr).

Число испытаний, число оборотов 1000.

После выбора в случайном порядке, с использованием счетчика случайных чисел, возможные значения dy прибавлялись к отдельным значениям y. Программа позволяет рассчитывать фактические и средние значения частных коэффициентов корреляции, дисперсии, характеризующие различия между смоделированными значениями, построить интервальные ряды распределения смоделированных значений.

Исходные данные для расчетов:

N 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18

x 1 2 3 4 5 6 1 2 3 4 5 6 1 2 3 4 5 6

z 1 0,545 3 5 4 7 1 0,545 3 5 4 7 1 0,545 3 5 4 7

k 4 2 1 1 3 7 4 2 1 1 3 7 4 2 1 1 3 7

Y 3 12 10 19 6 16 3 12 10 19 6 16 3 12 10 19 6 16

При расчетах, в некоторых случаях, значения х брались в порядке убывания.

Были получены следующие уравнения регрессии: Ух2 = 17,2 - 2,49х + 0,742; ги = 0,925, Гху.2 = -0,324, г^ = 0,131, Их^ = 0,512; Ухк = 6,4 + 2,01х - 0,81к;

гхк = 0,422, гху.к = 0,571, Гку.х = -0,324, ^ = 0.572.

Программа позволяет рассчитывать фактические и средние значения частных коэффициентов корреляции, дисперсии, характеризующие различия между смоделированными значениями, построить интервальные ряды распределения смоделированных значений.

При построении интервального ряда распределения полученных в результате расчетов коэффициентов корреляции выделялись следующие интервалы:

г < -0,9; < -0,8; < -0,7; < -0,6; < -0,5; < -0,4; < -0,3; < -0,2; < -0,1; < 0; < 0,1; < 0,2; < 0,3; < 0,4; < 0,5; < 0,6; < 0,7; < 0,8; < 0,9; << 1.

Для изучения устойчивости частных коэффициентов корреляции были подобраны примеры с одинаковыми по значению (г = -0,324), но при разных

уровнях мультиколлинеарности факторов, в одном случае высокой (г = 0,925), в другом - низкой (г = 0,422). Использовались и разные варианты в отношении абсолютной суммы возмущений (Е!ёу! = 81 и Е!ёу! = 27), и по максимальной величине этих возмущений, шах.ёу = 15 и 10. Одинаковые значения коэффициентов корреляции брались для большей сопоставимости.

Изменения в значениях частных коэффициентов первого порядка связаны с колебаниями в значениях парных коэффициентов корреляции, при этом характер изменений зависит от тесноты связи (мультиколлинеарности) между факторами. Особенности влияния станут понятны при анализе формулы:

г - г г

г __ ху гу хг ху -г

7(1 - ^ )(1 - ry)

При высокой мультиколлинеарности между факторами имеет место и тесная зависимость отношений изменений значений парных коэффициентов rxy и rzy, т.е. изменения в значениях будут чаще однонаправлены при rxz > 0 или разно-направлены при rxz < 0, но в том и другом случае их колебания, учитывая знак минус в числителе, должны компенсироваться. При одинаковых по знаку колебаний и при разных, так как при одинаковых коэффициент корреляции между факторами будет положительный, а при разных - отрицательный. Однако, учитывая что выражение 1 - r2xz стоит в знаменателе, эффект компенсации при высокой мультиколлинеарности будет снижаться. Следовательно, однозначно судить, в каком направлении будут изменяться значения смоделированных коэффициентов корреляции, нельзя.

Судить о том, что существующая зависимость между изменениями в значениях коэффициентов корреляции тем выше, чем теснее связь между факторами, можно по корреляции между частотами распределения смоделированных значений парных коэффициентов корреляции.

Таблица 1

Коэффициенты корреляции между частотами смоделированных значений парных коэффициентов корреляции r^ и r^, r^ и r^ (Eidyi = 81, max.dy = 15)

dy± dy+ dy-

Rxz = 0,925 0,939 0,905 0,779

Rxk = 0,422 0,175 0,092 0,091

Расхождение существенно, такая же картина наблюдается и при других значениях суммы абсолютных возмущений и максимальных их величин. При расчете коэффициентов корреляции не брались пары, когда у обоих факторов частоты были нулевые.

При гху = -0,498, г2у = -0,418 и гх2 = 0,925 однонаправленные изменения будут встречаться чаще, близкое к единице значение гх2 обеспечит за счет числителя большее погашение, но за счет знаменателя, особенно множителя (1 - 0,9252), эффект погашения, полученный за счет числителя, значительно уменьшится.

При гху = 0,498, гку = -0,044 и гхк = 0,422 чаще будут встречаться разнонаправленные колебания парных коэффициентов корреляции, т.е. за счет числителя эффект, связанный с колебаниями парных коэффициентов корреляции, будет чаще не погашаться, а увеличиваться, но зато за счет знаменателя изменения будут менее значительны.

Таблица 2

Характеристики распределений смоделированных значений частных коэффициентов корреляции на основе абсолютных приростов

Е1ёу1 81 27

Коэффициенты корреляции г = 0,925, г = -0,324 г = 0,422, г = -0,324 г = 0,925, г = -0,324 г = 0,422, г = -0,324

Тип файла ёу± ёу+ ёу- ёу± ёу+ ёу- ёу± ёу+ ёу- ёу± ёу+ ёу-

Коэффициент вариации 62 38 46 62 43 45 40 26 35 39 22 28

55 35 37 56 37 37 35 20 24 38 26 31

Отклонение Гср от Гф 0,12 0,30 0,21 0,11 -0,01 -0,03 0,32 0,44 0,12 0,17 0,31 0,22

0,10 0,05 0,04 0,10 0,08 0,02 0,27 0,34 0,29 0,10 0,05 0,01

Доля значений в пределах от -0,5 до -0,2 0,06 0,19 0,29 0,05 0,81 0,69 0,12 0,00 0,00 0,05 0,01 0,14

0,04 0,72 0,74 0,04 0,63 0,75 0,03 0,00 0,00 0,02 0,81 0,85

Доля со знаком плюс 0,18 0,40 0,21 0,14 0,12 0,02 0,51 0,54 0,56 0,12 0,45 0,13

0,12 0,01 0,01 0,11 0,02 0,01 0,32 0,52 0,33 0,04 0,04 0,00

Данные о основных характеристиках распределений смоделированных значений частных коэффициентах корреляции приводятся в табл. 2.

Числитель в этой и последующих таблицах шах.ёу = 15, знаменатель шах.ёу = 10, шаг - шт.ёу = 0,5.

При всех способах формирования файла случайных возмущений прослеживается тенденция: при более высокой мультиколлинеарности факторов более значительное отклонение средних смоделированных значений (гср) от фактического значения коэффициента (Гф) корреляции; больше доля значений, отличающихся по знаку; меньше доля смоделированных значений, практически мало отличающихся от фактического значения. Только в двух случаях отклонения средних значений от фактических отрицательны, практически не отличающиеся от нуля. При положительных отклонениях, так как фактические значения отрицательны, средние из смоделированных значений коэффициентов корреляций по абсолютной величине меньше, т.е. наблюдается сдвиг в сторону больших значений. Особенно большие отклонения при высокой мультиколлинеарности наблюдаются, когда файл случайных возмущений формируется только из положительных или только из отрицательных величин.

Различия в смоделированных значениях (коэффициенты вариации) уменьшаются при уменьшении общей суммы отклонений по абсолютной величине (Е!ёу!) и возможных (шах.ёу) их максимальных значений. В случаи формирования файла случайных возмущений только из положительных или только из отрицательных величин коэффициенты вариации уменьшаются.

В отношении доли значений, находящихся в пределах от -0,2 до -0,5, наблюдается противоположная закономерность: увеличивается, как правило, с уменьшением мультиколлинеарности между факторами; увеличивается, почти всегда, при уменьшении максимального значения шах.ёу, особенно значительно, когда максимальная сумма колебаний (Еёу) равна 27.

Эта доля чаще всего меньше, когда файл случайных возмущений формируется как из положительных, так и из отрицательных величин. Уменьшение суммы отклонений по модулю Е!ёу! часто не приводит к ее увеличению, особенно когда шах.ёу = 15.

Уменьшение доли значений с противоположным (положительным) знаком происходит как при уменьшении мультиколлинеарности факторов так и при уменьшении максимального значения шах.ёу.

Когда файл случайных возмущений формируется только из положительных или только из отрицательных величин ёу, доля значений с противоположным знаком, особенно при высокой мультиколлинеарности, увеличивается. Уменьшение суммы отклонений по модулю Е!ёу! не приводит часто к ее уменьшению.

При высокой мультиколлинеарности факторов, как правило, значение одного из частных коэффициентов корреляции близко к нулю. Так, в нашем примере значение второго коэффициента г2ух равно 0,131, характеристики распределения его значений приводятся в табл. 3.

Таблица 3

Характеристики распределения смоделированных значений частного коэффициента корреляции (г^ = 0,131, гж = 0,925) в зависимости от способа формирования файла и величин случайных возмущений на основе абсолютны» приростов

Тип файла ёу± ёу-

Е!ёу ! 81 27 81 27 81 27

Коэффициент вариации 154 100 93 64 113 87

145 84 97 48 97 64

Отклонение гф от Гф -0,056 -0,145 -0,120 -0,215 -0,134 -0,218

-0,043 -0,111 -0,009 -0,134 -0,034 -0,158

Доля значений в пределах 0-0,3 0,523 0,420 0,524 0,160 0,479 0,775

0,544 0,545 0,770 0,404 0,711 0,643

Доля отрицательных значений 0,342 0,535 0,467 0,839 0,478 0,715

0,320 0,450 0,200 0,596 0,229 0,643

И в этом случае изменения в значениях парных коэффициентов корреляции должны компенсироваться, но по сравнению с предыдущим случаем влияние знаменателя будет несколько меньше, поскольку по абсолютной величине г2у

меньше гху.

Разница между средним значением (гф) и фактическим (Гф) отрицательна, т.е. наблюдается сдвиг влево, в сторону меньших значений.

Дисперсии не отличаются значительно от значений этого показателя в предыдущей таблице, но коэффициент вариации больше, выше и доля значений с противоположным знаком. Большее значение последнего показателя (одного из главных) свидетельствует о меньшей устойчивости второго меньшего по абсолютной величине коэффициента корреляции.

При уменьшении максимальных (шах.ёу) отклонений доля значения в пределах от 0 до 0,3 особенно значительно, когда Иёу! = 27 увеличивается. В отличие от предыдущего не наблюдается существенных различий в зависимости от способа формирования файла. Уменьшение суммы отклонений по модулю Е!ёу! часто не приводит к ее увеличению, особенно когда шах.ёу = 15.

При меньших значениях шах.ёу уменьшается доля значений с противоположным (отрицательным) знаком. Когда файл случайных возмущений формируется только из положительных или только из отрицательных величин, эта доля увеличивается. Уменьшение суммы отклонений по модулю Е!ёу! тоже не приводит часто к ее уменьшению.

Характеристики распределения смоделированных значений будут неполными без показателей, которые характеризуют форму распределения (табл. 4).

Таблица 4

Показатели формы распределения смоделированных значений частных коэффициентов корреляции на основе абсолютных приростов

Показатели Асимметрия Эксцесс

Тип файла ёу± ёу- ёу± ёу-

Е!ёу! 81

Гху.г = -0,324 гх2 = 0,925 0,085 0,1 0,199 -0,101 0,109 0,114

0,208 0,076 0,052 0,02 0,06 -0,01

%х = 0,131 гх2 = 0,925 0,104 -0,046 -0,032 -0,069 0,254 0,137

-0,086 0,042 -0,01 -0,039 0,053 -0,045

%.к = -0,324 Гхк = 0,422 0,101 0,412 0,211 -0,349 -0,103 0,018

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

0,101 0,063 0,356 -0,349 -0,095 -0,025

Е!ёу! 27

Гху.г = -0,324 гх2 = 0,925 -0,054 0,26 -0,288 -0,768 -0,136 -0,016

-0,135 0,119 0,01 -0,321 -0,226 -0,078

%х = 0,131 гх2 = 0,925 0,167 0,195 0,283 -0,719 -0,189 -0,137

0,069 -0,153 0,245 0,089 -0,037 -0,365

Гху.к = -0,324 Гхк = 0,422 -0,059 0,214 0,395 -0,395 -0,294 0,132

0,244 0,775 0,532 -0,3 0,128 0,628

Показатели асимметрии и эксцесса рассчитывались по обычным формулам.

Наблюдается слабая асимметрия, в большинстве случаев правосторонняя. Не обнаруживается закономерности в изменениях значений указанного показателя в зависимости от абсолютной суммы отклонений Е!ёу!, способов формирования файлов этих возмущений.

При высокой мультиколлинеарности (г2ух = 0,131, гх2 = 0,925) снижение максимально возможной величины отклонений с шах.ёу = 15 до шах.ёу = 10 приводит к снижению модального значения коэффициента асимметрии. В других случаях такое снижение не всегда наблюдается.

Строгой закономерности в характере изменений значений эксцесса в зависимости от способа формирования файла случайных возмущений, абсолютной суммы возмущений так же не наблюдается. Когда файл случайных возмущений формируется только из положительных или отрицательных величин, при (Е!ёу! = 27) уменьшение величины шах.ёу для отдельных возмущений часто приводит к уменьшению эксцесса по абсолютной величине.

Изменения в значениях множественного коэффициента корреляции так же связаны с изменениями парных коэффициентов корреляции, особенности влияния становятся ясными после рассмотрения формулы:

X = ГХу + Г!у _ 2гхуГгуГХ^

хгу 1 _ 2 •

Х2

Первые два слагаемых числителя (г2ху и г2гу) всегда способствуют увеличению значений множественного коэффициента корреляции, независимо от того, в каком направлении изменяются парные коэффициенты корреляции (гху и г2у), влияние третьего слагаемого числителя может быть разным. При высоком положительном значении гХ2 коэффициенты гху и г2у будут изменяться, как правило, в одном направлении - или уменьшаться, или увеличиваться. То есть значение

третьего слагаемого будет положительным, что приведет к погашению эффекта увеличения множественного коэффициента корреляции, связанного с изменениями первых двух слагаемых. При отрицательной высокой мультиколли-неарности (г^ < 0) тоже чаще третье слагаемое будет погашать эффект увеличения К^, так как изменение парных коэффициентов чаще всего будет разнонаправленным, т.е. их произведение будет отрицательным, а в целом за счет того, что Гхг < 0, слагаемое будет положительным.

В случае низкой мультиколлинеарности нельзя однозначно утверждать, какие возможные значения будет принимать третье слагаемое. Значительно реже изменения г^ и г^ будут однонаправленные, т.е. положительное значение третьего слагаемого чаще всего возможно при гх2 < 0. Маленькое значение гх2 будет снижать эффект изменения дважды - в числителе, за счет уменьшения третьего слагаемого, и наоборот, за счет увеличения в знаменателе. Высокая мульти-коллинеарность (большое значение гх2) наоборот будет увеличивать эффект, за счет увеличения третьего слагаемого и уменьшения знаменателя.

Как это повлияло на характеристики распределения смоделированных значений, видно по данным табл. 5.

Таблица 5

Характеристики распределения смоделированных значений множественных коэффициентов корреляции на основе абсолютных приростов

Тип файла ёу± ёу+ ёу- ёу± ёу+ ёу-

Коэффициенты корреляции Их2у = 0,512 Ихку = 0,512 Их2у = 0,512 Ихку = 0,572 Их2у = 0,572 Ихку = 0,572

Е!ёу 1 81

Коэффициент вариации 30 28 50 22 22 23

28 24 61 17 19 16

Отклонение гф от гф -0,129 -0,15 -0,375 -0,218 -0,178 -0,106

-0,1 -0,118 -0,076 -0,064 -0,03 0,029

Доля значений в пределах 0,4-0,7 0,612 0,545 0,004 0,399 0,29 0,688

0,682 0,632 0,645 0,775 0,801 0,907

Е!ёу ! 27

Коэффициент вариации 44 18 41 10 14 14

53 17 28 12 12 17

Отклонение гср от гф -0,336 -0,356 -0,348 -0,385 -0,282 -0,348

-0,336 -0,338 -0,326 -0,289 -0,401 -0,231

Доля значений в пределах 0,4-0,7 0,004 0,056 0 0 0,004 0,003

0,011 0,13 0 0,012 0 0,35

Особенностью распределений смоделированных значений множественного коэффициента корреляции является отсутствие отрицательных значений. Средние из смоделированных значений во всех случаях меньше фактического, при меньшем шах.ёу в большинстве случаях уменьшается дисперсия и отклонение (гср) среднего от (гф) фактического, увеличивается доля значений, находящихся в пределах от 0,4 до 0,7.

Заметно снижается коэффициент вариации, уменьшается отклонение среднего значения от фактического, когда файл случайных возмущений формируется только из отрицательных величин.

Когда сумма по модулю отклонений Е!ёу! равна 27, увеличивается отклонение (гср) среднего от (гф) фактического и значительно уменьшается доля значений в пределах от 0,4 до 0,7.

Особенности в форме распределения смоделированных значений множественных коэффициентов корреляции приводятся в табл. 6.

Таблица 6

Характеристики формы распределения множественных коэффициентов корреляции на основе абсолютных приростов (К^ = 0,512, К^ = 0,572)

Показатели Асимметрия Эксцесс

Тип файла ёу± ёу+ ёу- ёу± ёу+ ёу-

Е!ёу! 81 27 81 27 81 27 81 27 81 27 81 27

ИХ2у = 0,512 0,5 1,5 1,6 0,2 -0,1 -0,2 -0,3 -0,2 -0,2 -0,9 -0,2 -0,4

0,1 1,7 -0,2 0,8 -0,1 -0,6 -0,5 0,2 -0,1 -0,7 -0,3 0,1

Ихку = 0,572 0,2 1,6 -0,2 0,3 -0,3 -0,2 -0,7 0,2 -0,5 1,1 0,1 -0,5

-0,0 0,8 -0,1 -0,6 -0,3 -0,6 -0,4 -0,4 -0,2 -0,2 -0,3 0,1

Когда файл случайных возмущений формируется как из положительных, так и отрицательных величин, преобладает правосторонняя асимметрия, в четырех случаях их величина больше единицы. Когда файл случайных возмущений формируется только из положительных или только из отрицательных значений, преобладает левосторонняя асимметрия, она увеличивается, когда сумма абсолютных отклонений Е!ёу! равна 27, а максимальная величина отдельных отклонений не превышает 10.

Распределения смоделированных значений множественного коэффициента корреляции более пологие, преобладают отрицательные значения эксцесса. Только в трех случаях они имеют значения меньше 0,1, резко выделяется значение при Е!ёу! = 27, в случае формирования файла только из положительных значений при КХ2у = 0,572.

Рассмотрим устойчивость значений частных коэффициентов корреляции, когда файл случайных возмущений формируется из относительных крг приростов.

Таблица 7

Характеристики распределений смоделированных значений частных коэффициентов корреляций на основе относительных приростов

Е!ёу! 81 27

Коэффициенты корреляции гХ2 = 0,925, Гху.г = -0,324 гкх = 0.422, Гку.х = -0,324 г = 0,925, г = -0,324 г = 0,422, г = -0,324

Тип файла крг± крг+ крг- крг± крг+ крг- крг± крг+ крг- крг± крг+ крг-

Коэффициент вариации 53 34 38 60 37 37 40 34 39 34 35 35

35 26 29 40 28 28 50 26 29 44 28 28

Отклонение Гср от Гф 0,09 0,03 0,02 0,12 0,04 0,01 0,20 0,03 0,02 0,20 0,04 0,01

0,04 0,02 0,10 0,05 0,02 0,01 0,09 0,02 0,01 0,02 0,02 0,08

Доля значений в пределах от -0,5 до -0,2 0,52 0,77 0,72 0,49 0,74 0,74 0,31 0,78 0,69 0,26 0,77 0,77

0,75 0,88 0,83 0,71 0,87 0,87 0,54 0,88 0,84 0,69 0,84 0,87

Доля со знаком плюс 0,09 0,01 0,02 0,15 0,01 0,01 0,17 0,00 0,00 0,15 0,01 0,01

0,02 0,00 0,00 0,02 0,00 0,00 0,07 0,00 0,00 0,02 0,00 0,00

Этот способ формирования файла случайных возмущений по сравнению с предыдущим обеспечивает меньшее значение дисперсии, меньшее расхождение между фактическим и средним расчетным значением, большую долю расчетных значений, лежащих в пределах, практически мало отличающихся от фактических (от -0,2 до -0,5), меньшей долей значений с противоположным знаком.

Уменьшение абсолютной суммы отклонений, максимально возможной величины отдельных отклонений (шах.ёу) приводит к уменьшению вариации, различий между средними расчетными и фактическими значениями, к повышению доли смоделированных значений, практически мало отличающихся от фактических (от -0,2 до -0,5), к снижению доли значений с противоположным знаком. Эти закономерности проявляются четко при всех способах формирования файла случайных возмущений из относительных приростов: из положительных и отрицательных, только из положительных или только из отрицательных.

Большая устойчивость при использовании относительных отклонений наблюдается и у меньшего коэффициента корреляции.

Таблица 8

Характеристики распределения смоделированных значении частного коэффициента корреляции (тгу^ = 0,131, г^ = 0,925) в зависимости от способа формирования файла и величин случайны« возмущений на основе относигелыныгх приростов

Тип файла крг± крг+ крг-

Е!ёу 1 81 27 81 27 81 27

Коэффициент вариации 118 90 76 76 90 87

80 93 187 59 84 68

Отклонение гф от Гф -0,033 -0,062 -0,014 -0,012 -0,007 -0,019

-0,018 -0,034 -0,008 -0,009 -0,009 -0,008

Доля значений в пределах 0-0,3 0,728 0,660 0,843 0,849 0,783 0,763

0,839 0,774 0,930 0,935 0,770 0,881

Доля отрицательных значений 0,266 0,337 0,128 0,116 0,165 0,037

0,121 0,215 0,063 0,061 0,129 0,088

Большая устойчивость выражается в меньшем значении коэффициента вариации, в меньшем отклонении расчетного среднего от фактического значения, в большей доле значений, практически мало отличающихся от фактического значения, в меньшей доле значений с противоположным знаком.

Как правило, большая устойчивость наблюдается, когда файл формируется только из положительных или только из отрицательных относительных отклонений. Четко проявляется закономерность, повышение устойчивости с уменьшением возможной максимальной величины (шах.ёу) отдельных возмущений.

И при таком способе формирования файла случайных возмущений у меньшего из коэффициентов устойчивость ниже: больше коэффициент вариации для значений с противоположным знаком (табл. 9).

По сравнению с данными табл. 4 (абсолютные приросты) прослеживается тенденция более высоких значений по модулю коэффициентов асимметрии и эксцесса. Абсолютные значения этих коэффициентов уменьшаются для г = 0,131, по сравнению с г = -0,324. При более низкой мультиколлинеарности (гхк = 0,422) абсолютная величина этих коэффициентов увеличивается (табл. 10).

Таблица 9

Показатели формы распределения смоделированных значений частных коэффициентов корреляции на основе относительных приростов

Показатели Асимметрия Эксцесс

Тип файла крг± крг+ крг- крг± крг+ крг-

Шу1 81

Гху.г = -0,324 гх2 = 0,925 0,121 0,16 0,299 -0,222 -0,027 0,273

0,32 0,166 0,212 0,38 -0,096 0,231

%х = 0,131 гх2 = 0,925 0,07 -0,124 -0,028 -0,034 -0,096 0,231

-0,067 -0,15 -0,114 0,201 -0,058 0,168

Гку.х = -0,324 Гхк = 0,424 0,252 0,283 0,358 -0,172 -0,319 0,239

0,457 0,199 0,129 0,257 -0,171 0,044

Шу1 27

Гху.г = -0,324 гх2 = 0,925 0,378 0,084 0,042 -0,112 -0,222 -0,140

0,134 0,054 0,017 -0,358 -0,326 0,212

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

%х = 0,131 гх2 = 0,925 -0,329 -0,040 0,104 0,033 -0,072 -0,123

-0,068 -0,093 0,070 -0,123 -0,317 0,000

Гку.х = -0,324 Гхк = 0,424 0,067 0,509 0,395 -0,413 -0,065 0,131

0,152 0,465 0,510 -0,281 0,186 0,568

Таблица 10

Характеристики распределения смоделированных значений множественных коэффициентов корреляции на основе абсолютных приростов

Тип файла ёу± ёу-

Коэффициенты корреляции Их2у = 0,512 = 0,572 Их2у = 0,512 Ихку = 0,572 Их2у = 0,512 Ихку = 0,572

Е!ёу 1 81

Коэффициент вариации 27 17 16 10 19 14

17 10 12 6 15 15

Отклонение гф от гф -0,107 -0,104 -0,039 -0,038 -0,068 -0,06

-0,051 -0,046 -0,022 -0,021 -0,033 -0,015

Доля значений в пределах 0,4-0,7 0,502 0,763 0,796 0,992 0,687 0,873

0,743 0,986 0,913 1 0,841 0,909

Е!ёу ! 27

Коэффициент вариации 17 12 16 10 20 11

32 14 12 6 19 8

Отклонение гср от гф -0,272 -0,306 -0,037 -0,037 -0,059 -0,053

-0,125 -0,067 -0,026 -0,021 -0,033 -0,031

Доля значений в пределах 0,4-0,7 0,070 0,013 0,798 0,995 0,703 0,938

0,504 0,904 0,981 1,000 0,821 0,996

Наблюдается более высокая устойчивость по сравнению с данными табл. 5: меньше отклонение средних смоделированных значений от фактического; выше доля значений в пределах практически мало отличающихся от фактического; четче проявляется закономерность повышения устойчивости при снижении максимальной величины (шах.ёу) отклонений (табл. 11).

Таблица 11

Характеристики формы распределения множественных коэффициентов корреляции

на основе относительных приростов

Показатели Асимметрия Эксцесс

Тип файла крг± крг+ крг- крг± крг+ крг-

Ибу1 81 27 81 27 81 27 81 27 81 27 81 27

гх2 = 0,925 0,07 0,07 0,06 0,06 -0,16 0,11 -0,31 -0,48 0,64 0,04 -0,06 0

-0,04 -0,1 0,02 0,1 0,01 -0,16 -0,26 -1,00 -0,18 -0,24 0,00 -0,17

Гхк = 0,424 0,17 -0,38 -0,13 -0,19 -0,13 -0,17 0,03 -0,2 0,37 1,46 0,21 0,12

-0,32 -0,57 0,04 0,05 -0,42 -0,16 2,02 0,68 -0,22 2,43 -0,02 0,64

Когда файл случайных возмущений формируется из абсолютных отклонений, наблюдается значительно меньшая асимметрия. При низкой мультиколли-неарности факторов (гхк = 0,422) встречается высокая островершинность, показатель эксцесса больше единицы, преобладает левосторонняя асимметрия. При высокой мультиколлинеарности (гх2 = 0,925) чаще встречается значительная плосковершинность, преобладает правосторонняя асимметрия.

Переходим к рассмотрению частных коэффициентов регрессии. Изучалось распределение не самих возможных смоделированных значений (Ьсм.) коэффициентов, а их отношение к фактическим значениям (Ьсм./Ь). Распределение этих величин так же задавалось в виде интервального ряда распределения, выделялись интервалы:

Ьсм./Ь < -10; < -5; < -2; < -1; < -05; < 0; < 0,1; < 0.2; < 0.5; < 0.85; < 0.95; < 1; < 1.05; < 1.25; < 1.5; < 2; < 5; < 10; >10.

Что увеличивает и что уменьшает колеблемость частного коэффициента регрессии, становится понятным при анализе формулы:

Ь = г —^--

"хуг ' хуг I 2" * С ^1 " Ггу

Увеличение колеблемости коэффициента регрессии связано с увеличением колеблемости частного коэффициента корреляции (гху2), среднеквадратического отклонения (су).

К уменьшению приводит рост колеблемости парного коэффициента корреляции (г2у), рост колеблемости коэффициента корреляции (гх2), характеризующего связь между факторами. Учитывая более высокую колеблемость (при высокой мультиколлинеарности) меньшего из частных коэффициентов корреляции, следует ожидать, что относительная колеблемость этого частного коэффициента регрессии должна резко возрасти (табл. 12).

При всех способах формирования файла случайных возмущений относительная колеблемость у меньшего по модулю коэффициента при высокой мультиколлинеарности на порядок выше, меньше доля значений, не так значительно отличающихся от фактического, больше отличается среднее из смоделированных значений от фактического, выше доля значений с противоположным знаком.

При одинаковой примерно абсолютной величине коэффициента регрессии и при отсутствии мультиколлинеарности относительная вариация, как правило, меньше, чем у меньшего при высокой. Подобные закономерности наблюдаются и в отношении других показателей. Когда максимальная величина отдельных

Таблица 12

Характеристики распределения соотношений (Ъсм./Ъ) смоделированных (Ъсм.) частных коэффициентов регрессий к их фактическому (Ъ) значению (гж = 0,925, Ъху.2 = -2.5, Ъ2У.Х = 0.74), (г^ = 0.422, Ъку.х = -0.81)

Шу1 81 27

Коэффициенты регрессии -2,5 0,74 -0,81 -2,5 0,74 -0,81 -2,5 0,74 -0,81 -2,5 0,74 -0,81

1. Тип файла ёу± крг± ёу± крг±

1.1. Коэффициент вариации 104 3288 858 77 2052 1228 57 1673 960 57 1790 1114

87 2776 1554 42 1071 1288 49 2538 1390 32 2457 1614

1.2. % значений Ьсм./Ь в пределах 0,5-1,5 45 12 21 49 18 26 23 12 25 51 18 26

48 8 21 61 26 31 32 13 39 61 17 27

1.3. (Ьср Ь) / 1Ь1 0 4,5 -4,8 0 2,8 -4,8 -0,5 -1,5 -3 0,5 2,9 -2,7

0 4,7 -6,2 0 2,9 -5,2 0,7 0,3 -7,3 0,2 5,8 -7,8

1.4. % значений с другим знаком 7 31 16 9 21 15 61 53 13 28 34 14

14 32 11 2 12 2 32 45 4 7 29 2

2. Тип файла ёу+ крг+ ёу+ крг+

2.1. Коэффициент вариации 62 2898 2368 49 1864 790 41 2107 545 42 2958 1402

49 2594 1382 33 1733 939 30 1604 1909 32 1825 1464

2.2. % значений Ьсм./Ь в пределах 0,5-1,5 58 6 4 66 22 44 1 4 19 74 10 14

12 4 15 74 21 25 2 9 1 80 14 13

2.3. (Ьср Ь) / 1Ь1 0,8 0,4 -16 -0,2 5,9 -3,6 1,6 -11,4 0,6 -0,1 9,5 -8,5

0 13,7 -10,1 -0,2 7 -5,2 1,1 -10,2 -15,3 -0,2 10,7 -9,8

2.4. % значений с другим знаком 39,7 46,2 0,8 0,8 14,6 0,9 94,1 83,9 37,3 0,4 12 1,2

0,3 15 2 0 6,3 0,1 59,5 50,3 0,1 0 4 0,2

3. Тип файла ёу- крг- ёу- крг-

3.1. Коэффициент вариации 62 2724 2093 33 711 878 41 2164 793 41 1816 1272

43 2469 1128 29 1026 928 28 881 1809 29 1026 1286

3.2. % значений Ьсм./Ь в пределах 0,5-1,5 45,7 7,2 4,3 77 32 41 8,6 14 24,2 75 12 19

75,4 11,6 2,5 88 22 42 12 6,1 3,3 42 22 23

3.3. (Ьср Ь) / 1Ь1 0,5 0,2 -14,4 0,2 1,2 -2,7 4,6 -10,4 -3,6 -0,1 7,4 -7,2

0,0 10,3 -12,2 0,2 3,7 -3,9 0,9 -4,8 -15,2 -0,1 7,9 -7,4

3.4. % значений с другим знаком 29,2 50,0 6,1 2,0 16,5 3,8 62,3 50,8 12,6 1,5 17,4 1,2

1,1 22,9 3,9 0,4 12,5 1,0 33,0 64,3 0,4 0,4 12,9 0,5

отклонений (шах.ёу) меньше, обычно увеличивается доля значений, не особенно значительно отличающихся от фактического, меньше различий между средней и фактической величинами коэффициента, уменьшается доля смоделированных величин с противоположным знаком.

Когда файл случайных возмущений состоит только из положительных (ёу+) или только из отрицательных (ёу-) отклонений, различия между средними и фактическими значениями (Ьср - Ь) / 1Ь1 уменьшаются по сравнению, когда он состоит как из положительных, так и из отрицательных (ёу±) значений. Значительно меньше по абсолютной величине значение этого показателя при всех способах формирования файлов, когда Ь = -2,49, по сравнению с его значениями, когда коэффициенты регрессии равны соответственно 0,74 и -0,81. Положи-

тельное значение этого показателя (при Ь = -2,5) меньше единицы возможно для Ъср < 0, если больше единицы, то Ьср > 0.

Отрицательные значения больше единицы для Ь = 0,74 возможны при Ьср < 0, для Ь = -0,81 отрицательное значение возможно, когда Ьср < 0.

Уменьшается доля с противоположным знаком, повышается доля смоделированных значений, не очень значительно отличающихся от фактических.

Когда файлы формируется из относительных величин по сравнению с абсолютными, различий между смоделированными и фактическими значениями меньше, особенно когда они состоят из положительных (крг+) или только из отрицательных (крг-) значений.

Устойчивость частных коэффициентов регрессий по сравнению с парными коэффициентами, примерно одинаковыми по абсолютной величине (-2,5 и 1,6), значительно ниже [1, с. 6].

Когда файлы случайных возмущений формируются из абсолютных (ёу) величин, то распределения более островершинные, наблюдается правосторонняя асимметрия. При формировании из относительных, распределения симметричны. При формировании файлов из отрицательных абсолютных (ёу-) и отрицательных относительных (крг-) величин распределение более сжатое. Для малых значений коэффициентов распределения получаются очень пологими, особенно когда файл формируются из абсолютных величин.

Распределение свободного члена уравнения регрессии также изучалось в виде отношения смоделированных величин к их фактической величине. Выделялись такие же интервалы, как и при изучении распределений коэффициентов регрессий.

Таблица 13

Характеристики распределения смоделированных значений свободного члена уравнений регрессии У^ = 17,20 - 2,49х + 0,74z

Е1ёу1 81 27

Тип файла ёу± ёу+ ёу- крг± крг+ крг- ёу± ёу+ ёу- крг± крг+ крг-

Коэффициент вариации 462 377 380 288 175 261 216 299 307 251 124 282

388 368 345 152 180 245 260 225 230 271 66 260

% значений асм./а в пределах от 0,5 до 1,5 49,90 48,90 35,40 74,50 48,70 81,90 30,10 30,90 31,80 54,90 53,80 56,00

56,00 40,10 27,40 86,30 54,60 50,90 33,90 29,70 34,40 63,00 38,00 55,80

(аср - а) / 1а1 -0,70 -0,44 -0,27 -0,42 -0,75 -0,75 -0,99 0,57 0,99 -0,87 -1,24 -1,30

-0,73 -1,73 -1,79 -0,45 -1,05 -1,03 -0,65 -0,84 -0,11 -0,97 -1,44 -1,23

% значений с противоположным знаком 17,80 22,40 23,80 10,50 3,20 12,40 24,60 6,70 8,00 17,00 2,40 27,30

20,40 37,90 43,00 12,00 0,00 13,50 20,70 24,40 9,60 16,50 0,00 31,60

Коэффициенты вариации смоделированных значений свободного члена в линейном уравнении множественной регрессии (несмотря, что он больше) значительно превышают их значения в уравнении [1, с. 8] парной линейной регрессии. Как правило, они снижаются при уменьшении величины Е!ёу! и тах.ёу. Вариация также уменьшается в тех случаях, когда файл случайных возмущений формируется из относительных величин. Чаще коэффициенты вариации уменьшаются, если файл формируется только из абсолютных или только из отрицательных величин.

Учитывая, что фактическое значение показателя (а) положительное, отрицательное значение (аф - а) / 1а1 < -1 возможно, если аср < 0, такие значения чаще встречаются в случае формирования файла из относительных (крг) отрицательных величин.

Изменения в значениях коэффициентов регрессии и свободного члена приводят к измениям расчетных значений зависимой переменной. Для оценки этих различий используется показатель (Ухс - Ух) / Ух, где Ухс - расчетные значения У после внесения возмущений, а Ух - первоначальные расчетные. При изучении распределения этого показателя использовались интервалы:

(Ухс - Ух) / Ух < -3; < -2; < -1; < -0.8; < -0.6; < -0.4; < -0.2; < 0; < 0.2; < 0.4; < 0.6; < 0.8; < 0.85; < 0.9; < 0.95; < 1; < 2; < 3; >3.

Таблица 14

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Характеристики распределения смоделированных значений (Ухс - Ух) / Ух для уравнений (Уж = 17,2 - 2,49х + 0,74z и Ухк = 6,4 + 2,01х - 0,81к)

Уравнение У 1xz Ухк

Тип файла ёу± ёу+ ёу- крг± крг+ крг- ёу± ёу+ ёу- крг± крг+ крг-

Среднее значение Е1ёу1 - 81 -1,02 -0,71 -0,94 -1,01 -1,11 -1,27 -0,05 1,01 0,51 -0,13 -0,17 -0,28

-1,06 -0,89 -1,38 -1,03 -1,22 -1,11 -0,61 0,55 0,51 0,03 -0,07 -0,11

Е1ёу1 - 27 -1,01 -0,58 -0,69 -1,10 -1,25 -1,24 -0,82 -0,68 -0,41 -0,32 0,43 0,19

-0,91 -0,88 -0,86 -1,14 -1,31 -1,30 -0,64 0,92 0,68 0,24 0,52 0,23

% Е1ёу1 = 81 значений от -1 до +1 Е1ёу1 = 27 Е1ёу!-81 65,50 70,70 59,40 73,20 71,20 77,60 87,00 61,50 73,80 90,20 93,90 93,60

60,20 46,50 37,20 71,70 60,30 67,50 95,30 70,80 74,50 89,10 91,30 91,20

Е1ёу1 - 27 73,00 88,50 79,00 69,90 54,10 54,60 96,90 85,00 88,80 91,60 80,20 83,80

68,70 71,50 72,80 64,90 49,90 53,00 97,20 64,60 69,70 83,00 76,70 83,00

% Шу! = 81 значений от 0 до 1 Е!ёу! = 27 Е1ёу!-81 96,00 93,80 91,20 98,20 99,90 99,50 76,70 31,30 55,10 79,80 82,60 86,90

96,00 97,80 97,70 98,30 100,00 99,30 91,60 48,30 52,30 74,00 78,40 80,30

Е!ёу! - 27 96,30 85,70 88,30 98,50 99,30 99,20 96,40 91,50 83,90 85,00 54,30 66,00

96,70 95,10 92,30 98,70 99,80 100,00 91,40 38,30 47,80 65,50 56,60 64,10

Когда наблюдается тесная связь между факторами, среднее значение показателя (Ухсм. - Ух) / Ух принимает отрицательные значения, как в случае формирования файла случайных возмущений из абсолютных (ёу), так и из относительных (крг) отклонений. Особых различий при сильной мультиколлиенеарности, связанных с способами формирования файла случайных возмущений (ёу±, ёу+, ёу- и крг±, крг+, крг-), не наблюдается.

При нетесной связи между факторами чаще встречаются положительные средние значения показателя. Резко уменьшаются различия между Ухсм. и Ух, когда первоначальный файл случайных возмущений формируется из относительных величин.

Не наблюдается четкой закономерности с уменьшением сумм абсолютных отклонений (Е!ёу!) и величины возможных максимальных (ёу.тах) отклонений.

Когда связь между факторами менее тесная, возможные значения Ухс и Ух меньше различаются, доля значений, лежащих в пределах от -1 до +1, выше.

По сравнению с уравнением парной регрессии распределения и для первого, и для второго уравнения более островершинны.

Таким образом, предложенный подход моделирования при оценке устойчивости корреляционно-регрессионных связей, на наш взгляд, можно использовать как дополнение к традиционным методам оценки. Исходя из прошлого опыта, теоретических предположений, можно варьировать параметры файлов случайных возмущений. Особенно, по нашему мнению, такой подход использования корреляционно-регрессионного метода эффективен при построении моделей.

Литература

1. Авров А.П. К оценке устойчивости корреляционно-регрессионных характеристик парной прямолинейной зависимости // Экономика и статистика. Научно-информационный журнал. Астана, 2008. № 2. С. 2-14.

2. Венецкий И.Г., Венецкая В.И. Основные математико-статистические понятия и формулы в экономическом анализе. М.: Статистика, 1979. 447 с.

3. Глинский В.В., Ионин В.Г. Статистический анализ: Учебное пособие. 3-е изд., перераб. и доп. М.: ИНФРА-М; Новосибирск: Сибирское соглашение, 2002. 241 с.

4. Елисеева И.И., Юзбашев М.М. Общая теория статистики: Учебник / Под ред. И.И. Елисеевой. М.: Финансы и статистика, 2000. 480 с.

5. Ферстер Э., Ренц Б. Методы корреляционного и регрессионного анализа. М.: Финансы и статистика, 1983. 560 с.

Bibliography

1. Avrov A.P. K ocenke ustojchivosti korreljacionno-regressionnyh harakteristik parnoj prjamolinejnoj zavisimosti // Jekonomika i statistika. Nauchno-informacionnyj zhurnal. Astana, 2008. № 2. P. 2-14.

2. Veneckij I.G., Veneckaja V.I. Osnovnye matematiko-statisticheskie ponjatija i formuly v jekonomicheskom analize. M.: Statistika, 1979. 447 p.

3. Glinskij V.V., Ionin V.G. Statisticheskij analiz: Uchebnoe posobie. 3-e izd., pererab. i dop. M.: INFRA-M; Novosibirsk: Sibirskoe soglashenie, 2002. 241 p.

4. Eliseeva I.I., Juzbashev M.M. Obwaja teorija statistiki: Uchebnik / Pod red. I.I. Eliseevoj. M.: Finansy i statistika, 2000. 480 p.

5. Ferster Je., Renc B. Metody korreljacionnogo i regressionnogo analiza. M.: Finansy i statistika, 1983. 560 p.

i Надоели баннеры? Вы всегда можете отключить рекламу.