К ВОПРОСУ О ПОСЛЕДСТВИЯХ НАЛИЧИЯ И МЕТОДАХ УСТРАНЕНИЯ ГЕТЕРОСКЕДАСТИЧНОСТИ И АВТОКОРРЕЛЯЦИИ В РЕГРЕССИОННЫХ МОДЕЛЯХ*
УДК 338.27
Нина Леонидовна Тимофеева,
к.т.н., заведующий научно-исследовательской лабораторией Московского государственного университета экономики, статистики и информатики (МЭСИ) Тел.: 8 (906) 086-75-61; Эл. почта: [email protected]
Артем Игоревич Федосеев,
к.э.н., начальник отдела стратегии развития и координации научной и инновационной деятельности Московского государственного университета экономики, статистики и информатики (МЭСИ) Тел.: 8 (916) 510-48-33; Эл. почта: [email protected]
В статье излагаются методологические и методические основы построения регрессионных моделей, адекватно отражающих действительность. Основное внимание сосредоточено на методах устранения автокорреляции остатков моделей. Приводятся алгоритмы устранения гетероскедастичности и автокорреляции остатков регрессионной модели: взвешенный метод наименьших квадратов, метод Кохрана-Оркутта. Построены модели «чистой» регрессии, а также, для сравнения влияния на зависимую переменную различных объясняющих переменных, когда последние выражаются разными единицами измерения, уравнение регрессии в стандартизованной форме. Разработана схема применения методов устранения гетероскедастичности и автокорреляции для построения регрессионных моделей характерных для социально-культурной сферы.
Ключевые слова: социально-культурная сфера, регрессионные модели, эффективные управленческие решения, гетероскедастичность модели, автокорреляция остатков модели, взвешенный метод наименьших квадратов.
Nina L. Timofeeva,
PhD, Head of Research laboratory, Moscow State University of Economics, Statistics and Informatics (MESI)
Тел.: 7 (906) 086-75-61; E-mail: [email protected]
Artem I. Fedossev
PhD, Head of the Strategy Development and Coordination of research and innovation Department, Moscow State University of Economics, Statistics and Informatics (MESI)
Тел.: 8 (916) 510-48-33; E-mail: [email protected]
ON THE EFFECTS OF THE PRESENCE AND METHODS OF THE ELIMINATION HETEROSCEDASTICITY AND AUTOCORRELATION IN THE REGRESSION MODEL
The article presents the methodological and technical bases for the creation of regression models that adequately reflect reality. The focus is on methods of removing residual autocorrelation in models. Algorithms eliminating hetero-scedasticity and autocorrelation of the regression model residuals: reweighted least squares method, the method of Cochran-Orkutta are given. A model of "pure" regression is build, as well as to compare the effect on the dependent variable of the different explanatory variables when the latter are expressed in different units, a standardized form of the regression equation. The scheme of abatement techniques of heteroskedasticity and autocorrelation for the creation of regression models specific to the social and cultural sphere is developed.
Keywords: social and cultural sphere, regression models, effective management decisions, heteroscedasticity model, autocorrelation model, the reweighted least squares method.
1. Введение
Социально-культурная сфера является одной из ключевых сфер жизнедеятельности человека. Процессы, происходящие в этой сфере, напрямую связаны с процессами реформирования экономики. Одним из значительных факторов развития социально-культурной сферы является банковская деятельность. Изучение банковской деятельности с помощью экономико-математических методов и моделей, позволяет давать максимально адекватную оценку экономическим тенденциям, которые в свою очередь оказывают значительное влияние на всю социально-культурную сферу. Искусство принятия эффективных управленческих и инвестиционно-финансовых решений, прогнозирование последствий принятия тех или иных экономических решений во многом зависит от качественно построенных регрессионных моделей по различным видам деятельности, в том числе банковской.
Для того чтобы модели регрессионного анализа давали наилучшие из всех возможных результатов, на исходные данные модели накладывается ряд условий, называемых предпосылками регрессионного анализа. Если зависимая переменная, ошибки и объясняющие переменные регрессионной модели удовлетворяют предпосылкам регрессионного анализа, то выборочные оценки параметров модели соответствуют ряду требований, а именно, несмещенности, эффективности и состоятельности. При нарушении предпосылок регрессионного анализа в модели могут возникнуть такие явления, как мультиколлинеарность, гетероскедастич-ность или автокорреляция. Что может привести к тому, что параметры регрессионной модели потеряют экономический смысл, оценки параметров уравнения регрессии, полученные методом наименьших квадратов, станут не эффективными, случайные ошибки в регрессионной модели окажутся зависимыми.
Таким образом, для того, чтобы регрессионную модель можно было бы считать адекватно отражающую действительность, и на основе этой модели строить различные аналитические прогнозы, одним из наиболее важных аспектов при построении регрессионных моделей является проверка модели на наличие мультиколлинеарности, гетероскедастичности и автокорреляции, а также устранения последних.
2. Построение регрессионных моделей
по статистически значимым факторным признакам
При работе над проектами РГНФ «Управление инвестиционным потенциалом коммерческого банка» и «Методология формирования кадрового потенциала социально-культурной сферы» (Номера проектов: №12-02-00398; №13-02-00110) были построены регрессионные модели инвестиционных ресурсов и модели кредитной активности четырех кредитных организаций (ОАО КБ «Зенит», ОАО КБ «Восточный экспресс», ООО КБ «Роспромбанк», ЗАО КБ «ЭкспрессВолга»), представляющих различные группы кредитных институтов, как по величине активов, так и по территориальному размещению.
В качестве факторов, влияющих на инвестиционные ресурсы банка Yинв, были выбраны: Х1 - величина активов банка (тыс. руб.), Х2 -ставка резервирования (%), Х3 - ставка отчислений в агентство по страхованию вкладов АСВ (%), Х4 - инфляция в месяц (%), Х5 - ставка процента по депозиту сроком от 1 года до 3 лет (%), Х6 - ставка процента по депозиту сроком свыше 3 лет (%), Х7 - межбанковская ставка привлечения MIACR (%), Х8 - среднедушевые доходы населения (млрд. руб.),
* Исследование выполнено при финансовой поддержке РГНФ в рамках проектов проведения научных исследований («Управление инвестиционным потенциалом коммерческого банка» и «Методология формирования кадрового потенциала социально-культурной сферы»), проекты № 12-02-00398 и № 13-02-00110.
Таблица 1
Корреляционная матрица кредитной активности ЗАО КБ «ЭкспрессВолга»
Укред Х1 Х2 Х3 Х4 Х5 Х6 Х7 Х8
Укред 1,00 0,30 0,77 0,61 -0,65 0,10 0,82 -0,95 -0,44
Х1 0,30 1,00 0,29 0,21 -0,44 0,25 0,30 -0,35 -0,21
Х2 0,77 0,29 1,00 0,60 -0,48 0,19 0,94 -0,65 -0,31
Х3 0,61 0,21 0,60 1,00 -0,64 -0,38 0,75 -0,68 -0,87
Х4 -0,65 -0,44 -0,48 -0,64 1,00 0,12 -0,59 0,75 0,64
Х5 0,10 0,25 0,19 -0,38 0,12 1,00 0,06 0,00 0,51
Х6 0,82 0,30 0,94 0,75 -0,59 0,06 1,00 -0,75 -0,48
Х7 -0,95 -0,35 -0,65 -0,68 0,75 0,00 -0,75 1,00 0,63
Х8 -0,44 -0,21 -0,31 -0,87 0,64 0,51 -0,48 0,63 1,00
Х9 - количество филиалов банка (шт.), Х10 - ставка рефинансирования (%). А в качестве факторов, влияющих на кредитную активность Yкред: XI -инфляция в месяц (%), Х2 - ставка процента по кредиту сроком от 1 года до 3 лет (%), Х3 - ставка процента по кредиту сроком свыше 3 лет (%), Х4 - среднедушевые доходы населения (млрд. руб.), Х5 - количество филиалов банка (шт.), Х6 - ставка рефинансирования (%), Х7 - просроченная задолженность (тыс. руб.), Х8 - кредитный портфель (тыс. руб.), Х9 -рентабельность активов нетто (%.).
Проверим наличие корреляции по всем факторам, первоначально включенным в модели. В таблице 1 представлены данные корреляционной матрицы кредитной активности ЗАО КБ «ЭкспрессВолга».
В качестве факторов, вошедших в регрессионные уравнения, выбраны не только значимые по /-критерию
Стьюдента, но и те, коэффициент корреляции между которыми не превышает 0,3, т.е. не коррелируемые. Из этого следует, что в регрессионных моделях, представленных в проекте, мультиколлинеарность устранена.
Полученные на этом этапе регрессионные модели, представлены в таблицах 2, 3.
Так как мультиколлинеарность удалось устранить наиболее простым методом - методом исключения, то построение «ридж-регрессии» или гребневой регрессии не потребовалось.
Все модели были проверены на наличие гетероскедастичности. В тех моделях, где гетероскедастичность была выявлена, для ее устранения был применен взвешенный метод наименьших квадратов. При применении взвешенного метода наименьших квадратов каждое наблюдение как бы «взвешивается» с помощью коэффициента 1/от, где оi - дисперсии ошибок,
но если значения от неизвестны, как в нашем случае, то, сначала находим оценку вектора параметров обычным методом наименьших квадратов. Затем находим регрессию квадратов остатков на квадратичные функции объясняющих переменных, т.е. уравнение
е2г =/Х + Щ, I = 1, ..., п, где/(х) - квадратичная функция. Далее по полученному уравнению рассчитываем теоретические значения ё} и определяем набор весов а. . Затем вводим новые переменные У, = У/о,, X* ^ = Х^оь} = 1,...,т и находим уравнение У* =X Ь *. Полученная оценка и есть оценка взвешенного метода наименьших квадратов. Для новой модели дисперсия остатков равна единице, т.е. она постоянна и поэтому, в силу построения, модель гомоскедастична.
3. Исследование регрессионной
модели на примере
ЗАО КБ «ЭкспрессВолга»
Было построено регрессионное уравнение Yкред от всех рассматриваемых факторов. Из полученных результатов можно заключить, что модель адекватна на 97,8%, т.к. коэффициент детерминации R2 = 0,978, модель значима ^расч = 220 > Fтабл = 2,1). Приведём полученное уравнение модели:
Yкред = -0,45 - 0,001*Х1 + 0,01*Х2 +
(-0,15) (1,72)
+ 0,02*Х3 + 0,000001*Х4 - 0,01*Х5 + (3,05) (1.09) (-1.16)
+ 0,0001*Х6 - 0,0000003*Х7 + (0,02) (-22,33)
+ 0,00000003*Х8 - 0,002*Х9 + е (6,73) (-1,24)
Таблица 2
Модели для исследования инвестиционных ресурсов банков
№ п/п Банк Регрессионные уравнения, представляющие модели инвестиционных ресурсов банков Адекватность
1 ОАО КБ «Зенит» Уинв = 155224569 + 4636704*Х2 - 698916511*Х3 + 3529868*Х4 + + 610*Х8 - 3830321*Х9 + е 91,8%
2 ОАО КБ «Восточный экспресс» Уинв = -1763365 + 0,38*Х1 + 108323694*Х3 - 6374083*Х5 + 5701568*Х6 + 5244751*Х7 - 4457973*Х10 + е 98,2%
3 ООО КБ «Роспромбанк» Уинв = 1211115 + 0,09*Х1 + 816241*Х6 - 659305*Х9 + е 56,4%
4 ЗАО КБ «ЭкспрессВолга» Уинв = 5271019 + 0,68*Х1 + 1801023*Х5 - 1364758*Х6 + 1316353*Х9 -- 1163129*Х10 + е 99,5%
Таблица 3.
Модели для исследования кредитной активности банков
№ п/п Банк Регрессионные уравнения, представляющие модели кредитной активности банков Адекватность
1 ОАО КБ «Зенит» Укред = -1,18 + 0,01*Х1 + 0,03*Х2 + 0,02*Х3 + 0,000000004*Х8 + е 86,5%
2 ОАО КБ «Восточный экспресс» Укред = 0,95 - 0,03*Х5 - 0,000000002*Х8 + 0,01*Х9 + е 67,1%
3 ООО КБ «Роспромбанк» Укред = 0,57 - 0,05*Х1 + 0,04*Х2 - 0,04*Х3 - 0,0000001*Х7 -- 0,00000004*Х8 - 0,01*Х9 + е 59%
4 ЗАО КБ «ЭкспрессВолга» Укред = -0,49 + 0,01*Х2 + 0,02*Х3 - 0,0000003*Х7 + 0,00000003*Х8 + е 97,4%
В скобках указаны значения /-статистика для коэффициентов регрессии.
Так при уровне значимости а = 0,1 значимыми оказались коэффициенты при Х2, Х3, Х7 и Х8, остальные факторы должны быть исключены из дальнейшего рассмотрения.
Перед построением модели регрессии от всех значимых факторов необходимо построить корреляционную матрицу и оценить их взаимосвязь.
Построим уравнение регрессии от всех статистически значимых факторов. Полученная модель адекватна на 97,4%, и значима, все входящие в модель факторы значимы при а = 0,05. В качестве факторов, вошедших в регрессионные уравнения, выбраны не только значимые по /-критерию Стьюдента, но и те, коэффициент корреляции между которыми не превышает 0,3, т.е. не коррелируемые, что свидетельствует об отсутствии в модели мультиколлинеарности. Уравнение модели:
Yкред = -0,49 + 0,01*Х2 + 0,02*Х3 -
(2,63) (3,88) 0,0000003*Х7 + 0,00000003*Х8+ е.
(-25,08) (6,86)
В скобках указаны значения /-статистика для коэффициентов регрессии.
После построения уравнения регрессии и проверки на адекватность и значимость, следует провести проверку остатков модели на наличие автокорреляции. В связи с тем, что наличие автокорреляции между остатками модели может привести к негативным результатам всего процесса оценивания неизвестных параметров модели, автокорреляция остатков должна быть устранена.
Воспользуемся для определения наличия автокорреляции критерием Дар-бина-Уотсона, критериальное расчётное значение составило dрасч = 1,08. По таблице Дарбина-Уотсона находим пороговые значения (1н и (1в. При длине реализации п = 53 и числе факторов т = 4, имеем (н = 1,41, (в = 1,72. Так как расчетное значение попадает в интервал 0 < (расч < (1н, то в соответствии с критерием Дарбина-Уотсона имеем наличие положительной автокорреляции (рис. 1).
Но прежде чем устранять автокорреляцию, необходимо провести проверку на наличие гетероскедас-тичности. В соответствии со схемой теста Голдфельда-Кванда, упорядочивание было проведено по фактору Х2. Получили (расч = 4,59 > (табл = 2,48,
что свидетельствует о наличии гетерос-кедастичности. Для ее устранения был применен взвешенный метод наименьших квадратов.
Следует проверить уравнение регрессии, полученное после устранения гетероскедастичности, на наличие автокорреляции остатков по критерию Дар-бина-Уотсона. Получили (расч = 0,75, т.е. 0 < (расч < (н, что свидетельствует о наличии положительной автокорреляции. К сожалению, применение взвешенного метода наименьших квадратов не позволило устранить автокорреляцию.
Т.к. в процессе исследования была выявлена автокорреляция между соседними уровнями, то для ее устранения была построена авторегрессионная схема первого порядка. По рекуррентной формуле получаем преобразованную модель регрессии, учитывающую процесс автокоррляции первого порядка:
У, -рУг-1 = ДД1 ~Р) + Х в ( X -PX¡t-1)+Vt,
¿=1
где выборочный коэффициент остатков первого порядка рассчитывается по формуле:
Е <
р=-
Е <
а первые наблюдения вычисляем с помощью поправки Прайса-Уинстена:
Ух
= \11 -ррУх;х =\1х~
Используя вышеприведённые преобразования получены новые исходные данные по методу Кохрана-
Оркутта, позволяющему устранять автокорреляцию первого порядка.
Проверим на наличие автокорреляции используя тест Дарбина-Уотсона, получаем dрасч = 1,45. Попадаем в интервал (н < (расч < (в, в соответствии с критерием Дарбина-Уотсона - это зона неопределенности. Для ответа на вопрос о наличии автокорреляции надо применять другой критерий, например, критерий Бреуша-Годфри. В соответствии со схемой теста Бреуша-Годфри построено лаговое уравнение регрессии остатков от четырех предыдущих уровней:
вг = -0,0006 + 0,2ег-1 + 0,2ег--2 -(1,37) (1,15) - 0,06ег-3 - 0,04в,_4 + и.
(-0,38) (-0,26)
В скобках указаны значения /-статистика для коэффициентов регрессии.
Из представленных результатов видно, что модель статистически не значима ^2 = 0,08; Fрасч = 1,02 < < Fтабл = 1,9), и не имеет ни одного значимого коэффициента, что в свою очередь означает, что в построенной авторегрессионной модели первого порядка, автокорреляция отсутствует (рис. 2) и коэффициенты модели, отвечают требованиям несмещенности, эффективности и состоятельности.
Уравнение регрессионной модели кредитной активности ЗАО КБ «Экс-прессВолга», получившиеся после устранения гетороскедастичности и автокорреляции3:
Yкред = -0,22 + 0,01*Х2 + 0,008*Х3 -
(2,89) (2,42)
- 0,0000003*Х7 + 0,00000002*Х8 + е.
(-23,36) (6,76)
Рис. 1. Распределение остатков модели, с характерным наличием положительной
автокорреляции
II-1
I=2
2
I=1
Рис. 2. Распределение остатков модели, автокорреляция отсутствует.
В скобках указаны значения /-статистика для коэффициентов регрессии.
4. Построение уравнение регрессии кредитной активности ЗАО КБ «ЭкспрессВолга» в стандартизованной форме
Так как факторы, которые входят в систему показателей имеют различные единицы измерения, то для того, чтобы сравнивать их влияние на зависимую переменную, необходимо использовать стандартизованные коэффициенты регрессии в (/' =1, 2, ..., п).
Уравнение регрессии в стандартизованной форме:
/у = в • /х1 + в2 • /х2 + вп ■ X + е,
гДе ty
У - У
- стандартизо-
ванные переменные.
Сравнивая стандартизованные коэффициенты друг с другом, можно ранжировать факторы по силе их воздействия на результат. Наибольшее влияние оказывает фактор с наибольшим коэффициентом, взятым по модулю. Стандартизованные коэффициенты показывают, на сколько сигм изменится в среднем результат, если соответствующий фактор X изменится на одну сигму при неизменном среднем уровне других факторов.
Уравнение регрессионной модели кредитной активности ЗАО КБ «Экс-
прессВолга», полученное в стандартизованной форме:
tYкред = 0,11*tX2 + 0,27*tX3 -
(2,98) (2,52)
- 0,97*tX7 + 0,43*tX8 + e. (-26,03) (7,13)
В скобках указаны значения t-ста-тистика для коэффициентов регрессии.
5. Заключение
Приведённая методика позволяет с большой степенью достоверности устранять гетероскедастичность и автокрреляцию в регрессионных моделях характерных для социально-культурной сферы, в таких её аспектах как: торговля и туризм, банковская деятельность и финансы, наука и образование, культура и спорт, и т.д. При этом полученные модели будут способны адекватно отражать действительность.
Литература
1. Кремер Н.Ш., Путко Б.А. Эконометрика. Учебник. М.: ЮНИТИ, 2008.
2. Шелобаев С.И. Экономико-математические методы и модели. Учебное пособие для вузов. Издание 2. М: ЮНИТИ-ДАНА, 2005.
References
1. Kremer N.S., Putko B.A. Econometrics. Textbook. Moscow: UNITY 2008.
2. Shelobaev S.I. Economic and mathematical methods and models. Textbook for high schools. Edition 2. M: UNITY-DANA, 2005.
x. —x