Тестирование спецификаций
Одной из важных задач эконометрики является тестирование валидности экономической теории на основе наблюдаемых данных. Любая теория, если она является верифицируемой, предполагает некие ограничения на взаимосвязь наблюдаемых данных. Задача тестирования зачастую может быть сформулирована как проверка того, являются ли ограничения, накладываемые тестируемой моделью, совместимыми с данными.
Джерри Хаусман в своей статье, перевод которой приводится ниже, предложил элегантный и достаточно общий подход к тестированию спецификаций. Основополагающей здесь является идея о том, что любые дополнительные ограничения, если они справедливы, позволяют улучшить оценки неизвестных параметров, а именно, сделать их более эффективными; а если эти дополнительные ограничения неверны, то они ведут к несостоятельным оценкам. Эта дихотомия между эффективностью и робастностью оценки, полученной при накладываемых теорией ограничениях, и позволяет провести тестирование. Дж. Хаусман основывает тест на сравнении оценки, полученной при предположении справедливости теории, с альтернативной оценкой, которая не использует тестируемую теорию и всегда справедлива. В статье есть несколько примеров применения данного подхода, один из которых — тестирование экзогенности на основе сравнения оценки наименьших квадратов с оценкой, использующей инструментальные переменные. Основным достоинством предложенного подхода является его универсальность и широкая применимость для огромного числа различных ситуаций, что признано специалистами и отражено в огромном индексе цитируемости данной статьи (согласно Google Scholar, число цитат перевалило за 10 тыс.).
Джерри Хаусман (Jerry Hausman), 1946 года рождения, профессор экономики Масса-чусетского технологического института (MIT), известен своими работами в области микроэконометрики. Джерри Хаусман получил свою докторскую степень (PhD) в Оксфорде. В 1985 году он был награжден медалью Кларка (John Bates Clark Medal), которая является второй по престижности наградой (после Нобелевской премии) в области экономики и присуждается Американской Экономической Ассоциацией за выдающийся вклад в экономическую науку ученому моложе 40 лет.
А. Е. Микушева
Specification tests in econometrics
Jerry A. Hausman
Тесты на спецификацию в эконометрике1
Дж. А. Хаусман2
В данной работе представлены тесты на спецификацию, разработанные для нескольких типов эконометрических моделей. Основная идея, использующаяся для создания тестов, заключается в том, что в случае верной спецификации модели асимптотически эффективная оценка имеет нулевую асимптотическую ковариацию с разностью этой оценки и другой, являющейся состоятельной, но асимптотически неэффективной. В работе также рассчитывается локальная мощность теста для небольших отклонений от нулевой гипотезы об отсутствии ошибок спецификации. Наряду с тестами для моделей панельных данных и систем одновременных уравнений, в работе представлен тест для модели с инструментальными переменными. Эмпирический пример, посвященный оцениванию часто используемого в эконометрике уравнения индивидуальной заработной платы, демонстрирует, что существуют ненаблюдаемые индивидуальные факторы, неортогональные к используемым регрессорам.
Ключевые слова: тесты на спецификацию; тест Хаусмана; инструментальные переменные; панельные данные; одновременные уравнения. JEL classification: B23; C01; C18; C26; C50; C52.
(Примечание. JEL classification и ключевые слова добавлены переводчиком).
1. введение
Тесты на ошибки спецификации модели образуют одну из наиболее важных областей исследований в эконометрике. В случае стандартной регрессионной модели y = Xb + e существуют два стохастических условия на спецификацию. Во-первых, условное математическое ожидание e относительно X должно быть равно нулю (или e имеет
1 Оригинальная статья: Hausman J. A. (1978). Specification tests in econometrics. Econometrica, 46 (6), 12511271. © Econometric Society.
The copyright to this article is held by the Econometric Society, http://www.econometricsociety.org/. It may be downloaded, printed and reproduced only for personal or classroom use. Absolutely no downloading or copying may be done for, or on behalf of, any for-profit commercial firm or for other commercial purpose without the explicit permission of the Econometric Society. For this purpose, contact the Editorial Office of the Econometric Society at [email protected].
Редакция благодарит Econometric Society за разрешение на публикацию перевода статьи.
Перевод статьи выполнен студенткой НИУ ВШЭ А. Кузнецовой, под редакцией А. Д. Сластникова и А. Е. Ми-кушевой.
2 Я хотел бы поблагодарить T. Amemiya, D. W. Carlton, G. Chamberlain, G. Chow, F. M. Fisher, Z. Griliches, R. H. Gordon, R. E. Hall, T. J. Rothenberg, H. L. White и A. Zellner за плодотворные дискуссии. A. S. Kelso и E. R. Rosenthal оказали значительную помощь в проведении исследования. Национальный научный фонд также оказал поддержку исследованию. Редактор и рецензент журнала Econometrica предоставили очень ценные комментарии. Взгляды, изложенные в этой статье, принадлежат автору и не отражают взглядов Департамента экономики Массачусетского технологического института или Национального научного фонда.
нулевое математическое ожидание для фиксированного X); и, во-вторых, e имеет сфериче- *
§
скую ковариационную матрицу:
1 S
E(e | X) = 0 или для больших выборок plim—X 'e = 0, (1.1а)
V(e | X) = s2I. (1.1b) ^
Нарушение первого предположения, которое иногда называют предположением об ортогональности, ведет к смещенным оценкам, в то время как нарушение второго, иногда называемого предположением о сферичности, приводит к потере эффективности, хотя несмещенность оценок сохраняется. Несмотря на то что во многих задачах сложнее обнаружить нарушение предположения (1.1а), чем нарушение (1.1b), внимание в эконометрической литературе в основном обращено на разработку тестов для второго предположения. Работы Ramsey (1974) и Wu (1973) находятся в числе немногих, посвященных тестам спецификации. Тем не менее, проблема является настолько важной, что ей стоит уделить повышенное внимание, особенно учитывая то, что эффективные оценки в предположениях (1.1а) - (1.1b) могут быть получены почти во всех ситуациях, и они часто очень чувствительны к нарушению первого предположения.
В этой статье предложена общая форма теста на спецификацию, которая позволяет эффективно проверить выполнение предположения (1.1а) и дает общий подход к созданию тестов на ошибки спецификации. Таким образом, нет необходимости разрабатывать специальный тест для каждой конкретной ситуации, поскольку представленная здесь общая схема может быть применена для нужной модели. Основной проблемой для создания тестов на спецификацию является отсутствие точных формулировок альтернативных гипотез. Отметим, что во многих случаях, включающих модели панельных данных, модели с ошибками измерений и проблему одновременности, альтернативная гипотеза о нарушении предположения (1.1а) может быть проверена с помощью расширенной регрессионной модели. Основная идея заключается в существовании альтернативной оценки, которая состоятельна и при нулевой, и при альтернативной гипотезах. Сравнивая такие оценки с эффективными оценками (в предположении (1.1а)) и замечая, что их разность не коррелирует с эффективной оценкой при нулевой гипотезе, можно получить простой тест из регрессии
y = Xb + Xa + v, (1.2)
где X — подходящим образом преобразованная X. В таком случае тестирование заключается в том, чтобы проверить гипотезу H0: a = 0. Кроме того, рассматривается вопрос локальной мощности критерия и выводится распределение функции мощности при альтернативной гипотезе.
Во втором разделе приводится доказательство основной леммы, относящейся к тестам на спецификацию описанного вида. Рассматривается применение теста для моделей с ошибками измерений, в результате чего выводится уравнение (1.2). Следующие два раздела посвящены обсуждению двух новых тестов на спецификацию для модели панельных данных и модели одновременных уравнений. Эти два теста всегда доступны (в отличие от теста для моделей с ошибками измерений, где необходимо наличие инструментальных переменных), и их следует использовать для двух указанных выше важных моделей. В конце приводится
пример, представляющий интерес, поскольку часто используемая при работе с панельными данными модель со случайными эффектами оказывается несостоятельной при альтернативной спецификации. Основной подход, предлагаемый в этой статье, может быть применен и к другим, не рассмотренным здесь проблемам. Тем самым, предложенные тесты были бы полезны для прикладных эконометристов.
2. Теория и тест для модели с ошибками измерений
Теория, лежащая в основе предложенных тестов на спецификацию, опирается на одну фундаментальную идею. При справедливости нулевой гипотезы об отсутствии ошибок спецификации будет существовать состоятельная, асимптотически нормальная и асимптотически эффективная оценка, где эффективность означает достижение асимптотической границы Крамера-Рао3. При альтернативной гипотезе об ошибочной спецификации модели эта оценка будет уже смещенной и несостоятельной. Для построения теста на ошибку спецификации необходимо найти другой способ оценивания, на котором не будет неблагоприятно сказываться ошибка спецификации; но такая оценка уже не будет асимптотически эффективной для нулевой гипотезы. Использование разности двух оценок q = b1 — j30, где b0 — эффективная оценка при гипотезе H0, a bi — состоятельная оценка при гипотезе Иг, приводит тогда к тесту спецификации. Если модель определена правильно, то величина q будет сходиться по вероятности к нулю. В случае ошибки спецификации величина plim q отличается от нуля и, если мощность теста высока, абсолютное значение величины q будет большим по отношению к ее асимптотической стандартной ошибке. Эта процедура будет давать мощные тесты в важных случаях, поскольку ошибки спецификации, вероятно, имеют серьезные последствия только в том случае, когда две оценки существенно отличаются.
При построении тестов, основанных на использовании q, возникает следующая проблема. Необходимо определить не только предел (по вероятности) q, но также и ковариационную матрицу V(q) асимптотического распределения <Jtq. Поскольку b0 и Д используют одни и те же данные, они будут коррелировать друг с другом, что может затруднить вычисление ковариационной матрицы VTq . К счастью, эта проблема легко разрешима, поскольку на самом деле V(q) = V( b1) — V( b 0) = V — V0 при нулевой гипотезе отсутствия ошибок спецификации. Таким образом, процесс создания тестов на спецификацию упрощается, т. к. оценки могут рассматриваться отдельно, ввиду того что матрица ковариаций разности 4rq = >/T( b 1 — b 0) равна разности соответствующих матриц ковариаций. Несмотря на простое интуитивное объяснение этого результата, он редко используется при создании эконометрических тестов. Идея опирается на тот факт, что эффективная оценка b 0 должна иметь асимптотически нулевую матрицу ковариаций с q при нулевой гипотезе для любых
3 В данной статье внимание акцентируется на случаях больших выборок, т. к. в каждом тесте хотя бы одна оценка имеет нормальное распределение только асимптотически. Большинство эконометрических оценок, за исключением полученных методом наименьших квадратов, обладают этим свойством. Обсуждение понятия асимптотической эффективности может быть найдено в (Rothenberg, 1973, Ch. 2). В дальнейшем эффективность и смещенность будет пониматься в асимптотическом смысле, а матрица ковариаций — как матрица ковариаций асимптотического распределения. Аналогичные результаты для конечных выборок справедливы при некоторых дополнительных условиях.
других состоятельных, асимптотически нормальных оценок Д. Если бы это было не так, то, | взяв линейную комбинацию b0 и q, можно было бы получить состоятельную оценку b*, которая имела бы меньшую асимптотическую матрицу ковариаций, чем b 0, которая пред- * полагалась асимптотически эффективной. Для формализации этого результата воспользу- ^ емся следующей леммой. 4
Лемма 2.1. Рассмотрим две оценки b0, bi, обе состоятельные и асимптотически нормально распределенные, причем b0 достигает асимптотической границы Крамера-Рао, т. е. yff (b0 — b)~N(0,V0) и Vf(Д-b)~N(0,Vj), где V0 — матрица, обратная к информационной матрице Фишера. Пусть q = b —b0. Тогда предельные распределения
л/t (b0 —b) и -JTiq имеют нулевую ковариационную матрицу, т. е. Cov(b0, q) = 0 — нулевая матрица4'5.
Доказательство. Пусть b0 и q не являются ортогональными. Поскольку plim q = 0, определим новую оценку как b2 = b0 + rAq , где r — число, а A — произвольная матрица (подлежащая выбору). Новая оценка является состоятельной и асимптотически нормальной с асимптотической матрицей ковариаций
V(b2) = V(b0) + rACov(b0,q) + rCov'(b0,q)A + r2AV(q)A'. (2.2)
Теперь рассмотрим разность между асимптотическими матрицами ковариаций новой оценки и старой асимптотически эффективной оценки
F(r) = V(b2) — V(b0) = rAC + rCA + r2AV(q)A'. (2.3)
Беря производную по r, получим
F'(r) = AC + CA + 2rAV(q) A'. (2.4)
Затем выберем A = —C' и заметим, что матрица C симметрична, что приводит к соотношению
F' (r) = —2C C + 2rC V(q)C. (2.5)
Поэтому при r = 0, F'(0) = —2C 'C< 0 в смысле неположительной определенности. Но F(0) = 0, поэтому, если значение r мало, то F(r) < 0, и, если не выполнено соотношение C = Cov( b 0, q) = 0, возникает противоречие, т. к. из асимптотической эффективности b0 вытекает F(r) > 0 .
4 Для того чтобы исключить суперэффективность, требуется, помимо состоятельности и асимптотической нормальности, также и наличие равномерной сходимости. Однако несложно показать, что стандартные экономе-трические оценки сходятся равномерно. Достаточным условием, которое приводит к прямому доказательству, является компактность пространства параметров. T. Amemiya и T. Rothenberg помогли в разрешении этого вопроса.
5 Утверждение этой леммы для случая конечной выборки и одного параметра содержится в статье (Fisher, 1925), ссылка на которую получена от W. Taylor. Это, очевидно, связано с асимптотической версией теоремы Рао-Блекуэлла (Rao, 1973).
Поскольку уже было показано, что эффективная оценка является некоррелированной с q, легко подсчитать асимптотическую ковариационную матрицу q.
Следствие 2.6. V(q) = V(b1) — V(b0) > 0 в смысле неотрицательной определенности.
Доказательство. Так как q + b0 = b 1, то V(q) + V(b0) = V(b 1). Кроме того, b0 достигает асимптотической границы Крамера-Рао. С использованием результата, представленного выше, общий тест на ошибки спецификации может быть получен с помощью статистики
m = Tq'V(q)—1 q , (2.7)*
где V (q) — состоятельная оценка для V(q). Будет показано, что эта статистика при нулевой гипотезе (об отсутствии ошибок спецификации) асимптотически имеет распределение %K , где K—число неизвестных параметров в b. Ввиду того что иногда проще работать с q, чем с y/Tq , обозначим M0 = (1/T)V0, M1 = (1/T)V1 и M(q) = (1/T)V(q). С использованием введенных обозначений, статистика может быть представлена как m = q'M (q)—1 q.
Статистика m в уравнении (2.7) определяет распределение разности двух оценок, когда отсутствуют ошибки спецификации. Другой важной характеристикой теста является его мощность. К сожалению, вопрос мощности не получил большого распространения в эконометрике, возможно, из-за неопределенности альтернативной гипотезы или сложности вывода распределения функции мощности. Мощность полученного выше теста на спецификацию зависит от распределения статистики в уравнении (2.7), когда нулевая гипотеза неверна. Будет показано, что в большинстве приложений мощность может быть приближенно оценена в больших выборках для близких к нулевой гипотезе альтернатив с помощью нецентрального % -распределения с параметром нецентральности
d2 = qM(q)—1 q, (2.8)
где q = plim( b 1 — b 0) — предел (по вероятности) разности двух оценок6.
Мощность критерия — важный показатель, поскольку он дает вероятность того, что нулевая гипотеза отвергается, когда она неверна. Во многих эмпирических исследованиях b 0
и /b1 кажутся далекими друг от друга, однако нулевая гипотеза о том, что q = 0, не отвергается. Если для достаточно большой, чтобы быть существенной, разности (например qA) вероятность отвержения гипотезы мала, то такой тест не дает много информации. Вывести распределение статистики теста при альтернативной гипотезе — сложная задача, особенно учитывая широкий диапазон рассматриваемых здесь альтернативных гипотез. Поэтому будем выводить лишь асимптотические распределения функций мощности для последовательности моделей при таких локальных условиях, где последовательность альтернатив q
имеет порядок а/у[Т и a — постоянный вектор. С помощью такого подхода могут быть ис-
6 Последующее обсуждение вопроса локальной мощности возникло благодаря исключительно полезному руководству T. J. Rothenberg. Хорошей ссылкой является работа (Cox, Hinkley, 1974, Ch. 9).
* В оригинальном тексте формула (2.6) отсутствует — Прим. редактора.
w
/ 0 On
w
(2.10)
следованы только альтернативы, близкие к нулевой гипотезе, но, скорее всего, полученные t результаты помогут пролить свет на более широкий набор случаев. Необходимость этого Ц ограничения может быть наилучшим образом продемонстрирована с помощью простого примера. Рассмотрим треугольную систему двух уравнений:
4
у = Xi g + u 1, (2.9а)
У2 =ЬУ1 + u2. (2.9b)
Если u1 и u2 имеют нулевую ковариацию, то метод наименьших квадратов для уравнения (2.9b) дает (асимптотически) эффективную оценку для b, в то время как для ненулевой ко-вариации оценка несостоятельна. В этом случае к получению состоятельной оценки приведет использование инструментальной переменной (скажем, применение двухшагового метода наименьших квадратов). Использование тестовой статистики m из уравнения (2.7) асимптотически эквивалентно проверке того, что о12 = 0, где оцениваемая ковариация получается из остатков после применения двухшагового метода наименьших квадратов (2SLS) для уравнения (2.9b), u2, и остатков от оценивания методом наименьших квадратов уравнения (2.9а), u . При альтернативной гипотезе предположим, что настоящая ковариация
равна о12, и надо построить тест, опирающийся на тот факт, что у/Г(S12 — о12)~N(0,v12).
Возьмем v12 — состоятельную оценку для v12, обозначим v12 = w и v12 = w . Как правило,
тесты могут быть получены из статистики у/Г [(012 —о°2)/w] , где а°2 — предполагаемое
гипотезой значение о12; в данном примере а°2 = 0 . После прибавления и вычитания истинного о12 получим выражение
При нулевой гипотезе остается только первое слагаемое, т. к. о12 = а°2 = 0, поэтому для
02 тестирования равенства о12 =о12 могут использоваться асимптотически нормальное или %
распределения. Если рассматривать альтернативную гипотезу о12 ^о\2, то второе слагаемое будет конечным, только если рассматривается такая последовательность моделей, что
-v/t (о12 —o°2 ) сходится к конечному числу, т. к. w — состоятельная оценка для w . В противном случае второе слагаемое «взрывается», и функции мощности не могут быть выведены без осуществления дальнейших аппроксимаций. Однако наличие расходящегося слагаемого гарантирует состоятельность теста. Анализ случая, когда о12 сходится к ст°2 со скоростью у/Г, соответствует идее локальной мощности: распределение тестовой статистики альтернативной гипотезы рассматривается для небольших отклонений от нулевой гипотезы.
Чтобы вернуться от простого примера к нашему более общему случаю, рассмотрим последовательность моделей, соответствующих концепции локальной мощности. Как и раньше предположим, что обе оценки состоятельны при H0, у/Г(b0 — b) ~ N(0, V0) и у/Г(Д —b) ~ N(0, V1).
Предположим, что при альтернативной гипотезе у/Г(b0 — plim b0) и у/Г(Д —b) асимптотически нормальны, причем ковариационные матрицы являются непрерывными функциями от истинного b.
„ A
Теорема 2.1. При гипотезе H0 тестовая статистика m = Tq'V(q)—1 q ~ %2K, где V(q) — состоятельная оценка (при H0) V(q), использующая b1 и b01.
Доказательство. Пусть \fTq = \fT(b 1 — b0)~N(0,V(g)) исходя из следствия. Тогда величина Tq'V(q)—1 q распределена асимптотически как %2K , т. к. имеет такое же асимптотическое распределение, что и Tq'V(q)—1 q .
В качестве аппроксимации для практических целей вместо m может быть использована статистика q'M(q)—1 q .
Для того чтобы вывести асимптотическое распределение тестовой статистики при альтернативной гипотезе, рассмотрим локальные альтернативы. Например, рассмотрим последовательность моделей, у которых последовательность альтернатив q имеет порядок (l/\fT). Тогда можно показать, что, когда V(q) приближается к V(q), тестовая статистика асимптотически распределена как нецентральный %2.
Теорема 2.2. При гипотезе H1 рассмотрим последовательность моделей с параметрами q/y[T (q Ф 0), такими что gT =plim b 0T —b = bT —b и limT ^y[TgT = a<&. Тогда при T ^^ величина mT = Tq'VT (q)—1 qT асимптотически распределена как нецентральный %2 с k степенями свободы и параметром нецентральности d2 = limTTg'TV(q) 1 gT,
что приближается величиной q'M(q)—l q, если Vr (q) — состоятельная оценка для V(q) при альтернативной гипотезе.
Доказательство. Ввиду того что асимптотические ковариационные матрицы величин b 0 и b1 являются непрерывными функциями от b и рассматривается последовательность локальных отклонений при T ^^, ковариационные матрицы приближаются к V0 и V1 соответственно. Для каждого локального отклонения от нулевой гипотезы, взятого из последовательности моделей с параметрами {gT }, оценка b 0T является несостоятельной. Однако, поскольку рассматриваются только локальные отклонения, можно показать (Cox, Hinkley,
1914, pp. 311-318), что асимптотически VT(b0T —br)~N(0,V0) . Таким образом, хотя математическое ожидание асимптотического распределения b 0 стало отличаться от истинного b и составлять bT, асимптотическая матрица ковариаций осталась такой же. Более того, VT (q) — оценка V(q), остается состоятельной. Поэтому, поскольку асимптотически
~ N(a,V(q)), тестовая статистика mT распределена приблизительно как нецентральный с числом степеней свободы k и параметром нецентральности d2.
Чтобы сделать аргументацию более конкретной, вернемся к примеру с уравнениями (2.9). Определим KT = (1/T)g'x[Tx1Tg и предположим, что эта величина приближается к конечному пределу K. Теперь при гипотезе H1 пусть °12 Ф 0, и поэтому несостоятельность в b0
считается как plimb0 —b = °12KK + °22). Для того чтобы определить предельное распределение b0, удобно предположить, что u1 и u2 имеют двумерное нормальное распределение. Для этого случая Rothenberg (1912) показал, что
1 Для справедливости теоремы 2.1 достаточно наличие любой состоятельной оценки для V(q) при гипотезе H0. Рассмотрение вопроса мощности в условиях H1 могут приводить к выбору конкретного способа оценивания. Эти соображения обсуждаются для конкретного примера, следующего за уравнением (2.11).
(2.11) | где lim
o12/(K + o22) ] равен значению а из теоремы 2.2. Однако V0 = o11/(K + o22), по- Ч этому необходимо показать, что для локальных отклонений от нулевой гипотезы последние два члена в асимптотической дисперсии исчезают при T . Но, поскольку по предположению y[To„
сходится к (конечной) константе, члены, содержащие o12, сходятся к нулю при условии, что (K + o22) не равно нулю. Таким образом, для локальных отклонений в больших выборках V0 дает корректное приближение и можно использовать нецентральное % распределение8, 9.
Для фиксированного размера теста мощность возрастает с увеличением значения d2, которое в свою очередь зависит от того, насколько предел (по вероятности) смещенной
и несостоятельной оценки b 0 отличается от предела (по вероятности) состоятельной
оценки b1 в случае ошибки спецификации. Таким образом, оценка для сравнения b1 должна быть выбрана таким образом, чтобы в случае возможной ошибки спецификации разность q между оценками была большой. Другое соображение из уравнения (2.8)
состоит в сохранении V(q) маленькой, чтобы большая разница между b 0 и b1 не возникла случайно. Это требование означает, что оценка b1 должна быть сравнительно эффективной, но в то же время чувствительной к отклонениям от спецификации модели. Чтобы выделить вопрос мощности критерия, тест спецификации уравнения (2.7) будет переформулирован в статистически эквивалентную форму. Переформулированный тест может также оказаться более простым для использования в эконометрических компьютерных программах. Для того чтобы продемонстрировать новый тест, рассмотрим пример модели ошибок измерения.
Цель теста на наличие ошибок измерения — определить, являются ли стохастические регрессоры и случайные ошибки независимыми. В самом простом случае рассмотрим модель
y =bx, +eb., (/ = 1,...,T), (2.12)
JT
b—b —
012 Kt +O22
-N
0
o
o
2 o\2 K2
'K + o22 (K + o22 )2 (K + o22 )4
8 В работе Wu (1973) вывод предельного распределения для тестовой статистики в предположениях альтернативной гипотезы в уравнении (3.2) его статьи кажется неверным, т. к. для использования центральной предельной теоремы на стр. 748 требуется сумма случайных величин с нулевым математическим ожиданием. Таким образом, его переменная e1 не имеет предельного распределения. Локальная интерпретация результатов Wu выглядит корректной, т. к. для нее требуется только обычная МНК оценка матрицы ковариа-ций V0.
9 Рецензент обратил внимание на то, что в общем случае может существовать множество оценок для V(q), состоятельных при H0, для которых справедлива теорема 2.1. Однако предпочтительно использовать оценку, обеспечивающую наибольшую мощность при Hv Если рассмотреть класс оценок, таких что plim V(q) = cV(q), где c — константа, результаты Wu (1973) в локальной интерпретации приводят к выводу, что следует использовать оценку с наименьшим значением с. Поэтому для теста инструментальных переменных s02, МНК оценка o2, кажется подходящей для использования в этом примере. Для выполнения теоремы 2.2 в общем случае требуются состоятельные оценки для мешающих параметров.
где eli являются независимыми одинаково распределенными нормальными величинами с нулевым математическим ожиданием. При нулевой гипотезе xt и e1 ортогональны на больших выборках:
plim 1 x' e1 = 0, (2.13)
в то время как при альтернативной гипотезе этот предел не равен 0.
Эффективной оценкой при нулевой гипотезе является, конечно, оценка наименьших квадратов. При альтернативной гипотезе МНК оценка является смещенной и несостоятельной, т. е. при H1 имеем plimb0 = b(ml — о^2)/ml, где наблюдаемое значение xt = x* +e2i является суммой «истинного» регрессора и нормальной случайной величины с нулевым математическим ожиданием, которая предполагается независимой от e1i, а mm = plim (1/ T) x 'x. В качестве оценки Д будет использована оценка метода инструментальных переменных (IV) с инструментом z, таким что
plim Tz 'h = 0, plim TzX ф 0 для h = e1i — be2i. (2.14)
Тогда IV оценка есть:
Д = (z X)—1 z'y. (2.15)
Чтобы составить статистику для теста при нулевой гипотезе, используем следствие 2.6:
Jfq = Vf( b 1 —b 0)~N(0, D), (2.16)
где D = V( q) = о 2[ plim((1/ f) x 'x)—1 — plim((1/ f) x'x)—1 ], а x = z( z 'z)—1 z 'x. В силу следствия величина fq'D~lq распределена при нулевой гипотезе как . Тогда, с использованием s2 (IV оценки о2) для того, чтобы получить B, тест спецификации приобретает вид:
m = qB ~lq ~ , (2.17)
где (1/T ) B является выборочной аппроксимацией для D, В = о2[(x'x)~1 — (x'x)—1 ]. При гипотезе H1 предел (по вероятности) для q равен q = b'022/m^ , поэтому асимптотическое распределение m для локальных отклонений зависит от величины двух коэффициентов и корреляции регрессора со случайной ошибкой. Для подсчета мощности как функции от b
можно использовать уравнение (2.8). Оценки метода инструментальных переменных bV и s1 являются состоятельными и при нулевой и при альтернативной гипотезах.
Состоятельная оценка m2 получается из данных, а оценка оee2 выводится из уравнения о^ = (1 — bOLS/bV)m2x. Тогда оценка q может быть подсчитана для любого b, а параметр нецентральности d2 является функцией, квадратической вблизи точки b = 0,
d2 = (b2 о m4 (q)). Отметим, что асимптотическая дисперсия IV оценки входит в знаменатель, поэтому IV оценки с большой дисперсией уменьшают мощность теста. Таблицы для нецентрального %2 теста из работы (Scheffe, 1959) могут быть использованы для того, чтобы
найти вероятность отвержения нулевой гипотезы для заданного значения Д если альтерна- s тивная гипотеза верна, в зависимости от оценок несущественных параметров задачи. Этот Ц тип теста с использованием инструментальных переменных для модели ошибок в измере- ^ ниях был впервые предложен Liviatan (1963). Wu (1973) рассматривал тесты с различными оценками мешающего параметра о2, чтобы вывести F тест при более сильных гипотезах о стохастических свойствах х10.
Тест IV для моделей с ошибками измерений известен в литературе, но альтернативная формулировка теста более проста для использования11. Разложим вектор X на две ортогональные составляющие: х = X + v, т. е. сумму инструментальной переменной и части вектора х, ортогональной z. Тогда спецификация метода наименьших квадратов для уравнения (2.12) может быть записана как:
y = bx + e1 =bX + bv + e1. (2.18)
Теперь оценим эту регрессию, чтобы сравнить две полученные оценки для параметра b.
Переменная X асимптотически ортогональна к e1 при нулевой и альтернативной гипотезах, а также ортогональна к v по построению. Поэтому полученная методом наименьших квадратов оценка коэффициента при X является состоятельной при обеих гипотезах, будучи при этом IV оценкой Д . В случае, когда переменная v ортогональна к e1, предел (по вероятности) оценки параметра b , относящегося к переменной v , должен быть равен пределу (по вероятности) оценки Д . Это позволяет проверить гипотезу о равенстве этих двух оценок. Поскольку при альтернативной гипотезе предел (по вероятности) второго коэффициента уже не равен Д обозначим его за g и перепишем уравнение (2.15), добавляя и отнимая bv , чтобы сделать тест проще:
y = Дх + gv + e1 =b( X +v) + (g —b)v + e1 = Дх + av + e1. (2.19)
Таким образом, для a = g — Д предложенный тест позволяет проверить гипотезу о том, что a = 0. Еще одно незначительное упрощение может быть сделано, если заметить эквивалентность уравнения (2.19) и регрессии
y = bX + aX + e1, (2.20)
т. к. a = (v'QXv)—1 v'QXy = —(X'QXX)—1 XX Qxy , где Qx = I — x(x'x)—1 x'. Проверка того, что a = 0 в уравнении (2.20) при нулевой гипотезе, основана на статистике о2 %2 = a' (X 'QXX) a. Однако
10 Тест инструментальных переменных может быть также рассмотрен как формализация и улучшение предложений Sargan (1958), который рекомендовал проверять, лежат ли оценки метода наименьших квадратов вне доверительных интервалов для IV оценок. Для индивидуальных коэффициентов использованная здесь процедура заключается в том, чтобы проверить, лежат ли оценки наименьших квадратов вне доверительных интервалов с центром в IV оценке и длиной, равной квадратному корню разности дисперсии IV оценки и дисперсии МНК оценки. Таким образом, предложенная процедура дает более короткие доверительные интервалы, чем процедура Sargan. Однако в случаях, когда в модели присутствует более одного параметра, общий %2 тест для всех коэффициентов в уравнении (2.14) является более предпочтительным, чем отдельное рассмотрение каждого доверительного интервала.
11 Этот альтернативный метод тестирования был улучшен по сравнению с более ранней версией благодаря советам Z. Griliches.
(1/o2)(x'Qxx) 1 = (x'x) 1B 1 (x'x) 1 и a = (x'Qxx) 1 (x'x)q . Таким образом, эта формулировка эквивалентна IV тесту уравнения (2.17), поскольку
-1 a'(x'Qxx)a = \q'(jc'jc)(xQ)—1 (xx)q = q' B~lq. (2.21)
o o
Обычный нормальный тест для a = 0, основанный на МНК оценке a из уравнения (2.15), позволяет проверить, присутствуют ли в модели ошибки измерения, и является асимптотически эквивалентным тесту (2.17) с использованием s0, МНК оценки o , при нулевой гипотезе12. Помимо простоты вычисления, у такого теста есть и другие преимущества. Можно выделить три случая, позволяющих получить простую интерпретацию понятия приближенной мощности, что не было наглядным при использовании предыдущей формулировки теста. Во-первых, полученное значение оценки az может быть большим относительно ее стандартной ошибки. Такой результат указывает на то, что гипотеза об отсутствии ошибок спецификации отвергается. Другой понятный случай — маленькое значение a с маленькой стандартной ошибкой, что говорит об отсутствии информации против гипотезы H0. Последний случай описывается большим значением стандартной ошибки по сравнению с величиной a. Это указывает на недостаток мощности, что становится очевидным для исследователя, ввиду отсутствия точной оценки a.
Можно сразу сделать два обобщения теста модели с ошибками измерений. При наличии инструментальных переменных тест может быть использован для проверки любого возможного нарушения предположения (1.1а) о том, что дополнительные регрессоры ортогональны к ошибке. Во-первых, дополнительные объясняющие переменные могут быть представлены в таком виде:
y = X1 b1 + X2 b2 +e, (2.22)
где X1 содержит переменные, которые, возможно, коррелируют с e, в то время как в X2 находятся переменные, заведомо некоррелированные. При заданной матрице переменных Z (включающей в себя X2), величина q опять будет разностью между IV оценкой и эффективной МНК оценкой. Обозначая X1 = PZX1, где PZ = Z(Z 'Z)—1Z', получим регрессию
y = X1 b1 + X2 b2 + Xz1 a + v, (2.23)
где проверка гипотезы H0: a = 0 является тестом на наличие ошибок измерения13. Последний тест на ортогональность использует лаговые эндогенные переменные, которые могут коррелировать с ошибкой. В этом случае, однако, если известен процесс генерации ошибок, как например, автокорреляция первого порядка, можно построить более мощный тест14.
12 Использование si для оценивания o2 относится к тесту множителей Лагранжа, в то время как использование Sj, оценки инструментальных переменных, соответствует использованию теста Вальда. Тесты отличаются альтернативными гипотезами в зависимости от используемого способа оценивания недостающего параметра o2. Взаимосвязь тестов обсуждает Silvey (1970).
13 Для невырожденности матрицы V(q) необходимо наличие достаточного количества инструментов, чтобы обеспечить матрице X1 — ранг q.
14 Для обычной регрессии (без лаговых эндогенных переменных) при нулевой гипотезе об отсутствии автокорреляции и альтернативной гипотезе, МНК оценка b0 является несмещенной и состоятельной, т. к. нарушено только предположение (1.1b). Поэтому, если проверяется нулевая гипотеза о наличии автокорреляции с авторегрессионной оценкой Д, то plim q = q = 0 при обеих гипотезах. Если значение q велико по сравнению с его стандартной ошибкой, то, скорее всего, присутствует ошибка спецификации.
В этом разделе обсуждалась основная природа проблемы ошибок спецификации в слу- S
§
чае, когда существует альтернативная состоятельная оценка при наличии ошибки спецификации. С учетом того факта, что эффективная оценка имеет нулевую асимптотическую ко- * вариацию с разностью между состоятельной оценкой /Ь1 и асимптотически эффективной ^ оценкой (при выполнении гипотезы H0) j3 0, было найдено простое выражение для кова- ^ риационной матрицы (b0 — j31) теста. Затем, с использованием его в задаче с ошибками измерений, был получен простой метод реализации теста, который также прояснил вопрос мощности теста. Полезность этого теста, к сожалению, в некоторых ситуациях может сильно уменьшиться из-за недостатка подходящих инструментальных переменных. Однако следующий тест на спецификацию может быть всегда осуществлен при наличии необходимых данных. Это — тест для модели со случайными эффектами, которая широко используется в эконометрике.
3. Модели панельных данных
Использование моделей панельных данных становится все более и более популярным в эконометрике. Многие исследования вместо того, чтобы ограничиваться пространственными данными, теперь используют панели с наблюдениями для группы индивидов в течение определенного временного интервала. Такие исследования приводят к получению богатых баз данных, характеризующихся высокой изменчивостью между индивидами в сочетании с гораздо меньшей изменчивостью для заданного индивида в разные моменты времени. Другим важным применением таких моделей является оценка спроса в разных штатах США в разные периоды времени. В то время как для многих товаров (например энергии) существуют значительные различия цен в разных штатах, агрегированные ценовые индексы меняются плавно. По этой причине модели панельных данных позволяют разделить эффект дохода и эффект замещения, что часто сложно сделать с агрегированными данными.
Простейшая модель для панельных данных задается уравнением:
yit = Xj + m, +eit, 0 = 1,...,N; t = 1,..., T), (3.1)
где mi — индивидуальный эффект. Две альтернативные спецификации модели отличаются в их отношении к индивидуальному эффекту. Так называемая модель с фиксированными эффектами рассматривает mi как фиксированную, но неизвестную константу, специфическую для каждого индивида. В этом случае оценивание уравнения (3.1) методом наименьших квадратов будет давать корректную оценку. Для оценки коэффициентов b используется отклонение от средних для каждого индивида по времени, что приводит к преобразованным наблюдениям yit = yit — yi, Xit = Xit — Xi, eit = eit — st и новой спецификации регрессии15:
% = x * b+e й. (3.2)
T
15 Используются обозначения из дисперсионного анализа, например y = (1/T)^ yit.
i=1
Эквивалентный способ записи уравнения (3.2) можно получить, используя вектор-столбец e = (1,1,..., 1) ' из T единиц и Pe = e(e 'e)-1 e' = (1/T ) ee ' = (1/T ) JT, Qe = I ® (I - Pe). Тогда спецификация с фиксированными эффектами для полученной модели будет выглядеть как:
Qey = QeXb+Qe a+Qe e=X b+e, (3.3)
что совпадает с уравнением (3.2), поскольку Qe a = 0.
Другой спецификацией для панельных данных является модель со случайными эффектами. Вместо того чтобы рассматривать mi как фиксированную константу, эта спецификация предполагает, что m являются независимыми одинаково распределенными случайными величинами, m ~ N(0, о2), и имеют нулевую ковариацию с ei и Xit. Полученная спецификация имеет вид:
У и = X « b + hit, hit =m, +e,t, (3.4)
так что Eh = 0 и ковариационная матрица является блочно-диагональной:
Q = V(h) =
о2 J +о2 IT
2 T e T
s2 JT +se IT
0
о JT +о2IT
2 T e T
(3.5)
В этом случае подходящей является оценка обобщенного метода наименьших квадратов bgls = (X й-1 X ) XQ-1 y, которая может быть выражена в форме наименьших квадратов, если применить МНК после преобразования переменных yit = yit - gy, Xit = Xit - gXi, где
g = 1-
о
\
о2 +Tо2
16
(3.6)
2 /
Обычно дисперсии о2 и о ^ неизвестны, поэтому состоятельные оценки выводятся из первичных оценок метода наименьших квадратов, чтобы получить g (Wallace, Hussain, 1969). Эта оценка является асимптотически эффективной и, если повторять итерации до достижения сходимости, результатом будут оценки максимального правдоподобия.
Выбор подходящей спецификации основывается на двух соображениях: логическом и статистическом. Логическое соображение заключается в том, могут ли 2,- рассматриваться как независимые одинаково распределенные случайные величины. В работах (Scheffe, 1959) и (Searle, 1971) можно найти превосходные обсуждения этой темы в рамках дисперси-
16 Такой метод оценивания модели со случайными эффектами остался незамеченным в литературе. Он требует меньше вычислений, чем обычный ОМНК или матричное взвешенное среднее двух оценок.
онного анализа. Другой способ решения этой проблемы, предложенный Гэри Чемберленом,
§
заключается в определении, удовлетворяют ли mi критерию де Финетти, который является необходимым и достаточным условием случайности выборки. Суть критерия состоит в том, * чтобы рассмотреть выборку m = (m1,. ., mN) и проверить, можно ли поменять местами mi и ^ mj (например, константы для Род-Айленда и Калифорнии), не меняя при этом распределе- 4 ние данных. Если этот логический критерий выполняется, что бывает с моделями для индивидов, например функции дохода, тогда подходящей представляется модель со случайными эффектами. Статистические рассмотрения позволяют сравнить смещение и эффективность двух оценок Д 17. Wallace, Hussain (1969), Maddala (1971) и Nerlove (1971) обсуждали этот вопрос и пришли к выводу, что оценки становятся одинаковыми при увеличении значения T, как можно увидеть из определения g в уравнении (3.6). Однако обычным для эконометрики случаем является ситуация, когда N значительно превышает T, поэтому различия между двумя оценками становятся важной проблемой.
Для спецификации со случайными эффектами оценка ДGLS является асимптотически эффективной, в то время как оценка модели с фиксированными эффектами ДFE является несмещенной и состоятельной, но не эффективной18. Однако возникает важная проблема спецификации, что было отмечено в (Maddala, 1971, p. 357) и затем подчеркивалось в работе (Mundlak, 1976). Проблема заключается в том, чтобы определить, может ли условное математическое ожидание mi считаться независимым от Xit, т. е. верно ли равенство E(mt | Xtt) = 019. Если это предположение нарушается, оценка модели со случайными эффектами будет смещенной и несостоятельной, в то время как на оценку модели с фиксированными эффектами нарушение ортогональности не повлияет. Рассмотрим уравнение для индивидуального дохода во времени. Если предположить, что ненаблюдаемая переменная «мужество» оказывает влияние на уровень образования и дополнительно влияет на величину дохода, тогда предположение о независимости mi будет нарушено. Таким образом, естественным тестом для проверки нулевой гипотезы о независимости mi будет рассмотрение разности двух оценок q = ДFE —ДGLS. Если модель специфицирована верно, то величина q будет близка к нулю. Используя лемму, получаем V(q) = V( b FE) — V( b GLS), поэтому тест на спецификацию получается из статистики
m = q'M(q)—1 q , где M(q) = (X 'QeX)—1 — (XQ—1 X)—1 . Если спецификация со случайными эффектами корректна, оценки должны быть близки друг к другу, а не сильно различаться, что, как иногда утверждается в литературе, является особенностью модели со случайными эффектами. В то время как Maddala (1971, p. 343) показал, что bGLS является матричным
17 Другими словами, даже если можно утверждать, что модель со случайными эффектами хорошо подходит с логической точки зрения, предпочтение может отдаваться оценке модели с фиксированными эффектами, которая обусловлена конкретной выборкой mi , рассматривая их в качестве фиксированных.
18 Потенциально важной проблемой для оценок с фиксированными эффектами является их чувствительность к ошибкам измерений. Поскольку большая часть дисперсии была удалена при формировании отклонений от индивидуальных средних, несостоятельность оценок в модели с фиксированными эффектами будет больше при наличии ошибки измерения.
19 Если расширить регрессию из уравнения (3.1), включив лаги для эндогенной переменной, эта переменная станет по определению коррелировать с m. Nerlove (1971) обсуждает методы для оценивания такой спецификации. Представленный здесь тест затем будет использован, чтобы убедиться, действительно ли mt не коррелируют с экзогенными переменными.
взвешенным средним bFE (оценки «within») и оценки «between», можно утверждать, что если спецификация корректна, то plim q = 0, поэтому bGLS и bFE должны быть практически одинаковыми в пределах погрешности выборки. Когда эконометристы обнаруживают, что оценки bFE неудовлетворительны, это свидетельствует против спецификации, а не против выбранного способа оценивания. Однако не обязательно принимать оценки модели с фиксированными эффектами как верные, но следует пересмотреть спецификацию, т. к. наличие ошибок измерения делает оценки с постоянными эффектами непра-вильными20.
Можно получить эквивалентный тест в регрессионной форме, проверив гипотезу a=0 после оценивания методом наименьших квадратов регрессии
y = Xb + X a + v, (3.7)
где y и X являются g -преобразованными переменными модели со случайными эффектами, в то время как X представляет собой отклонения от средних из модели с фиксированными эффектами. Методами из предыдущего раздела можно показать, что полученные тесты эквивалентны, с использованием того, что Qey = Qey . Этот тест легко осуществить, т. к. X и X отличаются только выбором g из уравнения (4.6), в то время как X имеет g = 1.
Если значение g близко к единице, обе оценки будут похожи и q будет близким к нулю. Однако более типичными для эконометрики являются значения gz , отличающиеся от единицы. В большинстве приложений значение o ^ мало по сравнению с o^, и когда значение o 2m оценивается по данным, то иногда возникает проблема из-за того, что оно может оказаться отрицательным. В панельных данных значения Xit часто могут быть неизменными в разные периоды времени, поэтому некоторые важные параметры будут поглощаться индивидуальными константами при использовании оценок модели с фиксированными эффектами. Однако предпочтительно иметь альтернативные оценки оставшихся коэффициентов, чтобы разобраться в возможных взаимосвязях между индивидуальными константами и регрессо-рами. Тест на ошибки спецификации из уравнения (3.7), таким образом, кажется предпочтительным тестом для модели со случайными эффектами21.
В этом разделе был рассмотрен тест для неявного предположения, стоящего за спецификацией со случайными эффектами. Этот тест должен быть применен после логической проверки того, являются ли величины действительно случайными. Таким образом, ситуация очень похожа на оценивание систем одновременных уравнений, которое происходит
20 Другим возможным тестом является разность между bFE , оценкой «within», и оценкой «between». Так как оценивание основано на ортогональных проекциях, дисперсия разности равняется сумме дисперсий. Однако такой тест кажется менее мощным, чем представленный здесь тест, поскольку полученная здесь статистика вычитает дисперсию ОМНК из дисперсии модели с фиксированными эффектами, а не прибавляет дисперсию «between». Различия возникают из-за того, что предложенный здесь тест использует эффективную оценку для сравнения с оценкой модели с фиксированными эффектами.
21 Как уже упоминалось, с ростом T значение g из уравнения (3.6) приближается к единице, и оценки приближаются друг к другу. Таким образом, и числитель и знаменатель тестовой статистики стремятся к нулю. Тест остается справедливым, пока g не становится точно равной единице, и N растет быстрее, чем T, однако могут возникнуть вычислительные проблемы обращения почти вырожденной матрицы.
после решения логической проблемы идентификации. В следующем разделе рассматрива- S ются системы одновременных уравнений, и выводится тест для определения корректности спецификации. *
4
4. системы одновременных уравнений
В большинстве случаев при оценивании моделей одновременных уравнений используется одно уравнение, т. е. идет оценивание с неполной информацией. Таким образом, двух-шаговый метод наименьших квадратов (2SLS), безусловно, является наиболее широко используемым методом оценивания. Если в системе одновременных уравнений оценивать отдельно уравнение за уравнением, тогда вся модель не будет проверена на наличие «внутренней состоятельности». Тем самым игнорируется важный источник информации о потенциальных ошибках спецификации. Конечно, этим пренебрегают не всегда, один класс тестов сравнивает оценки приведенной модели без ограничений с оценками, полученными из структурной модели, для того чтобы проверить наличие сверхидентифицируемости в модели22. К сожалению, такой тип теста используется нечасто. Возможно, причиной являются трудности при вычислении функции правдоподобия или нелинейных разложений, необходимые для осуществления статистического сравнения. В этом разделе представлен более простой тест для систем одновременных уравнений. Он основывается на сравнении оценок, полученных с помощью 2SLS и трехшагового метода наименьших квадратов (3SLS). Тем самым эконометрист сравнивает две различные оценки структурных параметров, а не параметров из приведенной системы. Обычно он лучше понимает, что является «значимым различием» по отношению к структурным параметрам. При нулевой гипотезе о правильной спецификации 3SLS метод является эффективным, но приводит к несостоятельным оценкам для всех уравнений, если какое-то из них имеет ошибку спецификации. 2SLS обладает меньшей эффективностью, чем 3SLS, но несостоятельные оценки получаются только для неправильно специфицированных уравнений модели. Таким образом, вместо того чтобы сравнивать оценки параметров приведенной системы, относительно которых у исследователей, как правило, имеется мало информации, тест сравнивает оценки для параметров структурной формы, которые должны лучше «чувствоваться», т. к. они получены из экономической теории и отражаются в оценках других структурных моделей.
Рассмотрим стандартную модель линейных одновременных уравнений:
YB + Z Г = U, (4.1)
где Y является T X M матрицей зависимых между собой переменных, Z — T X K матрица предопределенных переменных, а U — T XM матрица структурных ошибок системы. Предполагается, что Z имеет полный ранг, матрица B не вырождена, существуют пределы (по вероятности) для матриц моментов второго порядка и выполнено ранговое условие
22 В рамках одного уравнения этот тест был предложен в работах (Anderson, Rubin, 1949; Basmann, 1957; Koopmans, Hood, 1953). В контексте полной информации следует использовать тест отношения правдоподобия (LR). Byron (1972, 1974) упростил этот тест, используя тесты множителей Лагранжа или Вальда, которые асимптотически эквивалентны LR тесту при нулевой гипотезе. Более подробное описание см. в (Silvey, 1970, Ch. 7).
идентифицируемости. Структурные ошибки имеют многомерное нормальное распределение U ~ N(0, S® IT). После выбора нормализации и введения нулевых ограничений каждое уравнение может быть записано в виде:
у
= X( +U , где Xt =[YZ] и d, =
(4.2)
где bi содержит ri элементов, а g содержит о, элементов, которые соответствуют таким переменным в Xt, про коэффициенты которых не известно, что они априори равны нулю. Удобно собрать M уравнений в систему:
y = Xd + U,
(4.3)
y1 X1 0 d1
где у = yM , X = 0 XM , d = dM , и = Um ]
Оценки, полученные двухшаговым методом наименьших квадратов для каждого уравнения, могут быть удобно записаны в компактном виде как d2 = (XPZX)—1 XPZy, где PZ = IM ® Z(Z Z)-1 Z' . Для упрощения обозначений перепишем формулу для оценок как
d2 = (XX)-1 X'y . Трехшаговый метод наименьших квадратов использует полную информацию и соединяет вместе все уравнения системы через оценку ковариационной матрицы S . Пусть PSZ = S-1 ® Z(Z Z)-1 Z ', тогда 3SLS оценка будет выглядеть как d3 = (XPSZX)—1 X PSZy, что упрощается до d3 = (XX )-1 Xy.23 Теперь 3SLS распространяет ошибки спецификации на всю систему, оказывая влияние на оценки всех коэффициентов, поскольку d3 -d = (XX)-1 XU . Таким образом, если j-е уравнение неверно специфицировано, plim (1/T)XjUj Ф 0, и поэтому, предположив существование пределов по вероятности и то, что S является пределом по вероятности для несостоятельной оценки S, где оj — элемент матрицы, обратной к ней, несостоятельность рассчитывается из равенства
plim (d3 — d) = plim ((l/T)XX)-1 - plim ((l/T)XU). Изучая более внимательно последний член этого равенства, рассмотрим неизвестные элементы из первого уравнения для d1. Тогда последний член принимает форму:
1 M
plim - 2o1mX;Um, (4.4)
m=1
23 Если T < K, тогда ни 2SLS ни 3SLS методы не могут быть использованы; асимптотически эквивалентный метод оценивания с инструментальной переменной обсуждается в работах (Brundy, Jorgenson, 1971; Dhrymes, 1971; Hausman, 1975). Таким образом, данный тест на спецификацию может быть применен в том случае, когда тест отношения правдоподобия невозможен, т. к. нельзя оценить параметры приведенной системы из-за ограниченности размера выборки.
поэтому величина несостоятельности для первого уравнения из-за неверной специфика- s
и
ции в j-ом уравнении зависит от двух факторов: отсутствия ортогональности между X1 и ||
~1 ■ >2 U. и размера о . *
j ч
Лемма 2.1 приводит к рассмотрению теста на спецификацию, основанного на разности двух ^ оценок VTq = yJT(&2 — д3), которая имеет ковариационную матрицу V(q) = V(d2) — V(d3). Однако в качестве альтернативного подхода можно рассмотреть регрессию для системы
y = Хд + Xa + V (4.5)
и проверить гипотезу a = 0. Поскольку для вычисления XX и XX используются программы, которые могут получать 2SLS и 3SLS оценки, регрессия для уравнения (4.5) не должна быть трудной для реализации.
Параметр нецентральности для нецентрального %2 распределения будет пропорционален величине plim (1/T)X'Uj для любого уравнения, содержащего ошибку спецификации, а также величине элементов матрицы ковариаций Oj . Если элементы обратной ковариационной матрицы велики, тогда XX и X не будут сильно коррелированы, поэтому тест будет мощным для заданной величины несостоятельности. Если значения OiJ будут стремиться к нулю, тогда 3SLS оценки будут приближаться к 2SLS оценкам, и тест будет обладать малой мощностью. Из-за того что ошибка спецификации в альтернативной гипотезе четко не определена, становится неясным, что нужно делать в случае, когда H0 отвергается. Тест лишь указывает на наличие ошибки спецификации где-то в системе. Если существует уверенность, что какие-то из уравнений определены правильно, то спецификацию остальных можно проверить, используя их по одному для получения 3SLS оценок. Так, если уравнение 1 корректно, а уравнение 2 следует проверить, тогда 2SLS оценивание уравнения 1 нужно сравнить с 3SLS оцениванием уравнения 1, причем Oj считаются нулями для всех i ^ j, кроме i = 1, j = 2, и наоборот для 3SLS оценки. Описанный подход позволяет выделить ошибку спецификации, но, к сожалению, если применить его для последовательности уравнений, то возникают проблемы с определением размера теста24.
Тест для систем одновременных уравнений является последним из представленных здесь, однако аналогичный подход может быть применен и для других случаев, таких как агрегирование. В следующем разделе будет рассмотрен эмпирический пример теста на спецификацию для того, чтобы продемонстрировать его потенциальную полезность.
5. Эмпирический пример
Идея сравнения двух альтернативных оценок для построения теста на ошибки спецификации была применена к нескольким случаям в предыдущих разделах. В этом разделе будет представлен эмпирический пример, в котором используется тест для панельных данных, описанный в четвертом разделе. Такой тип данных становится все более популярным
24 Если попробовать проверить правильность спецификации всей системы, сравнив 2SLS и 3SLS оценки, то подходящим будет %2 тест из теоремы 2.1 при гипотезе H0. Однако при H1 нецентральное %2 распределение уже не будет подходить, т. к. 2SLS оценки также являются несостоятельными.
в эконометрических исследованиях, таких как анализ индивидуального дохода, уровня образования, предложения труда. Дополнительный интерес к этому тесту возник из-за того, что он косвенно тестирует похожие спецификации для пространственных данных. Анализ пространственных данных не позволяет использовать индивидуальную константу, но для него, так же как и в модели со случайными эффектами, требуется предполагать, что регрес-соры не коррелируют с ошибками: если модель со случайными эффектами отвергается, серьезные сомнения должны возникнуть и относительно похожих методов анализа пространственных данных.
Для проверки спецификации модели панельных данных было оценено уравнение заработной платы мужчин с высшим образованием по результатам динамического исследования дохода в штате Мичиган, США25. Выборка содержит данные для 629 человек, которые наблюдались в течение шести лет. Уравнение заработной платы было выбрано по причине его важности в исследованиях «человеческого капитала». Используемая спецификация получена из уравнения (3.1). Регрессоры включают в себя кусочно-линейную функцию возраста, фиктивные переменные, характеризующие, был ли респондент безработным или больным в предыдущем году, а также самозанятость, проживание на юге или в сельской
местности. Оценки модели с фиксированными эффектами, bFE, были получены из уравнения (3.3). Они включают индивидуальную константу для каждого человека и состоятельны при обеих гипотезах — нулевой о правильной спецификации модели и альтернативной.
Оценки модели со случайными эффектами bGLS рассчитываются из уравнений (3.4) - (3.6). Оценка g из уравнения (3.6) составила 0.72736, что следует из величины МНК оценки для индивидуальной дисперсии еР = 0.12594 и оценки дисперсии ошибок o2 = 0.06068 . При
нулевой гипотезе ОМНК оценка является асимптотически эффективной, но при альтернативной гипотезе она несостоятельна. Тестирование спецификации заключается в том, чтобы посмотреть, насколько велика разность между оценками, q = bFE —bGLS, по отношению
к матрице ковариаций M(q) = M(bFE) — M(bGLS), как следует из леммы 2.1. При сравнении оценок из первого и второго столбца табл. 1 становится очевидным, что существует значительное различие между двумя наборами оценок относительно их стандартных ошибок, представленных в третьем столбце26. Эффекты от безработицы, самозанятости и географического положения значительно различаются в двух моделях. Географические различия могут быть объяснены тем, что две спецификации по-разному рассматривают процесс миграции, т. к. в модели с фиксированными эффектами коэффициенты показывают только изменения в течение изучаемого периода. Ненаблюдаемые индивидуальные характеристики вполне могут коррелировать с географическим положением. Также можно увидеть, что эффект от безработицы в предыдущем году намного менее важен в модели с фиксированными эффектами. Таким образом, безработица имеет более ограниченный и скоротечный эффект, если в модели учитываются постоянные индивидуальные различия.
25 Использованная спецификация основана на исследовании (Gordon, 1976), автор которого любезно помог построить этот пример.
26 Отметим, что элементы q и их стандартные ошибки легко считаются на основе оценок bFE и bals и их стандартных ошибок, с использованием оценки по модели с фиксированными эффектами величины o\. Основной вычислительной проблемой является вычисление и обращение матрицы M(q).
Таблица 1. Зависимая переменная — логарифм заработной платы
Переменная Модель Модель а
с фиксированными со случайными
эффектами эффектами
1. Возраст 1 (20-35) 0.0557 0.0393 0.0164 0.0291
(0.0042) (0.0033) (0.0030) (0.0060)
2. Возраст 2 (35-45) 0.0351 0.0092 0.0259 0.0015
(0.0051) (0.0036) (0.0039) (0.0070)
3. Возраст 3 (45-55) 0.0209 -0.0007 0.0216 0.0058
(0.0055) (0.0042) (0.0040) (0.0083)
4. Возраст 4 (55-65) 0.0209 -0.0097 0.0306 -0.0308
(0.0078) (0.0060) (0.0050) (0.0112)
5. Возраст 5 (65+) -0.0171 -0.0423 0.0252 -0.0308
(0.0155) (0.0121) (0.0110) (0.0199)
6. Безработный (-1) -0.0042 -0.0277 0.0235 -0.3290
(0.0153) (0.0151) (0.0069) (0.0914)
7. Плохое здоровье (-1) -0.0204 -0.0250 0.0046 -0.1716
(0.0221) (0.0215) (0.0105) (0.0762)
8. Самозанятость -0.2190 -0.2670 0.0480 -0.3110
(0.0297) (0.0263) (0.0178) (0.0558)
9. Юг -0.1569 -0.0324 -0.1245 0.0001
(0.0656) (0.0333) (0.0583) (0.0382)
10. Сельская местность -0.0101 -0.1215 0.1114 -0.2531
(0.0317) (0.0237) (0.0234) (0.0352)
11. Константа — 0.8499 — —
— (0.0433) — —
0.0567 0.0694 0.0669
Степени свободы 3135 3763 3753
Примечание. Всего 3774 наблюдения. Стандартные ошибки указаны в скобках.
Тест на ошибки спецификации, вытекающий из леммы 2.1, имеет вид:
m = q M (q)—1 q = 129.9. (5.1)
Поскольку статистика m асимптотически распределена как а критическое значение для уровня 1% составляет 23.2, то можно с очень большой уверенностью сказать, что модель со случайными эффектами специфицирована неверно. Независимые переменные X it не ортогональны индивидуальной константе m , поэтому нулевая гипотеза отвергается. Из-за такого результата может возникнуть значительное сомнения по поводу предыдущей работы по исследованию заработной платы на пространственных данных.
Причиной для такого сомнения относительно предыдущих оценок для пространственных данных является тот факт, что оценки метода наименьших квадратов для пространственных данных одного года будут иметь такие же математические ожидания, что и b GLS — оценки модели со случайными эффектами для панельных данных. Например, оценивание простран-
ственных данных для уравнения заработной платы не включает индивидуальных констант и предполагает выполнение предположения (1.1а) о некоррелированности остатков с объясняющими переменными. Однако этот пример демонстрирует, что в Мичиганском исследовании присутствуют важные индивидуальные эффекты, которые не являются некоррелированными с объясняющими переменными. Поскольку оценки модели со случайными эффектами с высокой вероятностью являются значительно смещенными, важным может оказаться учет постоянных ненаблюдаемых различий между индивидами. Эта проблема может быть решена только с помощью моделей панельных данных, которые используют спецификации, позволяющие тестировать важные гипотезы, рассматриваемые в большинстве моделей пространственных данных. Таким образом, значимость панельных данных подчеркивается тем, что описанная процедура позволяет проверять рассмотренные ранее гипотезы.
Эквивалентная формулировка теста на спецификацию может быть получена при помощи уравнения (3.7). Вместо того чтобы производить действия с матрицами 10 X10, оценим регрессию y и на X, и на X. Тестирование нулевой гипотезы тогда заключается в проверке равенства az = 0 . Как видно из столбца 4 табл. 1, многие элементы az более чем в два раза превышают свою стандартную ошибку, поэтому, очевидно, имеется ошибка спецификации. Тест на ошибки спецификации легко получается из сравнения величины s2 , оценки дисперсии из модели со случайными эффектами, с s2 из расширенной спецификации:
0.06938 — 0.06689 , ч
m =--3754 = 139.7. (5.2)
0.06689
В этом случае m также сильно превышает приближенное (по %2) критическое значение 23.2. Ввиду того что эту форму теста легко применять для модели со случайными эффектами, т. к. требуется только одна дополнительная взвешенная МНК регрессия, есть надежда, что прикладные эконометристы сочтут такой способ полезным инструментом для тестирования спецификаций.
Эмпирический пример, представленный в этом разделе, демонстрирует использование теста на спецификацию. А именно, этот пример отвергает спецификацию со случайными эффектами. Есть ощущение, что этот результат может быть довольно типичным, и что модели с некоррелированными случайными эффектами не очень хорошо подходят для многих эконометрических приложений. Два требуемых условия (взаимозаменяемости и ортогональности), возможно, не выполняются во многих прикладных задачах. Конечно, следует сравнивать оценки модели со случайными эффектами и оценки модели с фиксированными эффектами, чтобы проверить, существуют ли значимые различия. Если это так, то спецификация уравнения должна быть пересмотрена для того, чтобы объяснить эту разницу или попытаться найти другую спецификацию, которая скорректирует задачу.
6. обобщения и выводы
Другое возможное приложение представленной здесь методологии возникает, когда необходимо проверить, отличается ли только часть спецификации модели. Например, рассмотрим две разные модели, различие в которых возникает из-за того, что вторая модель использует дополнительные параметры, которые ограничены в первой, например, специфи-
кация селективной выборки. Можно было бы оценить методом максимального правдоподо- *
§
бия обе модели, а затем провести тест отношения правдоподобия, сравнивая таким образом две спецификации. Однако если интерес в модели сосредоточен на конкретном параметре, * который не ограничен в обеих спецификациях, традиционная методология не позволяет ^ проверить, значима ли разница только в этом параметре. Использование леммы 2.1 обеспе- ^ чивает простой способ проверки гипотезы о значимости разницы в конкретном параметре, т. к. модель без ограничений неэффективна при нулевой гипотезе, но состоятельна как при нулевой, так и при альтернативной гипотезах.
Использование результата о том, что при нулевой гипотезе об отсутствии ошибок спецификации асимптотически эффективная оценка должна иметь нулевую ковариацию с разностью этой оценки и состоятельной, но асимптотически неэффективной оценкой, позволяет вывести тесты на спецификацию для важных эконометрических моделей. Представлены новые тесты для моделей панельных данных и систем одновременных уравнений. Наконец, представлен эмпирический пример. Пример демонстрирует, что в широко распространенной эконометрической спецификации уравнения заработной платы присутствуют ненаблюдаемые индивидуальные факторы, являющиеся не ортогональными к объясняющим переменным.
Массачусетский Технологический Институт Рукопись получена в августе 1976 г., окончательный вариант получен в апреле 1978 г.
Список литературы
Anderson T. W., Rubin H. (1949). Estimation of the parameters of a single stochastic equation in a complete system of stochastic equations. Annals of Mathematical Statistics, 20 (1), 46-63.
Basmann R. L. (1957). A generalized classical method of linear estimation of coefficients in a structural equation. Econometrica, 25 (1), 77-83.
Brundy J., Jorgenson D. W. (1971). Efficient estimation of simultaneous equation systems by instrumental variables. Review of Economics and Statistics, 53 (2), 207-224.
Byron R. P. (1972). Testing for misspecification in econometric systems using full information. International Economic Review, 13 (3), 745-756.
Byron R. P. (1974). Testing structural specification using the unrestricted reduced form. Econometrica, 42 (5), 869-883.
Cox D. R., Hinkley D. V. (1974). Theoretical statistics. London: Chapman and Hall.
Dhrymes P. J. (1971). A simplified structural estimator for large-scale econometric models. Australian Journal of Statistics, 13, 168-175.
Fisher R. A. (1925). Theory of statistical estimation. Cambridge Philosophical Society Proceedings, 22, 700-725.
Gordon R. (1976). Essays on the causes and equitable treatment of differences in earnings and ability. Massachusetts Institute of Technology, Ph. D. Thesis, June, 1976.
Hausman J. (1975). An instrumental variable approach to full-information estimators for linear and certain nonlinear econometric models. Econometrica, 43 (4), 727-738.
Seminal papers in econometrics Классические работы по эконометрике 133
Koopmans T. C., Hood W. (1953). The estimation of simultaneous economic relationships. In: Studies in Econometric Method, ed. by W. Hood and T. C. Koopmans. New Haven: Yale University Press, 1953, 113-199.
Liviatan N. (1963). Tests of the permanent income hypothesis based on a re-interview savings study. In: Measurement in Economics, ed. by C. Christ. Stanford: Stanford University Press, 1963, 29-59.
Maddala G. S. (1971). The use of variance components models in pooling cross section and time series data. Econometrica, 39 (2), 341-358.
Mundlak Y. (1976). On the pooling of time series and cross section data. Mimeo27.
Nerlove M. (1971). A note on error component models. Econometrica, 39 (2), 383-396.
Ramsey J. B. (1974). Classical model selection through specification error tests. In: Frontiers of Econometrics, ed. by P. Zarembka. New York: Academic Press.
Rao C. R. (1973). Linear statistical inference. New York: Wiley.
Rothenberg T. J. (1973). Efficient estimation with a priori information. New Haven: Yale University Press.
Rothenberg T. J. (1972). The asymptotic distribution of the least squares estimator in the errors in variables model. Mimeo.
Sargan J. D. (1958). The estimation of economic relationships using instrumental variables. Econometrica, 26 (3), 393-415.
Scheffe H. (1959). Analysis of variance. New York: Wiley.
Searle P. (1971). Linear models. New York: Wiley.
Silvey S. D. (1970). Statistical inference. Harmondsworth: Penguin Press.
Wallace T. D., Hussain A. (1969). The use of error components models in combining cross section with time series data. Econometrica, 37 (1), 57-72.
Wu D. (1973). Alternative tests of independence between stochastic regressors and disturbances. Econometrica, 41 (4), 733-750.
27 Работа была позже опубликована как: Mundlak Y. (1978). On the pooling of time series and cross section data. Econometrica, 46 (1), 69-85. — Прим. редактора.
134 Классические работы по эконометрике Seminal papers in econometrics