ПРИКЛАДНАЯ ЭКОНОМЕТРИКА
\
N° 1 2006
Марно Вербик
Модели, основанные на панельных данных
От редакции
Последние два десятилетия ознаменовались настоящим щ&рыщ&*9 об^сХЩг неметрического инструментария. Создан и развит новый общий подход къщенш рических моделей — обобщенный метод моментов (GMM разработан коинтеграционный анализ моделей регрессии (включая модель сионных остатков — «Error Correction Model»), необходимый при построении ма9ейк1гщфшсиу по временным рядам; предложены методы устранений тех смещений в выводах, которые обусловлены ограничениями на процесс формирования представифеяйшф^&ф-чайной) выборки (*Sample Selection Problem»); наконец, разработаны специальные методаГК>Шрд-ения регрессионных моделей по так называемым панельны/и данным f*Models Based on Pawl Q$fa»). К сожалению, до настоящего времени все эти важные в прикладном плане методы в специальной литературе практически не представлены (или представлены краййЬ ЧМЯв^^.^
Поэтому редакционная коллегия журнала ПЭ решила создать в рамках журнала спещ, , т «Консультации», в котором будет оперативно помещаться информация об опмосит&онщрм^ф^ стижениях в области прикладного эконометрического инструментария, слабо отратеннжлфдпгт'-язычной учебно-методической или монографической литературе. . " f
В данном номере журнала мы помещаем главу из подготовленною к изданию русскою Марно Вербика «Путеводитель по современной эконометрике»(издательство «Научная кЦигф, научный редактор перевода С. А. Айвазян, перевод В.А. Банникова), посвященную эконометрии* панельных данных и, в определенной мере, проблеме смццдщявои* aartfajflftr fem). Издательство *Научная книга» планирует выпустить ту публикуется в том виде, в котором она будет представлена в mat.
Совокупность панельных данных содержит повторные наблюдения для одних и тех же выборочных единиц (людей, домашних хозяйств, фирм), собранные за ряд тактов времени. Хотя панельные данные, как правило, собираются на микроэкономическом уровне, на практике все чаще и чаще начинают объединять индивидуальные временные ряды множества стран или множества отраслей промышленности и анализировать их одновременно. Применение повторных (для разных тактов времени) наблюдений относительно одних и тех же выборочных единиц позволяет экономистам специфицировать и оценивать более сложные и более реалистические модели, чем применение одной пространственной («cross-section») выборки или одного временного ряда. Неудобства имеют скорее практическую природу: поскольку мы повторно наблюдаем одни и те же выборочные единицы, то обычно больше нереалистично предполагать, что различные наблюдения независимы. Это может усложнить анализ, особенно для нелинейных и динамических моделей. Кроме того, совокупности панельных данных очень часто страдают от пропущенных наблюдений. Даже если эти наблюдения отсутствуют случайным образом (см. ниже), стандартный анализ должен быть скорректирован. Эта глава является введением в анализ панельных данных. В параграфе 10.1 представлена простая линейная модель панельных данных и в контексте этой модели обсуждены определенные преимущества по сравнению с пространственными данными или данными одномерного временного ряда. В параграфе 10.2 уделяется внимание так называемым моделям с фиксированными эффектами и моделям со случайными эффектами и обсуждаются проблемы, относящиеся к выбору между этими двумя основными моделями. В параграфе 10.3 приводится эмпирический пример. Введение лагированной зависимой переменной в линейную модель
Na 1 2006
усложняет состоятельное оценивание и, как обсуждается в параграфе Ю.4, методы инструментальных | переменных или ОММ предоставляют интересные альтернативы. В параграфе 10.5 приводится эмпи- а. рический пример оценивания краткосрочных и долгосрочных динамических эластичностей спроса на ш рабочую силу относительно заработной платы. Другие сложности возникают, когда интересующая нас § модель включает ограниченные зависимые переменные. Расширение логит, пробит и тобит моделей ^ на случай панельных данных обсуждается в параграфе 10.6. И, наконец, в параграфе 10.7 мы обсуждаем проблемы, связанные с неполными панельными данными и смещениями, обусловленными ограничениями в способе отбора выборочных единиц'. Обширные обсуждения эконометрического анализа панельных данных можно найти в работах (Hsiao, 1986), (Baltagi, 1995) и (Matyas, Sevestre, 1996).
10.1 Преимущества панельных данных
Важное преимущество панельных данных по сравнению с данными одномерного временного ряда или пространственной совокупностью данных состоит в том, что панельные данные позволяют идентифицировать определенные параметры или вопросы без необходимости делать ограничительные допущения. Например, панельные данные позволяют анализировать изменения на индивидуальном уровне. Рассмотрим ситуацию, в которой средний уровень потребления повышается на 2% ежегодно. Панельные данные могут идентифицировать, является ли это повышение результатом, например, увеличения на 2% уровня потребления для всех индивидуумов или увеличения на 4% уровня потребления приблизительно для одной половины индивидуумов и никакого изменения уровня потребления для другой половины (или результатом любой другой комбинации). Таким образом, панельные данные подходят не только для моделирования или объяснения, почему выборочные единицы ведут себя по-разному, но также и для моделирования, почему конкретная выборочная единица ведет себя по-разному в различные периоды времени (например, из-за различного прошлого).
В последующем мы будем индексировать все переменные индексом /для индивидуумов2 (/' = 1...../V)
и индексом Г для периодов времени = 1..... Г) В общем виде мы могли бы специфицировать линейную
модель как
Уп = х',< Р/г + е/м
где вектор коэффициентов (3/( измеряет частные эффекты вектора объясняющих переменных хИ в период г для выборочной единицы /. Конечно, такая модель является слишком общей, чтобы быть полезной, и мы должны наложить более ограничительную структуру на вектор коэффициентов (3, Стандартное предположение, используемое во многих эмпирических случаях, состоит в том, что вектор (3 /( является вектором констант для всех / и г, за исключением, возможно, свободного члена. Такую модель можно написать как
у„= а, + х;((3 + е„, (10.1)
где х,( — /(-мерный вектор объясняющих переменных, не включающий константу3. Это означает, что влияние от изменений в компонентах вектора х на у одинаковы для всех выборочных единиц и всех периодов, но средний уровень для выборочной единицы /' может отличаться от среднего уровня для выборочной единицы ]. Таким образом, коэффициент а, улавливает эффекты тех переменных, кото-
1 В общем плане эта проблема («проблема выборочной селективности») обсуждалась в параграфе 7.5 (прим. научн.ред. пер).
2 Несмотря на то, что мы ссылаемся на пространственные выборочные единицы как на индивидуумов, они могут также относиться к другим выборочным единицам, например, фирмам, странам, отраслям промышленности, домашним хозяйствам или активам.
'Элементы в векторе р индексируются от элемента (3, до 0К, где первый элемент в отличие от предыдущих глав не относится к свободному члену
Ив 1 2006
рые являются специфическими для /-го индивидуума, и которые являются постоянными во времени. В стандартном случае предполагается, что остатки е(, являются независимыми и одинаково распределенными по индивидуумам и времени с нулевым средним и дисперсией а\. Если мы рассматриваем коэффициенты а, как N фиксированных неизвестных параметров, то модель (10.1) называется стандартной моделью с фиксированными эффектами.
Альтернативный подход предполагает, что свободные члены индивидуумов различны, но их можно рассматривать как извлечения из распределения со средним и дисперсией а2а. Существенное предположение здесь состоит в том, что эти извлечения являются независимыми от объясняющих переменных в векторе х (см. ниже). Это приводит к модели со случайными эффектами, где индивидуальные эффекты рассматриваются как случайные. Член ошибки в этой модели состоит из двух компонент: не зависящей от времени компоненты4 а, и остаточной компоненты е,(, которая некоррелирована во времени5. Такую модель можно записать как
у„=ц + х;(р + а,+е,(, (10.2)
где ^ обозначает свободный член.
Возможность рассматривать эффекты а, как фиксированные параметры имеет несколько больше преимуществ, но также и некоторые неудобства. Большинство моделей панельных данных оценивается либо в предположении фиксированных эффектов, либо в предположении случайных эффектов, и мы будем обсуждать это подробно в параграфе 10.2. Но сначала в следующих двух пунктах обсудим более подробно некоторые потенциальные преимущества панельных данных.
10.1.1 Эффективность оценивания параметров
Поскольку совокупности панельных данных, как правило, обширнее, чем совокупности пространственных данных или совокупности данных одномерного временного ряда, и объясняющие переменные изменяются в двух измерениях (индивидуумы и время), а не в одном измерении, то оценки, построенные на основе панельных данных, весьма часто точнее, чем те, которые построены на основе других источников данных. Даже при одинаковых объемах выборок применение совокупности панельных данных часто будет приводить к более эффективным оценкам, чем ряд независимых совокупностей пространственных данных (где различные выборочные единицы извлекаются в каждом такте времени). Чтобы проиллюстрировать это, рассмотрим следующий специальный случай модели со случайными эффектами (10,2), в которую мы включим временные фиктивные переменные (манекены), т.е.
у„=М., + а,+е,(1 (10.3)
где каждый ц ( является неизвестным параметром, соответствующим среднему значению генеральной совокупности для такта времени г. Предположим, что мы не интересуемся средним |1, для определенного такта времени Г, а интересуемся изменением ц,, от одного такта времени к другому. Вообще дисперсия эффективной оценки для разности ц - ц, (в * ?), задается в виде
1/{(х = + (10.4)
с \1,= МЫ у/( (( = ~\.....7"). Как правило, если используется совокупность панельных данных,
то ковариация между средними и будет положительна, в частности если справедливы допущения, принятые для модели со случайными эффектами (10.2), то эта ковариация равна а* //V. Однако если используются две независимые совокупности пространственных данных, то разные периоды времени будут содержать различных индивидуумов, поэтому средние ц,, и будут иметь нулевую
4 В модели случайных эффектов случайные величины а, переопределены таким образом, что они имеют нулевое среднее значение.
5 Модель иногда называется (однофакторной) моделью остаточных ошибок.
ковариацию. Другими словами, если интересуются изменениями параметра модели от одного такта | времени к другому, то методы анализа панельных данных приводят к более эффективным оценкам, чем о. методы анализа пространственных данных, примененные к той же совокупности исходных данных. <о
Однако заметим, что обратное также справедливо в том смысле, что повторные пространствен- * ные данные будут более информативны, чем панельные данные, когда, например, речь идет об оцен- ^ ке суммы или среднего значения ц, по совокупности нескольких тактов времени. На интуитивном уровне панельные данные могут предоставить лучшую информацию, поскольку одни и те же индивидуумы наблюдаются повторно. С другой стороны, наличие одних и тех же индивидуумов, а не различных, может подразумевать меньшую вариацию в объясняющих переменных и таким образом снижать эффективность построенных по ним оценок. Всесторонний анализ выбора между чисто панельными данными, чисто пространственными данными и совместной комбинацией этих двух .источников данных представлен в работе (Nijman, Verbeek, 1990). Результаты работы показали, что когда речь идет об оценке параметров, определяющих эффект влияния включенных в модель экзогенных переменных, то анализ совокупности панельных данных, как правило, будет приводить к более эффективным оценкам, чем анализ, основанный на выборке пространственных данных с тем же самым числом наблюдений.
10.1.2 Идентификация параметров
Другое преимущество наличия панельных данных состоит в том, что ослабляются проблемы идентификации, и хотя такое преимущество может проявляться в разных ситуациях, во многих случаях оно включает идентификацию при наличии эндогенных регрессоров или ошибки измерения, устойчивость по отношению к не включенным в модель переменным и идентификацию индивидуальной динамики.
Начнем с последнего примера. Существует два альтернативных объяснения часто наблюдаемого явления, что индивидуумы, которые испытали некоторое событие в прошлом, более вероятно, испытают то же событие в будущем. Первое объяснение состоит в том, что факт испытания события индивидуумом изменяет его предпочтения, ограничения, и т.п. таким образом, что он более вероятно испытает такое событие в будущем. Второе объяснение говорит, что индивидуумы могут отличаться ненаблюдаемыми особенностями, которые влияют на вероятность испытания события (но испытание события не влияет на ненаблюдаемые особенности индивидуума). Хекмэн (Heckman, 1978) назвал первое объяснение истинной зависимостью состояния, а последнее — мнимой зависимостью состояния. Известный пример относится к «событию» — быть безработным. Наличие панельных данных ослабит проблему различения между истинной и мнимой зависимостью состояния, поскольку наблюдаются индивидуальные предыстории, которые можно включить в модель.
Смещение от невключения переменной возникает, если переменная, которая коррелирована с включенными переменными, не включена в модель. Классическим примером является оценивание производственных функций (Mundlak, 1961). Во многих случаях, особенно в случае малых фирм, в качестве производственных затрат в производственную функцию желательно включить качество менеджмента. Однако вообще качество управления не наблюдаемо. Предположим, что производственная функция типа Кобба-Дугласа задана в виде
ylt=\i+x'lt^ + mi ßK+1 + e,(, (10.5)
где у I, обозначает логарифмический объем производства, хп —/(-мерный вектор логарифмических производственных затрат для фирмы /' в момент времени f, а т, обозначает качество управления для фирмы /' (которое, как предполагается, является постоянным во времени). Ожидается, что ненаблюдаемая переменная т, будет отрицательно коррелирована с другими производственными затратами в векторе хп, так как высококачественное управление вероятно приведет к более эффективному использованию производственных затрат. Поэтому кроме случая ß/(+1= 0,исключение mi из модели (10.5) приведет к смещенным оценкам других параметров модели. Если доступны панельные данные, то такую проблему можно решить, введя специфический эффект фирмы а, = |j, + m, ß 1 и рассматривая
Не 1 2006
его в качестве фиксированного неизвестного параметра. Заметим, что без дополнительной информации идентифицировать неизвестный параметр (Зк+1 невозможно; ограничение, которое идентифицирует параметр (Зк+1, состоит во введении условия постоянной отдачи от масштаба6.
Подобным образом в модель можно включить фиксированный временной эффект, чтобы уловить эффект всех (наблюдаемых и ненаблюдаемых) переменных, который не изменяется на индивидуальных единицах. Этим поясняется утверждение, что для панельных данных можно снизить эффекты смещения из-за невключенных переменных, или, другими словами, оценки, построенные по совокупности панельных данных, могут быть более устойчивыми к неполной спецификации модели.
И, наконец, во многих случаях панельные данные предоставляют «внутренние» инструментальные переменные для регрессоров, которые являются эндогенными переменными или переменными, подверженными ошибке измерения. Т.е., часто можно аргументировать такие преобразования исходных переменных, при которых они станут некоррелированными с остатками модели и коррелированными с самими объясняющими переменными, и никакие внешние инструментальные переменные не требуются. Например, если вектор хи коррелирован с эффектом а^, то можно утверждать, что разность хп -х,,где xi — среднее по времени для индивидуума /', некоррелирована с эффектом а, и предоставляет действительную инструментальную переменную для вектора хп. Более обще, оценивание модели при предположении фиксированных эффектов устраняет эффект а, из остаточного члена и, следовательно, устраняет все связанные с этим проблемы эндогенности. Это будет проиллюстрировано в следующем параграфе. Обширное обсуждение преимуществ и ограничений панельных данных представлено в работе (Hsiao, 1985).
№ 1 2006
10.2. Статическая линейная модель
В этом параграфе мы обсудим статическую линейную модель для панельных данных. Мы начнем с двух основных моделей, модели с фиксированными эффектами и модели со случайными эффектами, и последовательно обсудим выбор между этими двумя моделями, а также обсудим альтернативные процедуры, которые можно рассматривать как промежуточные между обработкой фиксированных эффектов и обработкой случайных эффектов.
10.2.1. Модель с фиксированными эффектами
Модель с фиксированными эффектами является просто линейной моделью регрессии, в которой свободные члены изменяются по индивидуальным единицам /', т.е.
у, ( = а,+ , Р + в,,, е,., ~ НОР (0, а *), (10.6)
5 где обычно предполагается, что все хп независимы от всех е/(. Мы можем написать это в обычной структу-ч ре регрессии включением фиктивной переменной для каждой единицы /' в модели. Таким образом,
I У/, = Е а -С/,.. +х', р + е,.,, (10.7)
§
где с/,- - =1, если \ — у, и бг = 0 в противном случае. Таким образом, мы имеем множество из N фиктивных переменных в модели. Параметры а,.....ам и 0 можно оценить с помощью МНК в регрессии (10.7). Соответствующая оценка для вектора неизвестных параметров (3 называется оценкой метода наименьших квадратов с | фиктивными переменными (МНК ФП-оценкой). Однако, возможно, непривлекательно с вычислительной точ-§ ки зрения иметь модель регрессии с таким большим количеством регрессоров. К счастью, можно вычислить оцен-о ку для вектора неизвестных параметров 3 более простым способом. Можно показать, что точно та же самая оцен-| ка для вектора 0 получается, если регрессия строится в отклонениях от индивидуальных средних. По существу,
S 6 Постоянная отдача от масштаба производства подразумевает, что 9к+1 = 1 - (Р, Н-----1- 3« )•
Ns 1 2006
0.
ФЭ
Е Е (xil-xi)(xlt-xlY Е É )(У,,-У,)- 00.10)
/ = 1 ! = ...
-1 N Т
/ = 1 ( = 1
7 Если не утверждается иное, то в этой главе мы рассматриваем состоятельность по числу индивидуумов Л/, стремящемуся к бесконечности. Это соответствует общей ситуации, когда мы имеем панельные данные с большим N и относительно малым Т.
* 5
это подразумевает, что сначала с помощью преобразования данных мы исключаем индивидуальные эффекты а,. Чтобы увидеть это, сначала заметим, что а.
У,- = ot, + х' (3 + ё/( (10.8) ®
t
где у,= 7"~1 J2 t Уп и аналогично для других переменных. Следовательно, мы можем написать ^
У/,-У/= (*/,-*/)'3 + (е/(-ё;). (10.9)
Это — модель регрессии в отклонениях от индивидуальных средних и она не включает индивидуальные эффекты а,. Преобразование, которое переводит наблюдения в отклонения от индивидуальных средних как в регрессии (10.9), называется внутригрупповым преобразованием. МНК-оценку для вектора неизвестных параметров (3, полученную из этой преобразованной модели, часто называют внутригрупповой МНК-оценкой, или оценкой с фиксированными эффектами, и она в точности идентична МНК ФП-оценке, описанной выше. Эта оценка задается в виде
Если предполагается, что все хп независимы от всех еп (сравните с предположением (А2) из гл. 2), то можно показать, что оценка с фиксированными эффектами будет несмещенной для вектора неизвестных параметров (3. Кроме того, если накладывается условие нормальной распределенности остатков е,,, то (3ФЭ также имеет нормальное распределение. Для состоятельности7 требуется, чтобы
Е{(х„-х,)е,,} = 0 (10.11)
(сравните с предположением (А7) из гл. 2 и 5). Для этого достаточно, чтобы хп не был коррелирован с е/( и чтобы х, не имел никакой корреляции с остатками модели. Эти условия в свою очередь обеспечиваются условиями
Е{х,,е,5} = 0 для всех я Г, (10.12)
при выполнении которых мы называем переменные в векторе хп строго экзогенными. Строго экзогенная переменная не должна зависеть от текущих, будущих и прошлых значений остатков. Возможно, что в некоторых приложениях такое условие является ограничительным. Ясно, что оно исключает включение лагированных зависимых переменных в вектор хп, но любая переменная вектора хи, которая зависит от предыстории уп, также нарушила бы это условие. Например, если мы объясняем предложение труда индивидуума, то мы можем захотеть включить в модель годы трудового опыта, несмотря на то, что совершенно ясно, что опыт работы зависит от трудовой предыстории человека.
Если объясняющие переменные независимы от всех остатков, то N свободных членов оцениваются несмещенно как
а,=У,-х/3ФЭ,/' = 1.....N.
По предположению (10.11) эти оценки состоятельны для фиксированных эффектов а, (по Г стремящемуся к бесконечности). Причина, почему оценки а, несостоятельны по N —► оо при фиксированном Т, ясна: если Тфиксировано, то индивидуальные средние у, и х, при возрастании числа индивидуумов никуда не сходятся.
Предполагая, что остатки е)( являются независимо и одинаково распределенными (по индивидуумам и по времени) с дисперсией а2с, ковариационная матрица для оценки с фиксированными эффектами (3ФЭ задается в виде
99
He 1 2006
Е Е (x„-x(.)(xft-x,)'
/ = 1 ( = 1
(10.13)
Если Г не является большим, то применение стандартной МНК-оценки для ковариационной матрицы, основанной на внутригрупповой регрессии (10.9), будет недооценивать истинную дисперсию. Причина заключается в том, что в этой преобразованной регрессии ковариационная матрица ошибок является вырожденной (поскольку Т преобразованных ошибок каждого индивидуума дают в сумме нуль), и дисперсия разности е/(-в, равна (7 —1)/7<rf, а не аге. Состоятельная оценка для дисперсии <те2 получается как внутригрупповая остаточная сумма квадратов, деленная на множитель N (7-1). Таким образом,
.. Е Е (У,/ ~ х'и Рфэ)2 =
N (7-1) / = 1 , = 1
= 1ГГГТ\ £ Ъ (Уп-У-{х,,-х,)'Рфэ)2- 00.14)
N(I — 1) / = 1 ! = 1
Можно скорректировать обычные степени свободы вычитанием К в знаменателе. Заметим, что применение стандартной ковариационной матрицы МНК в модели (10.7) с N индивидуальными фиктивными переменными (манекенами) оправдано, поскольку коррекция степеней свободы включает N дополнительных неизвестных параметров, соответствующих индивидуальным свободным членам. При слабых условиях регулярности оценка с фиксированными эффектами асимптотически нормальна, так что можно использовать обычные статистические процедуры (например, Г-критерий и критерий Вальда).
По существу, модель с фиксированными эффектами сфокусирована на различиях «внутри» индивидуумов. Т.е. на объяснении, до какой степени у,( отличается от у(, а не на объяснении, почему у, отличается от у.. С другой стороны, параметрические предположения о векторе 3 накладывают условие, что изменения в х влияют на у одинаково (при прочих равных условиях), является ли это изменением от одного такта времени к другому или изменением от одного индивидуума к другому. Однако интерпретируя результаты для регрессии с фиксированными эффектами, возможно, важно понять, что параметры идентифицируются только через внутрииндивидуальную (или, что то же, внутригрупповую) размерность данных.
10.2.2. Модели со случайными эффектами
В регрессионном анализе обычно предполагается, что все факторы, которые влияют на зависимую переменную, но которые не были включены в качестве регрессоров, соответственно могут в итоге суммироваться в случайном остаточном члене уравнения. В нашем случае это приводит к предположению, что эффекты а, являются случайными факторами, независимо и одинаково распределенными по индивидуумам. Таким образом, мы записываем модель случайных эффектов в
I
í I
i виде g
•с
yit=\L+x'it 3 + a,+e/f,
| е„~НОР(0, о*): а,-НОР(О, О, (10.15) в
I
о где а, +в/( рассматривается как остаточный член, состоящий из двух компонент: индивидуальной специ-
| фической компоненты, которая не изменяется во времени, и компоненты остатка, которая, как предполагает-ся, является некоррелированной во времени. Таким образом, вся корреляция остаточных членов во времени
5 приписывается индивидуальным эффектам а,. Предполагается, что а1 и в/( взаимно независимы и независи-
100 X
мы от хjs (для всех j и s). Это означает, что МНК-оценки для |i и 0 в модели со случайными эффектами (10.15) * являются несмещенными и состоятельными. Структура компонент остатков подразумевает, что составной ос- ^ таток а+е/г будет иметь определенный вид автокорреляции (если только ст^ ^ 0) Следовательно, обычно вы- щ числяемые стандартные ошибки для МНК-оценок некорректны, и можно получить более эффективную оценку § (ОМНК-оценку), используя структуру ковариационной матрицы остатков. ^
Чтобы получить ОМНК-оценку8, сначала заметим, что для индивидуального / все члены ошибок можно скомпоновать в виде а,-ir+ е(., где i т = (1,1,..., 1)' размерности Т и е,=(е(1..........Ко-
вариационная матрица этого вектора равна (см. (Hsiao, 1986, р. 34)).
1/ { a, i т + е,■} = П = а\l т 1Т + агс Iт, (10.16)
№ 1 2006
где I т — 7"-мерная единичная матрица. Эту ковариационную матрицу можно использовать, чтобы получить ОМНК-оценку для параметров модели со случайными эффектами (10.15). Для каждого индивидуума
мы можем преобразовать данные, умножая слева векторы у, =(у/1.....У,тУ и Т-Д- на матрицу ГГ 1
которая задается как
_2
О-1
и которую также можно записать в виде
- 2
LTi
ТЬТ
П"1
UT- j чО+'Фу чч
где
•Ф =
о'+То
2 '
Заметив, что 1Т — (1/7") 1ть'т преобразует данные в отклонения от индивидуальных средних, а (1/7") 1Т1Т, принимает индивидуальные средние значения, ОМНК-оценку для вектора неизвестных параметров 3 можно написать как
0омнк —
N Т
£ £ (x„-x1)(x,i-x,)' + ^7 £ (х,-х)(х,-х )'
N Т
(10.17)
£ £(х,,-х,)(у,.(-у,) + ^Г £ (х,-х)(у,-у )
где х = (1/(Л/"Г))Еи х„ обозначает общее среднее вектора хп. Легко видеть, что при гр = 0 приходим к оценке с фиксированными эффектами. Поскольку -ф —> 0 при 7" —> оо, то из этого следует, что для большого Г оценка с фиксированными эффектами и оценка со случайными эффектами эквивалентны. Если ч|> = 1, то ОМНК-оценка просто является МНК-оценкой (и О, является диагональной матрицей). Из общей формулы для ОМНК-оценки можно получить, что
Ромнк=Д0 +(/*-Д)(3 ФЭ,
где
0 -
£ (х,-х)(х,-х )' Е (х,-х)(у,-у )
i = 1
8Возможно, полезно снова прочитать общее введение в ОМНК-оценивание в разд. 4.2.
He 1 2006
является так называемой межгрупповой оценкой для вектора неизвестных параметров Она является обычной МНК-оценкой вектора параметров (3 в модели для индивидуальных средних
у,=ц + х;р +а(.+ё/м / = 1.....N. (10.18)
Матрица Д является матрицей весов, она пропорциональна обращению ковариационной матрицы оценки (Зм (подробности см. в работе (Hsiao, 1986, р. 36)). Таким образом, ОМНК-оценка является матрично-взвешенным средним межгрупповой и внутригрупповой оценок, где веса зависят от соотношения дисперсий этих двух оценок (более точная оценка получает больший вес).
Межгрупповая оценка игнорирует любую внутригрупповую информацию. ОМНК-оценка при сделанных предположениях является оптимальной комбинацией внутригрупповой и межгрупповой оценок и поэтому более эффективна, чем любая из этих двух оценок в отдельности. МНК-оценка (с г|; = 1) также является линейной комбинацией этих двух оценок, но не является эффективной оценкой. Таким образом, как обычно, ОМНК-оценки более эффективны, чем обычные МНК-оценки. Если объясняющие переменные независимы от всех e/f и всех а/( то ОМНК-оценка является несмещенной. Она является состоятельной оценкой по N или Т, или N и Т, одновременно стремящимся к бесконечности, если в дополнение к условию (10.11) также справедливо, что Е{х, е/(} = 0 и наиболее важно, что
Е {х, а,} = 0. (10.19)
Заметим, что эти условия также требуются для состоятельности межгрупповой оценки.
Легкий способ вычисления ОМНК-оценки получается, если заметить, что ее можно определить как обычную МНК-оценку для преобразованной модели (см. гл. 4), имеющей вид
(У, - 0 У,) = V- О ■- ■+ (* /, - в *,) + и,,, (10.20)
где тЭ = 1 — V2. Остатки в этой преобразованной регрессии являются независимо и одинаково распределенными по индивидуумам и времени. Опять заметим, что -ф = 0 соответствует внутригрупповой оценке (Ф=1). В общем, фиксированная доля тЗ индивидуальных средних вычитается из данных, чтобы получить эту преобразованную модель (0 < тЗ < 1).
Конечно, компоненты дисперсии ст2 и ст2 на практике неизвестны. В таком случае мы должны использовать реализуемую ОМНК-оценку (РОМНК), где на первом шаге состоятельно оцениваются неизвестные дисперсии. Оценка дисперсии a J легко получается из внутригрупповых остатков, как это дано в выражении (10.14). В межгрупповой регрессии дисперсия остатка равна а2 +(1 /Г) а2, которую мож-§ но оценить состоятельно в виде
I ст2 =1 Е <У-»м-х$и)г. 00.21)
х N / = 1
£ I
8 ст2 аг_1 г (1022)
г т
S
^ Снова возможно скорректировать эту оценку применением коррекции степеней свобо-
| ды, подразумевая, что число регрессоров К +1 вычитается в знаменателе выражения (10.21)
§ (см. (Hsiao, 1986, р. 38) или (Baltagi, 1995, р. 15)). Полученная РОМНК-оценка называется оцен-
о кой со случайными эффектами для вектора неизвестных параметров р (и ц) и ниже обоз-
| начается как (Зсэ. .
g При слабых условиях регулярности функция оценка со случайными эффектами асимптотически
5 нормальна. Ее ковариационная матрица задается как
где |хм — межгрупповая оценка ц. Отсюда следует состоятельная оценка для дисперсии <та
102
Nb 1 2006
N Т
!/{Рсэ}=а
N I , N
Е Е (xit-xi)(xit-xi)' + ^T £ (х,-х)(х!-хУ
: 1 / = 1 1=1
*
(10.23) I &
со о
5
которая показывает, что оценка со случайными эффектами более эффективна, чем оценка с фиксирован- t ными эффектами до тех пор, пока "ф > 0. Выигрыш в эффективности обусловлен применением межгрупповой вариации в данных ( х,-х ). Ковариационная матрица (10.23) обычно оценивается по МНК для преобразованной модели (10.20).
В итоге мы увидели ряд оценок для вектора неизвестных параметров (3. Основные две оценки следующие:
1. Межгрупповая оценка, использующая межгрупповую размерность данных (различия между индивидуумами), определенная как МНК-оценка для регрессии индивидуальных средних у по индивидуальным средним х (и константе). Состоятельность при N —> оо требует, чтобы выполнялись условия Е {х,-а,| = 0 и Е {х,ё,} = 0. Обычно это означает, что объясняющие переменные являются строго экзогенными и некоррелированными с индивидуальным специфическим эффектом аг
2. Внутригрупповая оценка с фиксированными эффектами, использующая внутригрупповую размерность данных (различия внутри индивидуумов), определенная как МНК-оценка для регрессии в отклонениях от индивидуальных средних. Она состоятельна для вектора неизвестных параметров 0 при Т —> оо или N —у оо при условии, что справедливо Е{(хп— х,) е,(} = 0. И опять состоятельность требует, чтобы х-переменные были строго экзогенными, но это не налагает никаких ограничений на соотношение между а, и хп.
Другие две оценки следующие:
3. МНК-оценка, использующая обе размерности (внутригрупповую и межгрупповую), но не эффективно. Определяется (конечно) как МНК-оценка для исходной модели. Состоятельность при 7" —> оо или Л/—► ос- требует выполнения условия £f{x/t(e/(+ at) } = 0. Состоятельность требует, чтобы объясняющие переменные были некоррелированными с а(, но не требует наложения условия их строгой экзогенности. Требуется также, чтобы х/( и е/( были «одновременно» некоррелированными (contemporaneously uncorrelated).
4. РОМНК-оценка со случайными эффектами, комбинирующая информацию из межгрупповой и внутригрупповой размерности эффективным образом. Она состоятельна при Т —юо или при Л/ —> оо при допущениях, сформулированных для оценок в пп. 1 и 2. Ее можно определить как взвешенное среднее межгрупповой и внутригрупповой оценок или как МНК-оценку в регрессии, где переменные преобразованы к виду y(f — ■dyjl где Ф является оценкой для = 1 — -ф172 с ф=<ге2/Кг + 7-0.
10.2.3. Фиксированные эффекты или случайные?
Как рассматривать индивидуальные эффекты а(: как фиксированные или как случайные? — вопрос нелегкий для ответа. Можно привести удивительные различия в оценках неизвестных параметров (3 в случаях, если Тмало, а N является большим. Когда для каждого индивидуума имеется только несколько наблюдений во времени, очень важно наиболее эффективное использование данных. Самая общая точка зрения состоит в том, что обсуждение не должно касаться «истинной природы» эффектов а Соответствующая интерпретация заключается в том, что подход фиксированных эффектов является условным по значениям эффектов а,,Т.е., по существу рассматривается распределение у([ при заданных эффектах а,, где эффекты а, можно оценить. Интуитивно такая интерпретация имеет смысл, если индивидуумы в выборке «одного типа», и не могут рассматриваться как случайные извлечения из некоторой лежащей в основе генеральной совокупности. Вероятно, что такая интерпретация наиболее уместна, когда / обозначают страны, большие компании или отрасли промышленности, и мы хотим получить прогнозы для конкретной страны, компании или отрасли промышленности. Таким образом, выводы относятся только к тем эффектам, которые находятся в выборке.
Нв 1 2006
Напротив, подход случайных эффектов не является условным по индивидуальным эффектам «,, а «исключает их объединением в одно целое». В этом случае обычно мы не заинтересованы в конкретном значении эффекта а, для некоторого индивидуума; мы просто сфокусированы на случайно выбранных индивидуумах, которые имеют определенные характеристики. Подход случайных эффектов позволяет сделать вывод относительно характеристик генеральной совокупности. Один из способов формализовать различие в подходах состоит в том, чтобы отметить, что в модели со случайными эффектами утверждается
Заметим, что коэффициенты 0 в этих двух условных математических ожиданиях будут одинаковыми, если только справедливо условие Е{ а, I х[(| = 0. Суммируя эти соображения, можно сказать, что первая причина, почему можно предпочесть оценку с фиксированными эффектами, заключается в том, что эффекты а, представляют некоторый интерес, который имеет смысл, если число индивидуальных единиц относительно мало и имеет определенную природу. Т.е. важна идентификация индивидуальных единиц.
Однако даже если мы заинтересованы в большей генеральной совокупности индивидуальных единиц и кажется подходящей структура случайных эффектов, оценка с фиксированными эффектами может быть предпочтительнее. Причина состоит в том, что возможен случай коррелированности а, и х|(, в котором подход случайных эффектов, игнорирующий эту корреляцию, приводит к несостоятельным оценкам. Мы видели это в вышеприведенном примере, в котором эффекты а, включали качество управления и аргументировалась их коррелированность с другими производственными затратами, включенными в производственную функцию. Проблему корреляции между индивидуальными эффектами а, и объясняющими переменными в векторе хп можно решить, применив подход фиксированных эффектов, который по существу исключает эффекты о , из модели и тем самым устраняет любые проблемы, которые могут быть связаны с этими эффектами.
Хаусман (НаиБтап, 1978) предложил тестирование нулевой гипотезы некоррелированности хп и а,. Общая идея теста Хаусмана состоит в том, что сравниваются две оценки: оценка, которая состоятельна как при нулевой гипотезе, так и при альтернативной гипотезе, и оценка, которая состоятельна (и, как правило, эффективна) только при нулевой гипотезе. Значимое различие между этими двумя оценками указывает, что нулевая гипотеза вряд ли будет справедлива. В настоящем случае предположим, что Й для всех 5 и Г выполняется условие Е{ е/( х( 5 } = 0, так что оценка с фиксированными эффектами [3ФЭ | является состоятельной для вектора неизвестных параметров 3 независимо оттого, коррелированы ли ч: хп и атогда как оценка со случайными эффектами (3ФЭ состоятельна и эффективна, только если х/( | и некоррелированы. Рассмотрим вектор разностей 0ФЭ — 0СЭ. Чтобы оценить значимость этих раз-^ ностей, нам потребуется ковариационная матрица вектора разностей. В общем, требовалось бы оценить | ковариационную матрицу между векторами 0ФЭ и 0СЭ, но поскольку последняя функция оценивания с эффективна при нулевой гипотезе, то можно показать, что (при нулевой гипотезе)
Е{У„ I х1,) = х'„ 0,
тогда как в модели с фиксированными эффектами оценивается
Е[у,,\ х,(, гу.( } = х'( 0 + а
(10.25)
(10.24)
где У — оценки истинных ковариационных матриц. При нулевой гипотезе, которая неявно говорит, что рНт (0ФЭ — Зсэ) = 0, статистика имеет асимптотическое хи-квадрат распределение с К степенями свободы, где К— число элементов в векторе 0.
(10.26)
(10.27)
Не 1 2006
Таким образом, критерий Хаусмана тестирует, значимо ли различие оценок с фиксированными и слу- g чайными эффектами. В вычислительном отношении провести такое тестирование относительно легко, о. поскольку ковариационная матрица удовлетворяет соотношению (10.26). Важная причина, почему эти в две оценки могут быть различны, заключается в существовании корреляции между хп и а, хотя дру- S гие виды неправильной спецификации также могут объяснить отклонение нулевой гипотезы (мы увидим ^ такой пример ниже). Практическая проблема при вычислении критической статистики (10.27) состоит в том, что ковариационная матрица в квадратных скобках может быть неположительно определенной в конечных выборках, так что ее обращение нельзя вычислить. В качестве альтернативы можно проводить такое тестирование лишь для подмножества элементов в векторе (3.
10.2.4. Качество подгонки данных моделью
Вычисление мёр качества подгонки данных моделью в приложениях панельных данных несколько необычно. Одна из причин состоит в том, что можно по-разному оценивать важность объяснения внутригрупповой и межгрупповой вариации в данных. Другая причина заключается в том, что обычный или скорректированный («adjusted») критерии R2 уместны только тогда, когда модель оценивается с помощью МНК.9 Наша отправная точка состоит в определении Я2 в терминах квадрата коэффициента корреляции между фактическими и прогнозными значениями, как это представлено в параграфе 2.4 (см. соотношение (2.44)). Такое определение имеет определенное преимущество, поскольку приводит к значениям, находящимся внутри интервала [0,1] независимо от вида функции оценивания, которая применяется для получения прогнозных значений. Напомним, что это определение соответствует стандартному определению ft2 (в терминах сумм квадратов), если модель оценивается с помощью МНК (при условии включения свободного члена). В текущем контексте полную вариацию переменной уп можно записать в виде суммы внутригрупповой и межгрупповой вариаций, т.е.
Т^Е(У,,-У)2 = Т^Е(У,(-У,)г + ^Е(У,-У)2, 00.28)
N I i.t N I i, t N i
где у обозначает общее выборочное среднее. Теперь мы можем определить альтернативные версии меры R2 в зависимости от размерности анализируемых данных.
Например, оценка с фиксированными эффектами выбирается, чтобы наиболее полно объяснить внутригрупповую вариацию, и поэтому максимизируется «внутригрупповой ft2», заданный в виде
Яв2н (Рфэ) = согг2 { y,.f -У,ФЭ, уп-у,}, (10.29)
где у®э-у,ФЭ = (xjt — х1)' (3ФЭ, а согг2 обозначает квадрат коэффициента корреляции. Межгрупповая оценка, являясь МНК-оценкой для модели в терминах индивидуальных средних, максимизирует «межгрупповой ft2», который мы определяем как
Я «еж (Им) = согг2{у^ у,}, (10.30)
где у,м = х'(Зм. МНК-оценка максимизирует общую меру качества подгонки данных моделью и таким образом максимизирует общий ft2, который определяется в виде
«о6щ„й(Р) = corr2{yip уи), (10.31)
где уп = х'и b . Возможно определить внутригрупповой, межгрупповой и общий R2 для произвольной оценки 0 вектора неизвестных параметров (3, применяя в качестве прогнозных значений значения у.( = х',(3, у,- =(1/V)Ety„ и у = (M(NT)) £у/(, где свободные члены исключены (и неуместны).10 При этом оценками с фиксированными эффектами игнорируется вариация, улавливае-
9 См. соотношения, соответственно, (2.42) и (2.45) в гл. 2 (прим. научн. ред. пер.).
10 Эти определения соответствуют мерам R2, которые вычисляются в статистическом пакете программ Stata 5.0.
N_1£!
Не 1 2006
мая эффектами а,- Если мы учитываем вариацию, объясненную N оцененными свободными членами а(, то модель с фиксированными эффектами полностью «подгоняет» межгрупповую вариацию. Хотя это несколько неудовлетворительно, поскольку трудно утверждать, что фиксированные эффекты а, объясняют вариацию между индивидуумами, они только улавливают ее. Выражаясь по-другому, если мы спрашиваем себя: почему индивидуум / в среднем потребляет больше, чем другой индивидуум, то ответ, предоставляемый эффектами а,, есть просто: «потому, что это индивидуум /». Учитывая этот аргумент и что эффекты а,- часто не вычисляются, кажется уместным игнорировать эту часть модели.
Приняв данное выше определение в терминах квадратов коэффициентов корреляции, три определенные выше меры можно вычислить для любой из оценок, которые мы рассматривали. Если мы берем оценку со случайными эффектами, которая является (асимптотически) наиболее эффективной, при условии справедливости нашего предположения о действии случайных эффектов, то внутригруп-повая, межгрупповая и общая меры И2 обязательно меньше, чем соответствующие меры для фиксированных эффектов, межгрупповой и МНК-оценок, соответственно. Это опять подчеркивает, что меры качества подгонки данных моделью нецелесообразно использовать при выборе между альтернативными методами оценивания. Однако эти меры предоставляют возможные критерии выбора между альтернативными (потенциально не вложенными) спецификациями модели.11
10.2.5. Альтернативные оценки метода инструментальных переменных
Метод оценивания с фиксированными эффектами исключает из модели все, что не зависит от времени. Возможно, это высокая цена, которую следует заплатить, чтобы позволить включить в модель помимо переменных х индивидуальную специфицированную гетерогенность а,.Скажем, мы можем интересоваться влиянием не зависящих от времени переменных (например, пола) на заработную плату индивидуума. В действительности не существует никакой потребности ограничить внимание предположениями существования только фиксированных и случайных эффектов, поскольку возможно получить оценки методом инструментальных переменных, который можно рассматривать в качестве промежуточного подхода между подходами фиксированных и случайных эффектов.
Чтобы это увидеть, прежде всего заметим, что оценку с фиксированными эффектами можно записать в виде
ЗфЭ —
N Т
ЕЕ (х,[-х,)(х,[-х,)'
/ = 1 (= 1
Е Е (х,(-х,)(у„-у,) =
(10.32)
ЕЕ (х,(-х,)хЧ ЕЕ {хп-х,)у„
^ ч / = 1 (= 1 ;/ = к = 1
3
£ Такая запись оценки показывает, что она может быть интерпретирована как оценка метода инстру-
4 ментальных переменных12 для вектора неизвестных параметров (3 в модели
К
£ л
| где каждая объясняющая переменная инструментована своим значением отклонения от индивидуаль-с
£ &
I I
5
о
аГ 11 В рамках одного и того же метода оценивания. Речь может идти, например, о формировании набора объясняющих пе-§ ременных {прим. научн. ред. пер.).
Уп +х', 3 + а,+в|(,
1 инструментована своим зна ного специфицированного среднего значения. То есть вектор хп инструментован векторной разностью х;( -X;. Заметим, что по построению справедливо условие Е{{хИ -х() а,} = 0 (если мы берем математические ожидания по индексам / и г), так что ИП-оценка является состоятельной при условии Е{(хИ — х,) в/(} = 0, которое подразумевает строгую экзогенность переменных в векторе хп. Ясно, если известно, что специфическая переменная в векторе хИ некоррелирована с эффектом а,, то ее
5
12 Возможно, полезно освежить в памяти параграф 5.3, где дается общее обсуждение оценивания методом инструментальных
§ переменных.
106
Hb 1 2006
обеспечение инструментальной переменной не требуется; т.е. эту переменную можно использовать в g
качестве ее собственной инструментальной переменной. Такой способ может позволить нам оценивать о.
также влияние переменных, не зависящих от времени. <а
Чтобы описать общий подход, рассмотрим линейную модель с четырьмя группами объясняющих а
переменных (Hausman, Taylor, 1981) Ц
У а = И +<„ ß,+*2i/f ß2+w',li+w2il2 + °-,+^it' 0°-33)
где х-переменные изменяются во времени, а w-переменные не зависят от времени. Предполагается, что переменные с индексом 1 некоррелированы с эффектом а, и со всеми членами ошибок e)S. Переменные хг /t и wzj коррелированы с эффектом а, , но не с любым членом ошибки eis. При этих предположениях функция оценивания фиксированных эффектов была бы состоятельной для векторов неизвестных параметров ß1 и ß2, но не идентифицировала бы коэффициенты при переменных, не зависящих от времени. Кроме того, она неэффективна, поскольку вектор х1 /( в этом случае инструментован без необходимости. Хаусман и Тэйлор (Hausman, Taylor, 1981) предложили оценивать модель (10.33) методом инструментальных переменных, используя в качестве инструментальных следующие переменные: п, и/ьих2 ,(-х2,, хи. То есть экзогенные переменные служат в качестве их собственных инструментов, вектор х2 /( инструментован своим отклонением от вектора индивидуальных средних (как в подходе фиксированных эффектов), а вектор w2l инструментован вектором индивидуальных средних для вектора х1 п. Очевидно, идентификация требует, чтобы число переменных в векторе х1 п было, по крайней мере, не меньше числа переменных в векторе w2j. Полученная оценка, оценка Хаусмана-Тэйлора, позволяет нам оценивать эффекты переменных, не зависящих от времени, даже, несмотря на то, что изменяющиеся во времени регрессоры коррелированы с эффектом а,. Если переменные, не зависящие от времени, предполагаются также коррелированными с эффектом а,-, то их также следует обеспечить инструментальными переменными, и мы потребуем, чтобы включалось достаточное количество переменных, зависящих от времени, которые не коррелированы с эффектом а,. Конечно, существует прямое расширение для включения дополнительных инструментальных переменных в процедуру, которые не основаны на переменных, включенных в модель. К такому приему прямого расширения прибегают в случае пространственных данных, где не существует никаких доступных преобразований, которые могли бы быть аргументированы для предоставления обоснованных инструментальных переменных. Главное преимущество подхода Хаусмана-Тэйлора состоит в том, что не требуется применение внешних инструментальных переменных. При достаточных предположениях инструментальные переменные можно получить внутри модели. Несмотря на это важное преимущество, оценка Хаусмана-Тэйлора играет удивительно незначительную роль в текущей эмпирической работе.
Хаусман и Тэйлор также показали, что множество инструментальных переменных эквивалентно применению х11(-х1(, х 2 . ( — х 2, и х1У(, wu. Это следует непосредственно из того факта, что взятие разных линейных комбинаций исходных инструментальных переменных не влияет на оценку. Хаусман и Тэйлор также показали, как в модели (10.33) можно использовать недиагональную ковариационную матрицу остатков, чтобы улучшить эффективность оценки. В настоящее время оценивание, как правило, проводится в рамках обобщенного метода моментов (ОММ), что мы увидим в параграфе 10.3 (см. (Arellano, Bover, 1995)).
В двух статьях, последовавших за (Hausman, Taylor, 1981), делались попытки улучшить эффективность оценки методом инструментальных переменных Хаусмана-Тэйлора, с помощью введения большего множества инструментальных переменных. В статье (Amemiya, MaCurdy, 1986) предлагается также применение не зависящих от времени инструментальных переменных от x1jf-x1( вплоть до x1)T-x1j. Это требует, чтобы для каждого t выполнялось условие Е{(х хп -х ь) а,} = 0. Такое предположение имеет смысл, если корреляция между а, и х1 обусловлена наличием не зависящей от времени компоненты в векторе х, ц такой, что Е{х 1 И а;) для данного t не зависит от t. В статье (Breusch, Mizon,
\_
Ms 1 2006
Schmidt, 1989) представлен подробный обзор литературы по этой тематике и в качестве дополнительных инструментальных переменных предлагается применение не зависящих от времени переменных от X2,n~X2i Д° Х 2, / т ~ х г /•
10.2.6 Альтернативные структуры остатков
В моделях со случайными эффектами и моделях с фиксированными эффектами предполагается, что присутствие а, улавливает всю корреляцию между ненаблюдаемыми переменными в различные периоды времени. Таким образом, предполагается, что остатки е,(, являются некоррелированными по индивидуумам и времени. При условии, что переменные в векторе х.( строго экзогенны, присутствие автокорреляции в остатках е(| не приводит к несостоятельности стандартных оценок. Однако стандартные ошибки и получающиеся критерии становятся недействительными (точно так же, как в гл. 4). Кроме того, это будет означать, что оценки больше не эффективны. Например, если истинная ковариационная матрица не удовлетворяет выражению (10.16), то оценка со случайными эффектами больше не соответствует РОМНК-оценке вектора неизвестных параметров р. Как мы знаем, присутствие гетероскедастичности в остатках е|( или в эффектах а, для модели со случайными эффектами имеет аналогичные последствия.
Один из способов избежать вводящих в заблуждение выводов без необходимости налагать альтернативные предположения на структуру ковариационной матрицы остатков О, состоит в использовании МНК-оценки для вектора неизвестных параметров (3 и одновременно коррекции ее стандартных ошибок в соответствии с общими формами гетероскедастичности и автокорреляции. Рассмотрим следующую модель13
у„= а,+х;(0 +ип,
(10.34)
без предположения, что и п имеет некоторую структуру из компонент остатков. Состоятельность МНК-оценки
\-1
Е Е х п х п
/ = 1i = i
N Т
Е Е *„у,
i=1 (=1
вектора параметров ß требует, чтобы выполнялось условие
Е{х,,и,,} = 0.
(10.35)
(10.36)
й I
а £
i
§
S 0)
I 10
0
1
Предполагая, что остатки для различных индивидуумов являются некоррелированными (Е{ипи1е} = 0 для всех /' у) ковариационную матрицу МНК-оценки можно оценить по Невье-Весту из гл. 4, т.е.
V{b} =
NT nii /v /
Е Е х„х„ Е Е Е ultuisx ltx'!S Е Е хпх'п / = 1 i = 1 .... ...
N Т Т
I
1 = 1 1 = 1 S = 1
N Т
Е Е
(=1(=1
-1
(10.37)
где ин обозначает МНК-оцененный остаток. Эта оценка учитывает общие формы гетероскедастичности, так же как и автокорреляции (внутригрупповой). Если гетероскедастичность исключается априори, среднюю матрицу в выражении (10.37) можно заменить матрицей
N Т Т
Е Е Е
/ = 1 ( = 1 s = 1
1 N
77 Е UitUis N i = 1
Х it Х is'
(10.38)
где (1/Л/)Е ь=1 ипи!з состоятельная оценка для матрицы = Е{ипи1в}.
Если бы остаток иИ имел не зависящую от времени компоненту а,, которая могла бы быть коррелирована с объясняющими переменными, то оценка с фиксированными эффектами
3Для удобства обозначений предполагается, что 8 вектор х включена константа.
108 ^
Нв 1 2006
была бы более уместна, чем МНК-оценка, и могла бы быть использована аналогичная коррекция для гетероскедастичности и автокорреляции (в остатках в/() (Arellano, 1987). Получающееся выражение было бы подобно выражению (10.37), но каждый вектор xjt заменялся бы внутригруп- ® повым преобразованием хи — х,., а МНК-оцененный остаток — внутригрупповым МНК-оценен- § ным остатком (см. (Baltagi, 1995, р. 13)). ^
Если нелишне специфицировать определенные предположения о форме гетероскедастичности или автокорреляции, то можно получить более эффективные оценки, чем МНК-оценка или оценка с фиксированными эффектами, используя известную структуру ковариационной матрицы остатков и применяя РОМНК или метод максимального правдоподобия. Краткий обзор ряда таких оценок, которые в вычислительном отношении являются, как правило, малопривлекательными, представлен в (Baltagi, 1995, Chapter 5). В монографии (Kmenta, 1986) предлагается относительно простая РОМНК-оценка, которая учитывает автокорреляцию первого порядка в остатках uit вместе с индивидуальной специфической гетероскедастичностью, но не учитывает компоненту, зависящую от времени в остатках uit (см. (Baltagi, 1996)).
10.2.7. Тестирование на наличие гетероскедастичности и автокорреляции
Большинство тестов, которые можно применить для тестирования на наличие гетероскедастичности или автокорреляции в модели со случайными эффектами, вычислительно обременительны. Для модели с фиксированными эффектами, которая по существу оценивается с помощью МНК, проведение такого тестирования относительно менее сложно. К счастью, можно использовать оценку с фиксированными эффектами, даже если мы делаем предположение о случайных эффектах, т. е. о том, что эффекты а, являются независимо и одинаково распределенными случайными величинами, независимыми от объясняющих переменных. Поэтому и в случае модели со случайными эффектами можно использовать процедуры тестирования, как это делается в модели с фиксированными эффектами.
Довольно простое тестирование на наличие автокорреляции в модели с фиксированными эффектами основано на тесте Дарбина-Уотсона, обсужденном в гл. 4. Альтернативная гипотеза состоит в том, что
00.39)
где vп являются независимо и одинаково распределенными по индивидуумам и времени. Этим учитывается автокорреляция во времени с ограничением, что каждый индивидуум имеет один и тот же коэффициент автокорреляции р. Нулевой гипотезой при тестировании является гипотеза Н0 : р = 0 против односторонней альтернативной гипотезы р<0 или р > 0. Пусть еп обозначают остатки внутригрупповой регрессии (10.9) или, что эквивалентно, остатки регрессии с фиктивными переменными (10.7). Для такого случая в статье (Bhargava, Franzini, Narendranathan, 1983) предлагается следующее обобщение статистики Дарбина-Уотсона:
NT
Е Е (е,-
dWp = i="=2N Т-■ (10-4°)
Е Е Еп
¡=1 i=i
Используя такую же логику вывода, как Дарбин и Уотсон, авторы статьи смогли получить нижнюю и верхнюю границы для истинных критических значений, которые зависят только от N,T, и К. В отличие от случая «чисто» временного ряда, область неопределенности теста Дарбина-Уотсона в панельных данных является малой, особенно когда число индивидуумов в панельных данных большое. В табл. 10.1 мы представили некоторые выбранные нижние и верхние границы для истинных 5%-х критических значений, которые можно использовать для тестирования против альтернативной гипотезы наличия положительной автокорреляции. Числа в таблице подтверждают, что области неопределенности являются малыми, а также показывают, что варьирование критических значений, обусловленное измене-
нием К, N или Т, весьма ограничено. В модели с тремя объясняющими переменными, оцененными для 6 периодов времени, нулевая гипотеза Н0 : р = 0 отклоняется на 5% уровне значимости, если р меньше 1,859 для N= 100, или меньше 1,957 для N = 1000, против односторонней альтернативной гипотезы р > 0. Для панельных данных при больших N авторы статьи предложили простое правило тестирования нулевой гипотезы против альтернативной гипотезы наличия положительной автокорреляции: нулевая гипотеза отклоняется, если вычисленная статистика ди/р меньше двух. Поскольку оценка с фиксированными эффектами состоятельна и для модели со случайными эффектами, то этот тест Дарби-на-Уотсона для панельных данных можно использовать также и в модели со случайными эффектами.
Таблица 10.1
5 %-ные нижняя и верхняя границы теста Дарбина-Уотсона для панельных данных
Т= б
Г= 10
К= 3 1,859 1,880 1,939 1,943 1,957 1,950
К= 9 1,839 1,902 1,935 1,947 1,954 1,961
К= 3 1,891 1,904 1,952 1,954 1,967 1,968
К= 9 1,87$ ' 1,916 1,949 1,957 1,965 1,970
Чтобы протестировать наличие гетероскедастичности в остатках е| (, мы можем опять воспользоваться остатками модели с фиксированными эффектами е,(. Вспомогательная регрессия для проведения тестирования строится в виде регрессии квадратов внутригрупповых МНК-оцененных остатков е2 по константе и _/ переменным гп, которые, как предполагается, могут повлиять на гетероске-дастичность. Такой тест является вариантом теста Бреуша-Пагана14 на наличие гетероскедастичности, обсужденного в гл. 4. Альтернативная гипотеза для теста заключается в предположении, что
У[гп}=аЧ7(2», (10.41)
где И — неизвестная, непрерывно дифференцируемая функция с условием /?(0) = 1, а тестируемая нулевая гипотеза задается в виде Н0 : а = 0. При нулевой гипотезе критическая статистика, вычисленная как Л/(7"-1), умноженное на /?2 вспомогательной регрессии, будет иметь асимптотическое хи-квадрат распределение с ] степенями свободы. Альтернативный тест можно построить с помощью вычисления остатков межгрупповой регрессии, и критическая статистика равна /V, умноженному на ^ Я2 вспомогательной регрессии межгрупповых остатков по г, или, более обще, по гп. При
| нулевой гипотезе о гомоскедастичности остатков критическая статистика имеет асимптотическое
4 хи-квадрат распределение со степенями свободы, равными числу переменных, включенных во вспо-| могательную регрессию (за исключением свободного члена). Альтернативная гипотеза такого теста й является менее определенной.
£
| 10.3. Пример: объяснение индивидуальной заработной платы
I
«в а о
5
о
*
В этом параграфе, чтобы оценить уравнение индивидуальной заработной платы, мы применим ряд описанных выше методов оценивания. Данные15 взяты из Молодежной выборки национального
х" 14 В контексте панельных данных термин «тест Бреуша-Пагана» обычно связывается с тестом множителей Лагранжа для мо-
§ дели со случайными эффектами при нулевой гипотезе, что никаких индивидуальных специфических эффектов не существует
g с2а = 0 (см. (Baltagi, 1995, Sect. 4.2.1)). В приложениях этот тест почти всегда отклоняет нулевую гипотезу. S 15 Данные, используемые в этом параграфе, доступны в MALES.
протяженного во времени обследования16, проведенного в США, и представляют собой выборку из | 545 работников-мужчин, занятых полный рабочий день, которые закончили свое обучение в 1980 г., о. а затем работали в течение 1980-1987 гг. Мужчины в выборке молодые, в возрасте от 17 до 23 лет (по в состоянию на 1980 г.), и вышли на трудовой рынок довольно недавно, в среднем с тремя годами опыта § работы на начало выборочного периода. Данные и спецификации, которые мы выбираем, аналогичны ^ тем, что в статье (\/е11а, \/егЬеек, 1998). Логарифм заработной платы объясняется с помощью следующих переменных: времени обучения (в годах), опыта работы (в годах) и его квадрата, фиктивных переменных (манекенов) — членства в профсоюзе (состоит, не состоит), работы в общественном секторе (общественный сектор, частный сектор), семейного положения (женат, холост) и двух расовых фиктивных переменных.
Оценивание17 проводилось с помощью межгрупповой оценки, основанной на индивидуальных средних, и с помощью внутригрупповой оценки, основанной на отклонениях от индивидуальных средних. Результаты оценивания представлены в табл. 10.2. Прежде всего следует заметить, что оценка с фиксированными эффектами (или внутригрупповая оценка) исключает из модели любые переменные, не зависящие от времени. Это означает, что в этом случае влияние времени обучения и расовых фиктивных переменных не учитываются. Различия между двумя рядами оценок кажутся существенными, и мы возвратимся к этому ниже. В следующей колонке представлены результаты МНК-оценивания, примененного к модели со случайными эффектами, в котором стандартные ошибки не скорректированы с учетом структуры компонент остатков. Последний столбец представляет результаты применения РОМНК-оценивания случайных эффектов. Как обсуждалось в пункте 2 параграфа 10.2, дисперсии компонент ошибок а, и е,( можно оценить по внутри- и межгрупповым остаткам. В частности мы, имеем а2и =0,1209 и а2 = 0,1234. Отсюда можно состоятельно оценить а2 как ст2 =0,1209-0,1234/8 = 0,1055. Следовательно,множитель -ф оценивается как
=_-= 0,1276,
0,1234 + 8x0,1055
что приводит к $ = 1--ф1/2 = 0,6428 . Это значит, что РОМНК-оценку можно получить из преобразованной регрессии, где 0,64, умноженное на индивидуальное среднее значение, вычитается из исходных данных. Вспомним, что в МНК-оценке полагают, что -0 = 0, в то время как в оценке с фиксированными эффектами используется условие = 1. Заметим, что значения МНК-оценок и оценок со случайными эффектами находятся внутри интервала с границами: межгрупповые оценки и оценки с фиксированными эффектами.
Если удовлетворяются предположения модели со случайными эффектами, то все четыре оценки в табл. 10.2 состоятельны и оценка со случайными эффектами является самой эффективной. Однако если индивидуальные эффекты а ( коррелированы с одной или более объясняющими переменными, то только оценка с фиксированными эффектами является состоятельной. Такую гипотезу можно протестировать, сравнивая межгрупповую и внутригрупповую оценки, или внутригрупповую оценку с оценкой со случайными эффектами. Оба сравнения приводят к эквивалентным тестам. Самое простое тестирование состоит в проведении теста Хаусмана, обсужденного в п. 3 параграфа 10.2, основанного на сравнении внутригрупповой оценки и оценки со случайными эффектами. Критическая статистика принимает значение, равное 31,75, и отражает различия в коэффициентах при переменных опыта работы, квадрата опыта работы и при манекенах членства в профсоюзе, семейного положения и работы в общественном секторе. При нулевой гипотезе критическая статистика подчиняется хи-квадрат распределению с 5 степенями свободы, так что нам следует отклонить нулевую гипотезу на любом разумном уровне значимости.
16 Речь идет о «Youth Sample of the National Longitudinal Survey» (прим. научн.ред. пер).
" Результаты оценивания в этом параграфе получены с помощью статистического пакета программ Stata 5.0.
Ив 1 2006
Не 1 2006
Таблица 10.2
Результаты оценивания уравнения заработной платы мужчин, по данным за 1980-1987 гг. (в круглых скобках стандартные ошибки)
Зависимая переменная: 1од (\л/аде)
Переменная модели Межгрупповая оценка Оценка с фиксированными эффектами МНК-оценка Оценка со случайными эффектами
константа 0,490 (0,221) -0,034 (0,065) -0,104
время обучения 0,095 (0,011) — 0,099 (0,005) 0,101 (0,009)
опыт работы . , -0,050 (0,050) 0,116 (0,008) 0,089 ' (о,ою) 0,112 0,008)
опыт работы 0,0051 -0,0043 -0,0028 -0,0041
в квадрате (0,0032) (0,0006) (0,0007) (0,0006)
членство 0,274 0,081 0,180 0,106 .
в профсоюзе (0,047) (0,019) (0,017). (0,018)
семейное 0,145 0,045 0,108 0,063
положение (0,041) (0,018) (0,016) (0,017)
афроамериканец -0,139 ; (0,049) — -0,144- , (0,024) -0,144 (0,048)
латино-американец 0,005 (0,043) — 0,016 (0,021) 0,020 (0,043)
работа в общественном секторе -0,056 (0,109) 0,035 (0,039) 0,004 (0,037) 0,030 (0,036)
внутригрупповой Й2 0,0470 0,1782 0,1679 0,1776
межгрупповой Й2 0,2196 0,0006 0,2027 0,1835
общий И2 0,1371 0,0642 0,1866 0,1808
Семейное положение является фиктивной переменной, которая, вероятно, будет коррелирована с ненаблюдаемой гетерогенностью в эффектах а,- Как правило, можно было бы не ожидать значимого причинного влияния семейного положения на заработную плату, поскольку манекен семейного положения обычно улавливает другие (ненаблюдаемые) различия между женатыми и холостыми рабочими. 8 Это подтверждается результатами в таблице. Если мы исключаем индивидуальные эффекты из модели | и рассматриваем оценку с фиксированными эффектами, то влияние манекена семейного положения
4 снижается до 4,5%, тогда как, например, в случае межгрупповой оценки оно составляет почти 15%. | Заметим, что влияние манекена семейного положения в подходе фиксированных эффектов иденти-^ фицируется только через людей, которые изменяют свое семейное положение в течение периода | выборочного обследования. Подобные замечания можно сделать для влияния манекена членства в ® профсоюзе на заработную плату работника. Однако вспомним, что все оценки предполагают некорре-* лированность объясняющих переменных с остатками еп. Если бы такие корреляции существовали, | то даже оценка с фиксированными эффектами была бы несостоятельной. В статье (УеПа, УегЬеек, 1998) | уделяется особое внимание влиянию эндогенного статуса принадлежности к членам профсоюза на § заработную плату работников этой группы и рассматриваются альтернативные, более сложные мето-о ды оценивания.
| Меры качества подгонки данных моделью подтверждают, что оценка с фиксированными эффекта-^ ми приводит к наибольшему внутригрупповому /?2 и таким образом насколько возможно объясняет
5 внутригрупповую вариацию. МНК-оценка максимизирует обычный (общий) критерий Нг, в то время
Не 1 2006
как оценка со случайными эффектами приводит к приемлемым значениям критериев Я2 для всех слу-
чаев. Вспомним, что стандартные ошибки МНК-оценки вводят в заблуждение, поскольку они не при- *§.
нимают в расчет корреляцию различных остатков. Корректные стандартные ошибки для МНК-оценки щ
должны быть больше, чем стандартные ошибки для эффективной РОМНК-оценки, которая учитывает 2
эти корреляции. 5
10.4. Динамические линейные модели
Способность моделировать индивидуальную динамику относится к главным преимуществам панельных данных. Во многих экономических моделях предполагается, что текущее поведение зависит от прошлого поведения (постоянство, формирование навыков, частичная корректировка, и т.д.)18, поэтому во многих случаях хотелось бы оценить динамическую модель на индивидуальном уровне. Способность моделировать индивидуальную динамику с помощью панельных данных уникальна.
10.4.1. Модель авторегрессии панельных данных
Рассмотрим линейную динамическую модель с экзогенными переменными и лагированной зависимой переменной в роли регрессоров, т.е. модель
где предполагается, что остатки еи являются НОП(0, <з\). Для статической модели мы проводили обсуждение состоятельности (устойчивости) и эффективности при выборе между моделями с фиксированными и случайными эффектами . В динамической модели ситуация существенно отличается, поскольку лагированная зависимая переменная у, будет зависеть от эффекта а, независимо от способа, с помощью которого мы анализируем эти эффекты. Чтобы проиллюстрировать проблемы, которые возникают при этом, сначала рассмотрим случай модели, где не включаются никакие экзогенные переменные, и модель представляется в виде:
У,(=ЧУи-1 + а/+е/Р Iпг I < 1- (10.42)
Предположим, что мы имеем наблюдения относительно переменной у,( для тактов времени ( = 0,1..... Т.
Оценка с фиксированными эффектами для неизвестного параметра ^ имеет вид
Е Е (У„-У1)(У,,,_1- У,.-,) Чфэ = ' = 1 г-1- < (1 °-43)
Е Е (У^-У,,^)2
; = 1 ( = 1
где у < = (1/Т)Е? = 1 У,,< а У,-1 = (1/7")53Г=1 У/ <-г Чтобы проанализировать свойства оценки чФЭ, мы можем подставить выражение (10.42) в выражение (10.43) и получить оценку в виде
(1/(Л/7~)) Е Е (£/, - ) (У, (_1 - У, _1) Ъэ = Ч + -—ьГ"г--- ■ (Ю-44)
(1/(Л/7"))Е Е (у, (_1 _ У; -1 )
/=11=1
Однако эта оценка при N —> оо и фиксированном Г смещенная и несостоятельная, поскольку последний член в правой части выражения (10.44) не имеет нулевого математического ожидания и не
18Об этих свойствах динамических моделей речь шла в предыдущих двух главах (прим. науч. ред. пер).
Ня 1 2006
сходится к нулю при N, стремящемся к бесконечности. В частности, можно показать, что (Nickel), 1981; Hsiao, 1986, p. 74)
1 nt ст? (7" — 1) — 7-y + -yr
plim-irE E (e,/~ё;)(у, i„1 — y, = - -г 00-45)
w—too NT i = 1 ( = 1 I (1 —4)
Таким образом, при фиксированном Т мы имеем несостоятельную оценку. Заметим, что эта несостоятельность не вызывается ничем из того, что мы предполагали о эффектах а,, поскольку они исключаются при оценивании. Проблема состоит в том, что внутригрупповая преобразованная лагированная зависимая переменная коррелирована с внутригрупповым преобразованным остатком. Если Т —> оо, то вероятностный предел (10.45) сходится к нулю, так что оценка с фиксированными эффектами является состоятельной для если Т —► оо и N —> оо.
Можно было бы думать, что асимптотическое смещение для фиксированного Г является весьма малым и поэтому реальной проблемы, вроде бы, нет. Конечно, это не так, поскольку для конечного Т смещение едва ли можно игнорировать. Например, если истинное значение параметра ^ равняется 0,5, то можно легко вычислить, что (при N —> оо)
plim ~jFE — -0,25, если Т — 2, plim 4Fe = -0,04, если 7 = 3, plim-fFE =0,33, если Т = 10,
поэтому даже для средних значений Г смещение существенно. К счастью, существуют относительно легкие способы избежать таких смещений.
Для решения проблемы несостоятельности, прежде всего, начнем с другого преобразования, чтобы устранить индивидуальные эффекты а,, в частности, мы возьмем первые разности. Это приводит к модели
У„-Уи-1 = т(Уи-1-Уи-2) + (е/(-еи_1), f = 2.....Т. (10.46)
Если мы оцениваем ее с помощью МНК, то мы не получаем состоятельную оценку для неизвестного параметра ч даже при Т —> оо, поскольку лагированная зависимая переменная уп_: и остатки е( (_1 по определению коррелированы. Однако такая преобразованная спецификация наводит на мысль о применении метода инструментальных переменных. Например, лагированная зависимая переменная у,,_2 коррелирована с разностью у, - у, ,_2, но не с лагированным остатком е/(_-,, если только остаток е)( не обнаруживает автокорреляцию (наличие который мы исключаем по предположению). Тем самым для оценивания неизвестного параметра ^ можно воспользоваться методом S инструментальных переменных19
£ NT
| Е £ Уи_2(У,,г-1-У
я? ; < ♦ о '
Е Е У/,1-2 (Уп-Уи-О Чип = -ir^T1--(Ю.47)
0) / = 1 f = 2 X
S S
Я)
I
Необходимое условие для состоятельности этой функции оценивания заключается в том, что
Р''Г%.,Т1 Е Е (е,(-е/.(-1)У/.,-2 = 0 (10.48)
/V ( / —1) / = 11 = 2
для Тили для N, или одновременно для Ти N, стремящихся к бесконечности. Оценка (10.47) являет-8 ся одной из оценок Андерсона-Хсяо, предложенных в статье (Anderson, Hsiao, 1981). Авторы статьи
5 также предложили альтернативу, где в качестве инструментальной переменной используется раз-«
3
% 15 См. параграф 5.3 для общего введения в оценивание методом инструментальных переменных.
Ms 1 2006
ность у, ,_2 — У,-з ■ Тогда альтернативная оценка методом инструментальных переменных будет иметь вид
Е Е (У,.,_2 -У,.,_3)(У/г -y,,t-i)
V^n = -. (Ю.49)
Е Е (y,,i-2 ~Уи-3 ) (У/(-1 -У/,Г-2 )
/=1(=3
которая является состоятельной (при условиях регулярности), если
Plim .,/т1 0- Е Е (е„-еа-1)(У,.(-2-Уи-з) = 0. (Ю.50)
N(1—2) / = 1 ( = з
Состоятельность этих двух оценок гарантируется предположением, что остаток е;, не имеет никакой автокорреляции.
Заметим, что для второй МИП-оценки при построении инструментальной переменной требуется дополнительный сдвиг, так что эффективное число наблюдений, используемых для оценивания, уменьшается (один такт времени «потерян»). Вопрос, какую из этих оценок следует выбрать не является, по существу, спорным. Подход, основанный на методе моментов, позволяет унифицировать эти оценки и устранить недостатки, связанные со снижением объемов выборок. На первом шаге этого подхода следует отметить, что
Plim .,.т1 ,. Е Е (e/t-e,.t-i)y,,f_a = e{(eft-e,t_1)ya_2} = 0 (10.51)
N(T — 1) / = 1 г = з
является условием моментов (см. гл. 5). Точно так же условием моментов является
Plim 1 Е Е (е/[ —£/,i-i) (У/,(-2 —У/,(-з) Л/(/ —¿) / = 1 t = з
= Е{(6„ -е,(_2 -у,(_з)} = 0. (10.52)
Таким образом, при оценивании для обеих МИП-оценок налагается одно условие моментов. Известно, что наложение большего количества условий моментов повышает эффективность оценок (конечно, если действительны дополнительные условия). В статье (Arellano, Bond, 1991) предлагается расширить перечень инструментальных переменных с помощью введения дополнительных условий моментов, позволяя количеству этих условий изменяться с f. Для этого авторы статьи положили Гфик-сированным. Например, при Т= 4 мы имеем
E{(ei2-sn)y,0j = 0, как условие моментов для t = 2. Для t = 3 мы имеем
£{(е(3-е,.2)ум} = 0,
но также справедливо, что
E{(sl3-el23)yi0} = 0.
Для такта времени t — 4 мы имеем условия трех моментов и можем ввести соответственно три инструментальных переменных
£{(е/4 - е,-з)У/о ! = °<
E{(eiA-El3)yn} = 0, E{(ei4-ei3)yi2) = 0.
ПРИКЛАДНАЯ ЭКОНОМЕТРИКА
№ 1 2006
Все эти условия моментов можно использовать в схеме реализации обобщенного метода моментов (ОММ). С целью построения ОММ-оценки определим
Де,
(10.53)
как вектор преобразованных остатков, и
{[У,0]
о
о [Ую > У/1]
о
о о
о
(10.54)
0 [у,0,...,у,,
как матрицу значений инструментальных переменных20. Каждая строка в матрице Z/ содержит инструментальные переменные, которые правомочны для данного такта времени. Следовательно, совокупность всех условий моментов можно записать кратко в виде
Е{2;Де,.} = 0. (10.55)
Заметим, что число этих условий равно 1 + 2 + ЗН-----1- 7" — 1.Чтобы получить ОММ-оценку, напишем это в виде
E{Z'l(Ay-~iAyl = (10.56)
Поскольку число «моментных» условий, как правило, будет превышать число неизвестных коэффициентов, мы оцениваем ^ минимизацией квадратичного выражения в терминах соответствующих выборочных моментов (см. ГЛ. 5), Т. 6.
/
" 1 д
ГП1П
~ Е Ду, ,)
N ¡= 1
И/,
- Е z;(Дy/-чДy,_1;
N / = 1
(10.57)
где 1/1/д, — симметрическая положительно определенная матрица весов21. Дифференцируя это выражение по ч и решая полученное уравнение относительно приходим к выражению
"Чомм ~~
а
I §
а £
I §
з
«
I I
X и
0
1 I
£ д
I = 1
Е ^Ду^
1' = 1
(10.58)
Е Ду'-^>)
/ = 1
Е ^Ау',
/= 1
Свойства этой оценки зависят от выбора матрицы весов \МЫ, несмотря на то, что хотя она будет состоятельной до тех пор, пока матрица \А/Ы положительно определена, например, для матрицы \Л/ц = I, где / — единичная матрица.
Оптимальной матрицей весов является такая матрица, которая приводит к эффективной оценке, т.е. дает наименьшую асимптотическую ковариационную матрицу для оценки чомм. Из общей теории ОММ (см. гл. 5) мы знаем, что оптимальная матрица весов (асимптотически) пропорциональна матрице, обратной к ковариационной матрице выборочных моментов. В данном случае это означает, что оптимальная матрица весов должна удовлетворять
20 Матрица 2, в (10.54) имеет размерность (7" -1) х (1 + 2 Н-----1- (7" -1)), поскольку нули-строки, стоящие над и (или)
под /-м выражением в квадратных скобках, имеют размерность I, / = 1, 2,..., Т — 1 (примеч. научн.ред. пер.).
21 Подстрочный индекс N отражает возможную зависимость матрицы VV от объема выборки А/, а не отражает размерность матрицы.
Не 1 2006
р\\т = \t\Z\ Ае, Г = Е\г\ Дб, Де'( 7,)
(10.59)
Ы—юо
В стандартном случае, когда на ковариационную матрицу е(. никакие ограничения не налагаются, оптимальную матрицу весов можно оценить, используя на первом шаге состоятельную функцию оценивания % и заменяя оператор математического ожидания выборочным средним. Тогда оптимальная матрица весов имеет вид
¡/¡/орI VVN
1 N , /
N / = 1
(10.60)
* £ &
со
0
X
а
1
где Де, — вектор оцененных на первом шаге остатков, например, при оценивании ^ с использованием матрицы = I.
В общем подходе ОММ не предполагается, что остатки еп являются независимо и одинаково распределенными по индивидуумам и времени, и, таким образом, оптимальная матрица весов тогда оценивается без наложения этих ограничений. Однако заметим, что отсутствие автокорреляции было необходимо, чтобы гарантировать выполнение «моментных» условий. Вместо оценивания оптимальной матрицы весов без ограничений также возможно (и потенциально желательно для малых выборок) наложить ограничение отсутствия автокорреляции в остатках е,( одновременно с предположением их гомоскедастичности. Отметив, что при таких ограничениях
2 -1 -1 2 0 '•.
0
0 -1
0-12
(10.61)
оптимальную матрицу весов можно определить как
' 1
и/Г =
N ¡ = 1
(10.62)
Заметим, что эта матрица не включает неизвестные параметры, так что оптимальную ОММ-оценку можно вычислить в рамках одного шага, если исходные остатки еи, как предполагается, являются го-москедастичными и не обнаруживают никакой автокорреляции.
В общем, ОММ-оценка для неизвестного параметра ^ асимптотически нормальна с ковариационной матрицей, заданной в виде
рУгп
1 "
N Е АУ
N / = 1
1 е ГАгА^г,
N / = 1
1 М
N ( = 1
(10.63)
Это следует из более общих выражений из параграфа 5.6. С независимо и одинаково распределенными остатками средний член в правой части выражения (10.63) сводится к
°жр,=<
1 м
N / = 1
10.4.2. Динамические модели с экзогенными переменными
Если модель к тому же содержит экзогенные переменные, то мы напишем модель в виде
Такую модель можно оценить также с помощью метода обобщенных инструментальных переменных или с помощью подхода ОММ. В зависимости от предположений, сделанных о переменных в векторе
117
Ns 1 2006
z, =
(10.67)
xit, можно построить разные совокупности дополнительных инструментальных переменных. Если переменные в векторе х/( строго экзогенны в том смысле, что они не коррелированны с любым из остатков e/s, то мы также имеем, что
E{xJS Де,,} = 0 для каждого s, t, (10.65)
так что к списку инструментальных переменных для уравнения первых разностей в каждый такт времени можно добавить хп..... х/г. Таким образом, число строк в матрице Zj стало бы весьма большим.
Вместо этого можно сохранить почти тот же самый уровень информации, если использовать первые разности переменных вектора хп в качестве их собственных инструментальных переменных.22 В этом случае мы налагаем «моментные» условия следующего типа
Е{Дх,(Де|(} = 0 для каждого f. (10.66)
Тогда матрица инструментальных переменных может быть записана в виде23
[у, 0.д*;2] о - о
О [у)0,ум,Дх;з] 0
; о О ••• [у/0.....yiT_z,Ax'IT]
Если переменные вектора х/( не строго экзогенны, а предопределены, что соответствует случаю, когда текущие и лагированные переменные в векторах хп не коррелированы с текущими остатками, то мы имеем только, что E{x/(e,s} = 0 для s> t. Тогда действительными инструментальными переменными для уравнения первых разностей в период Г являются только переменные xj t....... хп. Таким
образом, соответствующие «моментные» условия будут иметь вид:
Е{х,. (_уДе,,} = 0 для у = 1.....t-1 (для каждого t). (10.68)
На практике может возникнуть комбинация строго экзогенных и предопределенных х-перемен-ных, а не один из этих двух крайних случаев. Тогда матрицу Z, следует подкорректировать соответствующим образом. В монографии (Baltagi, 1995, Chapter 8) представлено дополнительное обсуждение и примеры.
В статье (Arellano, Bover, 1995) описывается структура объединения вышеупомянутого подхода с оцениванием методом инструментальных переменных Хаусмана, Тэйлора и др. (Hausman, Taylor, 1981, обсужденная в п. 5 параграфа 10.2). Наиболее важно, что авторы обсуждают, каким образом при оце-Й нивании можно также использовать информацию в уровнях24. Таким образом, в дополнение к пред-I ставленным выше условиям моментов возможно также использование наличия обоснованных инстру-ч ментальных переменных для уравнения уровней (10.64) или их среднего по времени (межгрупповая | регрессия). Это имеет особое значение, когда коэффициент ч близок к единице (см. также статью й (Blundell, Bond, 1998)).
§ 10.4.3. Единичные корни и коинтеграция
5
2 Последняя литература показывает возрастающую интеграцию методов и идей анализа временных
| рядов с моделированием панельных данных, таких, например, как единичные корни и коинтеграцион-
¡5 ный анализ. Основная причина таких разработок заключается в том, что исследователи все более и бо-
О 22 Мы отказываемся от потенциальной выгоды эффективности, если некоторые переменные в векторе х помогают «объясне-
$ нию» лагированных эндогенных переменных.
§ 23 Матрица ^ в (10.67) имеет размерность (7"--|)х((К + 1) + (/< + 2)Н-----\-(К + Т-1)), поскольку нули-строки, стоящие
§ над и (или) под/-м выражением в квадратных скобках, имеют размерность К + 1, / = 1, 2..... Т — 1 (примеч. научн. ред. пер).
§ 24 По-видимому, речь идет об информационном прошлом разного уровня глубины лагирования (примеч. научн. ред. пер).
118
Не 1 2006
лее понимают, что пространственные данные являются полезным дополнительным источником информации, который следует использовать. Чтобы проанализировать эффект определенного политического решения, например принятия дорожного налога или налога на загрязнение окружающей среды, возможно, более полезно провести сравнение с другими странами, чем пробовать извлечь информацию об этих эффектах только из предыстории собственной страны. Объединение данных различных стран может также помочь преодолеть проблему довольно малых объемов выборок временных рядов, когда критерии анализа долгосрочных динамических свойств не являются достаточно мощными.
В ряде недавних статей обсуждаются проблемы единичных корней, ложных регрессий и коинтегра-ции в панельных данных. Следует подчеркнуть, что эти понятия являются долгосрочными динамическими понятиями и, как правило, приводят к проблемам вывода при Г стремящемся к бесконечности. Во многих случаях, предполагая Гфиксированным, а N стремящимся к бесконечности, такие проблемы обходят, по крайней мере, теоретически.
Критической проблемой при анализе временных рядов, зарегистрированных на некотором количестве выборочных единиц одновременно, является проблема гетерогенности этих единиц. До тех пор, пока мы рассматриваем каждый временной ряд (одномерный или многомерный) индивидуально и ряд имеет достаточную длину, нет никаких нарушений в применении методов временных рядов из гл. 8 и 9. Однако если мы объединяем ряды для разных выборочных единиц, мы должны отдавать себе отчет в том, что не все временные процессы имеют одни и те же свойства или описываются одними и теми же параметрами. Например, возможно, что временной ряд уп является стационарным для страны 1, но интегрируемый порядка один для страны 2. Допуская, что все включенные переменные являются /(1), предположим, что в каждой стране i переменные yjt и хИ являются коинтегрированными с параметром коинтеграции (3В таком случае линейная комбинация yit—\3,х)( является 1(0) для каждого /, но не существует общего параметра коинтеграции (3,который приводит yit -(3 хп к стационарности для всех i (если только параметры коинтеграции (3 , не одинаковые для всех стран). Точно так же нет никакой гарантии, что пространственные средние, у (= (1/Л/)Е , У)( и х, являются коинтегрированными, даже если все лежащие в основе индивидуальные ряды коинтегрированные.
Чтобы проиллюстрировать некоторые из введенных проблем, рассмотрим модель авторегрессии
У¡t =<*/+Ч/У/, ,_i+efí,
которую можно написать как
АУн =OLi + t-1 + е/(,
где -к, Тогда нулевой гипотезой, что все временные ряды имеют единичный корень, яв-
ляется Н0 : -к, =0 для всех /'. Альтернативной гипотезой может быть гипотеза, что все ряды являются стационарными с одним и тем же параметром среднего возвращения, т.е. /-/, : тт; = тт < 0 для всех /'. В работах (Levin, Lin, 1992), (Quah, 1994) и (Harris, Tzavalis, 1999) альтернативная гипотеза подразумевается неявно. Менее ограниченная альтернативная гипотеза специфицируется в виде: Н1 : -к,. < 0 для всех /, которая позволяет параметрам тт(. различаться по группам и которая использовалась в работе (Im, Pesaran, Shin, 1997). Альтернативные критические статистики выводятся вместе с их асимптотическими распределениями, если Л/—> оо или Т—>оо, или одновременно N—>оо и Т—>оо, но обсуждение таких статистик выносится вне рамок этого текста. В любом случае центральная гипотеза состоит в том, что временные ряды всех индивидуальных выборочных единиц имеют единичный корень против альтернативной гипотезы, что все временные ряды являются стационарными. Поэтому можно было бы критиковать вышеупомянутые подходы, говоря, что возможно существование отличной от нуля вероятности, что один или более индивидуальных временных рядов являются стационарными, тогда как все другие имеют единичный корень или наоборот. В этом случае не удовлетворяется ни нулевая, ни альтернативная гипотеза, и неясно, желали бы мы отклонения нулевой гипотезы в
результате нашего тестирования или нет. Другая техническая проблема заключается в возможности пространственной зависимости между остатками е,( для разных стран, которая делает неправомерным использование совокупности упомянутых критериев.
В работах (Robertson, Symons, 1992) и (Pesaran, Smith, 1995) подчеркивалась важность параметрической гетерогенности в динамических моделях панельных данных, и анализировались потенциально серьезные смещения, которые могут возникать в результате обработки параметрически гетерогенных данных несоответствующим образом. Такие смещения особенно вводят в заблуждение в нестационарном мире, поскольку соотношения между индивидуальными временными рядами могут полностью лишаться силы. Результаты по методам тестирования панельных данных на ложные регрессии и коинтеграцию относительно ограничены (см. (Као, 1999) и (Phillips, Moon, 1999)).
Не 1 2006
10.5. Пример: эластичности спроса на труд по заработной плате
В этом разделе мы рассмотрим модель, которая объясняет спрос фирм на труд в зависимости от заработной платы, объема производства, лагированного спроса на труд и некоторых других переменных. Наша цель состоит в том, чтобы получить оценки для краткосрочных и долгосрочных динамических эластичностей спроса на труд по заработной плате в Бельгии. Данные и модели взяты из статьи (Konings, Roodhooft, 1997), в которой используются панельные данные более 3000 больших бельгийских фирм за период 1986-1994гг. Статический спрос на труд задается моделью
log Lit =^+02 log wjt + p3 log rit + (34 log Ylt + (35 log wJt + uit,
где Lit обозначает желаемую занятость на фирме / в период t (спрос на рабочую силу), ил, и гп удельные издержки на труд и основные фонды соответственно, а Уи обозначает уровень объема производства. Последняя переменная ил, обозначает среднее реальной заработной платы в промышленности. Это соотношение интерпретируется как долгосрочный динамический результат, поскольку оно игнорирует издержки «настройки» (регулирования) модели.
Для краткосрочной динамики авторы статьи (Konings, Roodhooft, 1997) экспериментировали с альтернативными динамическими спецификациями. Самая простая спецификация предполагает, что
log/-,, =p1 + p2logw,.( + p3logrff+(34logyft
+ (35log wjt log L(. t_, + ult.
При оценивании величина rjt аппроксимировалась акционерным капиталом Kit, a Yit добавленной стоимостью. Тогда динамическая модель, которую мы оцениваем, имеет вид
log Lit = (31Ч- (32 log ил, + (33 log Kit + (34log Yjt -» +(35 log ил, + ч log +a, + e,,,
где предполагается, что остатки состоят из двух компонент. Компонента а, обозначает ненаблюдаемую
£ I
I гетерогенность фирм, специфицированную не зависящей от времени. Первое взятие разности в этом с
3
уравнении, как и в предыдущем параграфе, исключает компоненту а,, но не приводит к уравнению, которое можно оценить состоятельно с помощью МНК. Во-первых, разность A log L:, _ 1 и разность Д е, коррелированы (как и выше). Во вторых, ни в коем случае не очевидно, что факторные издержки заданы
ных ситуаций, в которых заработная плата определяется одновременно с занятостью. Например, проф-
|
я экзогенно. В частности, для удельных издержек на труд ил, можно представить несколько альтернатив-§ '
о союзы могут заключить сделку с предпринимателями по заработной плате и занятости. Таким образом,
3 мы можем ожидать, что а>
| Е{Д1од^„ Де„}*0.
Hb 1 2006
Поэтому логарифмическая разность Д1од w/( также инструментована при оценивании. Правомоч- g
ные инструментальные переменные задаются переменными log wj t 2, log w,,_3..... подобными инс- q.
трументальным переменным для логарифмической разности Д log Lit_v Таким образом, число доступ- во ных инструментальных переменных возрастает вместе с ростом г.
В табл. 10.3 мы представили результаты оценивания для статической и динамической моделей, обсуж- ^ денных выше. Эти результаты являются подмножеством результатов, представленных в работе (Konings, Roodhooft, 1997), в которой также рассматривались модели с другими дополнительными лагированны-ми переменными. В первом столбце приведены оценки для статической (т.е. долгосрочной динамической) функции спроса на труд. Заработная плата рассматривается как эндогенная и инструментована, как указано выше. Во второй столбец включен лагированный спрос на труд, который тоже инструментован, как описано выше. Обе спецификации также включают региональные и временные фиктивные переменные (манекены). Чтобы протестировать модель против неспецифицированной альтернативной гипотезы, мы можем использовать тесты на сверхидентифицирующие ограничения, как обсуждалось в гл. 5. Критические статистики, равные 29,7 и 51,66, должны сравниваться с критическими значениями из хи-квад-рат распределения с 15 и 29 степенями свободы соответственно. С р-значениями, равными 0,013 и 0,006, сверхидентифицирующие ограничения на 1 %-м уровне значимости отвергаются — на границе отклонения для обеих спецификаций. Значимость лагированной зависимой переменной (стандартные ошибки даны в круглых скобках) предполагает, что следует предпочесть динамическую спецификацию.
Таблица 10.3
Результаты оценивания уравнения спроса на труд
(Konings, Roodhooft, 1997)
Зависимая переменная |0С| L
I временные Статическая модель Динамическая модель
•og L . . — 0,60 (0,045)
ЮдК. 0,021 (0,009) 0,008 (0,005)
log w, , -1,78 (0,60) -0,66 (0,19)
log wn 0,16(0,07) 0,054 (0,33)
log кп 0,08 (0,011) 0,078 (0,006)
тест на сеерх-идентифицирующие ограничения 29,7 (р = 0,013) {¿Ы 15) 51,66 (р = 0,006) (df= 29)
число наблюдений 10599 10599
Оцененная краткосрочная динамическая эластичность по заработной плате из последнего столбца равна -0,66, в то время как долгосрочная динамическая эластичность равна -0,66/(1-0,60) = -1,6, которая близка к оценке, равной -1,78, из статической долгосрочной динамической модели. Обе эти оценки весьма высокие. Например, они предполагают, что в долгосрочной динамике увеличение заработной платы на 1 % приводит к снижению на 1,6% в спросе на труд. Эти оценки намного выше, чем представлялось вначале на основе макроэкономических данных временных рядов. Очевидно, что возможность корректировать гетерогенность для наблюдаемых и ненаблюдаемых фирм имеет существенное влияние на оценки. Потенциальная проблема результатов в табл. 10.3 лежит в направлении структурного логического построения данных.
Во-первых, панельные данные несбалансированы (см. разд. 10.7 ниже), в то время как модель игнорирует изменения в спросе на труд, обусловленные включением или невключением фирм в вы-
Не 1 2006
борку (например, из-за финансовых затруднений). Кроме того, занятость измеряется средним числом занятых в данном году, в то время как заработная плата (удельные издержки на труд) вычисляется в виде общих трудовых издержек, деленных на число занятых. Ясно, что тем самым игнорируется проблема сокращения среднего трудового времени рабочего, которая, возможно, в это десятилетие имела место. Например, если фирма заменяет одного рабочего, занятого полный рабочий день, двумя рабочими, занятыми неполный трудовой день, то занятость возрастает, а трудовые издержки снижаются, в то время как в действительности никаких реальных изменений не происходило. Более подробное обсуждение проблемы см. в (Коптдэ, ЯоосИпооЛ:, 1997).
10.6. Модели с ограниченными зависимыми переменными
Панельные данные относительно часто используются в микроэкономических проблемах, где интересующие нас модели включают нелинейность. Дискретные или ограниченные зависимые переменные являются важным феноменом в этой области, а их комбинация с панельными данными обычно усложняет оценивание. Причина заключается в том, что для панельных данных обычно нельзя аргументировать, что различные наблюдения относительно одной и той же выборочной единицы независимы. Корреляции между различными членами ошибок, как правило, усложняют функции правдоподобия таких моделей и, следовательно, усложняют их оценивание. В этом разделе мы обсудим оценивание логит-модели, пробит-модели и тобит-модели панельных данных. Больше деталей относительно моделей панельных данных с ограниченными зависимыми переменными можно найти в статье (МасИа1а, 1987).
10.6.1. Модели бинарного выбора
Как и в случае пространственных данных, модель бинарного выбора обычно формулируется в терминах лежащей в основе латентной модели. Как правило, мы пишем25
с;, =х;(Э + а ,.+£,„ (10.69)
где мы наблюдаем, что уп = 1 если С*, > 0, и уи = 0 в противном случае. Например, уи может служить показателем, работает или нет индивидуум / в период t. Предположим, что специфические остатки в,, имеют симметричное распределение с функцией распределения Р(.), независимо и одинаково |5 распределенные по индивидуумам и времени и независимые от всех х,5. Даже при таких допущениях присутствие эффектов а, усложняет оценивание в обоих случаях: и когда мы рассматриваем их в
5 качестве неизвестных фиксированных параметров, и когда мы рассматриваем их в качестве случайных 3 остатков.
1
| чаем в модель N фиктивных переменных. Таким образом, функция логарифма правдоподобия задает-е *
3
Если мы рассматриваем а,. как фиксированные неизвестные параметры, то по существу мы вклю-;м в модель N фиктивных переменных. Таким образом, фун ся (сравните с функцией логарифма правдоподобия (7.12)) как
§ !од/-((3, а1..... а„) = £ у,(1одР(а,+х'(3) +
| , " (10.70)
со
§ 1,1 /,(
8 Максимизация этой функции относительно 0 и а, (/ = 1...../V) приводит к состоятельным оценкам при условии, что число тактов времени Т стремится к бесконечности. Для фиксированного Т и
§ 25 Для упрощения обозначений мы предположим, что ха включает константу, всякий раз, когда это уместно. 122 ✓-
^ Ня 1 2006
N —у оо, оценки несостоятельны. Причина заключается в том, что для фиксированного Т число пара- | метров возрастает с ростом объема выборки Л/ и мы имеем проблему, которая известна как проблема о. «побочных (incidental) параметров». Т.е. любой эффект ау можно оценить состоятельно, если толь- m ко мы имеем возрастающее число наблюдений для каждого фиксированного /', следовательно, если Т 2 стремится к бесконечности. В общем, несостоятельность а, для фиксированного Т переносится на ^ функцию оценивания вектора неизвестных параметров (3.
Проблема побочных параметров, когда число параметров растет с числом наблюдений, возникает в любой модели с фиксированными эффектами, включая линейную модель. Однако для линейного случая можно исключить параметры а,., так что вектор параметров (3 можно оценить состоятельно, даже при том, что все параметры а, оценить нельзя. Тем не менее, для большинства нелинейных моделей, несостоятельность а, также приводит к несостоятельности оценок для других параметров. К тому же заметим, что с практической точки зрения оценивание более, чем N параметров, по-видимому, не очень привлекательно, если N является довольно большим.
Несмотря на то, что латентную модель можно преобразовать таким образом, что индивидуальные эффекты а, исключаются, в данном контексте это не помогает, поскольку нет никакого отображения, например, у*f — у*,_ 1 в наблюдаемые переменные, подобные переменным yit — yit_v Альтернативная стратегия состоит в применении условного максимального правдоподобия (см. (Andersen, 1970), (Chamberlain, 1980)). В этом случае мы рассматриваем функцию правдоподобия условную по множеству статистик î(., которые являются достаточными для параметров а,. Это означает, что условный по t, вклад в правдоподобие индивидуума больше не зависит от параметра а,, но все еще зависит от других параметров (3. В модели бинарного выбора для панельных данных существование достаточной статистики зависит от функционального вида функции распределения F, т. е., зависит от распределения специфических остатков s,(.
На общем уровне напишем совместную плотность распределения случайных величин
yn,...,yiT как f{yn.....yiT I а,, (3 ), которая зависит от вектора параметров (3 и параметра
а,. Если существует достаточная статистика f,, то это значит, что существует статистика такая, что f(yn.....у, Т I а,, 3 )= f ( у,-,.....у,, т-1 (3 )26, и поэтому она не зависит от параметра а,. Следовательно, мы можем максимизировать функцию условного правдоподобия, основанную на f ( У, 1.---> У, т ' h' Р )- и получить состоятельную оценку для вектора параметров (3 . Кроме того, мы можем использовать все относящиеся к законам распределения результаты гл. б, только заменить в них логарифмическую функцию правдоподобия условной логарифмической функцией правдоподобия. Для линейной модели с нормальными ошибками достаточная статистика для параметра а/ есть у,. Таким образом, условное распределение у,( при заданном у, не зависит от параметра а,., и можно показать, что максимизация функции условного правдоподобия воспроизводит оценку с фиксированными эффектами для вектора неизвестных параметров (3 . К сожалению, этот результат автоматически не распространяется на нелинейные модели. Например, для пробит-модели было показано, что никакая достаточная статистика для параметра а, не существует. Это означает, что мы не можем оценить пробит-модель фиксированных эффектов состоятельно для фиксированного Т.
10.6.2. Логит-модель с фиксированными эффектами
Для логит-модели с фиксированными эффектами, ситуация отличается. В этой модели f(. = уj является достаточной статистикой для параметра а,, и состоятельное оценивание возможно в соответствии с условным максимальным правдоподобием. Следует отметить, что условное распределение ум.....yjT является вырожденным, если f, =0 или ti — 1. Следовательно, такие индивидуумы не
26 Математически несколько небрежная формулировка. Точнее: если f (у,,,..., y.r; а, Р) — совместная плотность распределения случайных величин у ...,у зависящая от параметров а и р, и если i — достаточная статистика в оценивании параметра а,, то условная совместная плотность f (у,,... уп, р| t) (при условии заданного фиксированного значения г.) не будет зависеть от а, (примеч. научн. ред. перевода).
\123
Ms 1 2006
вносят свой вклад в условное правдоподобие, и надо отказаться от них при оценивании. Выражаясь иначе, их поведение полностью улавливалось бы их индивидуальным эффектом а,. Это значит, что только индивидуумы, которые изменяют свой статус, по крайней мере, хотя бы один раз, уместны для оценивания вектора параметров (3 . Чтобы проиллюстрировать логит-модель с фиксированными эффектами, мы рассмотрим случай 7=2.
Существует два возможных исхода, условных по tj = 1/2: (0, 1) и (1, 0). Условная вероятность первого исхода равна
Р{(0,1) I ( = 1/2, а 3) =_"1№1>"»,1>1_. (Ш1)
' ' Р|(0,1)|с1,|3| + Р((1,0)|с„|31
Используем, что
при27
Р{(0,1) I а,, (3} = Р{ уп = 01 а,, (3} Р{ у/2 =11 а(, (3}
ехр {а, +х' (3}
Р{у(.2 = 11а,,3} =
1 + ехр {сх, +х'3}-
/2
Откуда следует, что условная вероятность задается в виде
ехр {(х,„ -х,л )'(31
P{(0,1)lf,=1/2, а,,(3} = '2-(10.72)
1 + ехр{(х,2 -х(1) (3}
которая действительно не зависит от а,, Аналогично,
Р{(1,0) I f = 1/2, а(-,3} = --т-"-гттт- 00.73)
1 + ехр {(х,2 -хп ) (3}
Это означает, что мы можем оценить логит-модель с фиксированными эффектами для Т = 2, используя стандартную логит-модель с х|2 - х(1 в качестве объясняющих переменных и изменение в переменной у/( в качестве эндогенного события (с 1 для положительного изменения и с 0 для отрицательного изменения). Отметим, что в этой модели бинарного выбора с фиксированными эффектами еще более ясно, чем в линейном случае, что модель идентифицируется только через «внутригрупповую размерность» данных; от индивидуумов, которые не изменяют статус, при оценивании просто отказываются, поскольку они вообще не обеспечивают никакой информации о векторе параметров [3. Для случая с большими значениями Г все необходимые условные вероятности получить несколько сложнее, но в принципе они являются прямым обобщением вы-н шеприведенного случая (см. (Chamberlain, 1980) или (Maddala, 1987)). В статье (Chamberlain, 1980) | также обсуждается, как подход условного максимального правдоподобия можно обобщить на ^ мультиномиальную логит-модель.
>< Если можно предположить, что эффекты а, независимы от объясняющих переменных в векторе хп, | то, по-видимому, схема случайных эффектов более уместна. Она оказывается более легко реализуемой в
S
х
S
контексте пробит-модели.
10.6.3. Пробит-модель со случайными эффектами
$ Начнем со спецификации с латентной переменной
I й
а 11
I
0
I"
1 -
5 27 См. выражение (7.6) в гл. 7 для логистической функции распределения.
у', =х'(3+и,„ (10.74)
у,( = 1, если у*п >0
(10.75)
у„ = 0, если у*,< 0,
Не 1 2006
где ип — остатки с нулевым средним и дисперсией, равной единице, независимые от g (х, 1,..., х, г). Чтобы оценить вектор параметров (3 методом максимального правдоподобия, мы о. должны сделать дополнительное предположение о совместном распределении остатков оши- и
бок uj ...... и, т. Вклад в правдоподобие индивидуума /' есть (совместная) вероятность наблюде- 2
ния Г исходов уп.....У,-г-Эта совместная вероятность определяется из совместного распреде- ^
ления латентных переменных у * 1,..., у*т интегрированием по соответствующим интервалам. Таким образом, в общем, будет Т интегралов, которые для оценивания следует, как правило, вычислять численно. Когда 7~= 4 или более, то оценивание методом максимального правдоподобия осуществимо. Можно обойти эту «напасть размерности» применением функций оценивания на основе моделирования, например, как описано в справочнике (Кеапе,1993) и статье (Weeks, 1995). Такое обсуждение выходит за рамки этого текста.
Ясно, если можно предполагать, что все uit независимы, то мы имеем, что совместная условная плотность вероятностей f(yn.....у, т I х,- ......xiT, (3 ) = П t f ( У, f' х;(> Р )* которая включает только Тодномерных интегралов (как и в случае пространственных данных). Если мы делаем предположение о компонентах ошибок и предполагаем, что ип = а, + е,(,где е,, не зависит от времени (и индивидуумов), то совместную условную вероятность можно написать как
f(yn.....Уп 1 *п.....*,т,Р) =
= IZf(yn..... У п 1 XiV-< XiT> а/> Р К(а) ) dctj — (10.76)
Uf(yit I xir а„0)
f{<*,)d а„
которая требует одномерного численного интегрирования. Это практически реализуемая спецификация, которая допускает коррелированность остатков для разных тактов времени, хотя и ограниченным образом. Критический момент в реализации выражения (10.76) состоит в том, что условные по а, остатки были бы независимыми при разных Г.
В принципе о распределениях а, и еп можно делать произвольные предположения. Например, можно было бы предположить, что остатки е/( независимо и одинаково распределены по нормальному закону, в то время как а, имеет логистическое распределение. Однако это может привести к распределениям для остатков а, +8/(, которые являются нестандартными. Например, сумма двух логистически распределенных переменных, в общем, не имеет логистического распределения. Это подразумевает, что индивидуальные вероятности, подобные f ( у,( I хи, (3 ), трудны для вычисления, и не соответствуют пространственной пробит-модели или пространственной логит-модели. Поэтому обычно следует начинать с совместного распределения остатков ип..... ип. Многомерное логистическое распределение имеет такое неудобство, что все корреляции должны ограничиваться 1/2 (Мас1с1а1а, 1987), так что на практике это не очень привлекательно. Следовательно, самый общий подход состоит в том, чтобы начать с многомерного нормального распределения, которое приводит к пробит-модели случайных эффектов.
Предположим, что совместное распределение ип..... и)Т нормально с нулевыми средними значениями, дисперсиями, равными 1, и соУ{ии, = Это соответствует предположению, что а, является НОНП (0, а\),а е/( есть НОНП (0, 1-а^). Вспомним, что, как и в случае пространственных данных, нам требуется нормировка дисперсий остатков. Выбранная здесь нормировка подразумевает, что дисперсия остатка в заданный такт времени равна единице, так что оцененные коэффициенты (3 непосредственно сравнимы с оценками, полученными из оценивания модели по данным одного такта времени (выбранного из общих панельных данных), используя пространственное пробит максимальное правдоподобие. Для пробит-модели со случайными эффектами выражения в функции правдоподобия задаются в виде
to 1 2006
f{y„ I Х„, a„ 0) =
Ф
x'ß+a/
— ст„
если y)( =1
x'ß+a,
1-Ф
(10.77)
если уjt = 0,
где Ф обозначает функцию распределения стандартного нормального закона. Плотность а, задается в виде
1
/2^
expj
'2 a?
(10.78)
Интеграл в выражении (10.76) следует вычислять численно, что можно сделать, используя алгоритм, описанный в статье (Butler, Moffitt 1982). Несколько пакетов программ (например, LIMDEP и Stata) имеют стандартные подпрограммы для того, чтобы оценивать пробит-модель случайных эффектов.
Можно показать (Robinson, 1982), что игнорирование взаимных корреляций остатков по времени и оценивание коэффициентов ß, использующее стандартное максимальное правдоподобие про-бит-модели для объединенных данных, является состоятельным, хотя и неэффективным. Кроме того, обычно вычисляемые стандартные ошибки некорректны. Однако их значения можно использовать в качестве начальных оценок в итерационной процедуре максимального правдоподобия, основанной на совместной вероятности (10.76).
(10.80)
а
I £
£
i с
S tt
fiQ i I
I
10.6.4. Тобит-модели
Тобит-модель случайных эффектов очень похожа на пробит-модель случайных эффектов, единственное различие состоит в правиле наблюдения. Следовательно, мы можем быть довольно краткими. Начнем с модели
у;( = х'р+а, + £,.(; (1079)
вместе с тем, что
уп = у',, если у,*, > 0
уи= о, если у*, < 0. Мы сделаем обычное предположение случайных эффектов, что эффекты а, и остатки е/( являются независимо и одинаково распределенными по нормальному закону с нулевыми средними значениями и дисперсиями, равными ст2 и ст2 соответственно, и независимыми от хп.....хп. Используя (как общее обозначение для функции плотности или функции вероятностной меры, функцию правдоподобия можно написать, как выражение (10.76), в виде
f{Уn.....У;т 1 *п.....*,т.Р) =
= I *„. а„0К(а,) с/а,.,
где ) задается выражением (10.78), а 1 ( уп I х/(, 0 ) задается выражением
2 ст2
f{yit I х,„ а,,0) =
1
ехр
sj 2ттст
х'(0 + а/
если у,, > 0
(10.81)
1-Ф
, еслиу)(=0.
Заметим, что последние два выражения аналогичны вкладам в функцию правдоподобия в случае g пространственных данных, как обсуждалось в гл. 7. Единственное различие состоит во включении эф- о. фекта а, в условном смысле. ц
Полностью подобным же образом можно рассмотреть другие формы цензурирования, чтобы по- s лучить, например, пробит-модель с упорядоченными случайными эффектами. Во всех случаях интег- ^ рирование по а, должно проводиться численно.
Тобит-модель можно оценить состоятельно, так же как и усеченную модель регрессии с фиксированными эффектами, применяя обобщенный метод моментов с использованием моментных условий, представленный в статье (Honore, 1992) или статье (Honore, 1993) для динамической модели. Эти функции оценивания являются полупараметрическими в том смысле, что на вид функции распределения остатков в(( никакие предположения не налагаются.
10.6.5. Динамика и проблема начальных условий
Возможность включения лагированной зависимой переменной в вышеупомянутые модели представляет экономический интерес. Например, предположим, что мы объясняем, действительно ли индивидуум является безработным (или нет) за ряд последующих месяцев. Как правило, справедливо, что индивидуумы, которые имеют более длинную предысторию находиться в состоянии безработного, менее вероятно оставят состояние безработицы. Как обсуждалось в вводном разделе этой гл. существует два объяснения этого: индивидуум с более длинной предысторией безработного может быть обескуражен в своих поисках работы, или для работодателя, возможно (по любой причине), менее привлекательно нанять его на работу. Это называется зависимостью от статуса: чем дольше вы находитесь в определенном состоянии, тем менее вероятно, что вы его оставите. Альтернативно, возможно, что присутствует ненаблюдаемая гетерогенность, такая, что индивидуумы с определенными ненаблюдаемыми характеристиками менее вероятно оставят статус безработного. То есть факт, что мы наблюдаем мнимую зависимость от статуса в данных, происходит просто из-за механизма выбора: безработные с продолжительными периодами имеют определенные ненаблюдаемые (не зависящие от времени) особенности, которые делают менее вероятным найти ему работу каким-либо образом. В обсужденных выше моделях бинарного выбора индивидуальные эффекты а, улавливают ненаблюдаемую гетерогенность. Если мы включаем лагированную зависимую переменную, то мы можем различить вышеупомянутые два объяснения.
Рассмотрим пробит-модель со случайными эффектами, хотя подобные результаты справедливы и для случая тобит-модели со случайными эффектами. Предположим, что спецификация латентной переменной изменена на
y,*f =х;,(3 + чу,,_1+ а,+£,.,, (10.82)
Ne 1 2006
где уи = 1, если у*, > 0,и уц = 0 в противном случае. В этой модели ^ > 0 указывает на положительную зависимость от статуса: при прочих равных условиях вероятность, что уи =1, больше,если у/(_1 также равна единице. Рассмотрим оценивание методом максимального правдоподобия такой динамической пробит-модели со случайными эффектами, сделав те же самые предположения о распределениях, как прежде. В общем виде вклад правдоподобия индивидуума / имеет вид28
Ну и.....у,т |хм.....*,т.Р) =
= fZ f(Yi ......У/г1 */i.....х,т' P)f(a,)da,:
П f(y/tiy,- f_i.<*„р)
( = 2
f(yn\xn, а„3) f{ а,) с/а,-,
8 Для удобства обозначений индекс времени определяется так, что первое наблюдение есть (ум, х'п )
(10.83)
127
V ПРИКЛАДНАЯ ЭКОНОМЕТРИКА
Ив 1 2006 ^
где
г-1. <*/■ 3) =
Это полностью аналогично стационарному случаю, а переменная у, просто включена как дополнительная объясняющая переменная. Однако член ¡(уп I хп, а (, (3) в функции правдоподобия может вызвать проблемы. Он дает вероятность наблюдения ум = 1 или уп —0, без знания предыдущего состояния, но условную по гетерогенности ненаблюдаемого члена а,.
Если начальное значение экзогенно в том смысле, что его распределение не зависит от а(, то вне интеграла мы можем положить член Цуп I хп, а,, (3) = 1{у¡^ хп, 0). В этом случае мы можем просто рассмотреть функцию правдоподобия условную по ум и игнорировать член !{уп I хп, 0) при оценивании. Единственным последствием может быть потеря эффективности, если /(у(11 хм, 0) обеспечивает информацию о векторе параметров 0. Этот подход был бы уместен, если необходимым условием для всех индивидуумов было бы одинаковое начальное состояние, или если бы для индивидуумов оно назначалось случайно. Пример первой ситуации приведен в статье (Ыутап, \Zerbeek, 1992), где моделируется «неотклик» относительно потребления, и начальный такт времени соответствует месяцу перед панельными данными, и «неотклик» необязательно наблюдался.
Однако во многих приложениях, возможно, трудно аргументировать, что начальное значение ум экзогенно и не зависит от ненаблюдаемой гетерогенности индивидуума. В таком случае мы нуждались бы в выражении для f{yií\ хп, а,,(3), а это проблематично. Если процесс, который мы оцениваем, продолжался в течение многих тактов времени перед текущим выборочным тактом времени, то ({уп \ хп, а,, 0) является сложной функцией, которая зависит от ненаблюдаемой предыстории индивидуальных /. Это означает, что, как правило, невозможно получить выражение для маргинальной вероятности ^(ум I хп, а,, 0), которая является непротиворечивой с остатком модели. В работе (Несктап, 1981) предлагается приближенное решение этой проблемы начальных условий, которое, по-видимому, на практике работает достаточно хорошо. Это решение основано на аппроксимации маргинальной вероятности начального состояния пробит-функцией, использующей насколько возможно больше доступной предвыборочной информации, без наложения ограничений на ее коэффициенты и структурные параметры 0 и В статье (\/е11а, УегЬеек, 1999) приведен пример такого под-Й хода к динамической тобит-модели со случайными эффектами. Влияние начальных условий снижается | при возрастании числа выборочных тактов времени Т, поэтому если Гявляется довольно большим, то ч проблему можно игнорировать.
I €
| 10.7. Неполные панельные данные и смещение,
^ обусловленное выборочной селективностью
&
| По разнообразным причинам эмпирические совокупности панельных данных часто неполные. На-
| пример, после того как прошло несколько тактов времени индивидуумы, включенные в обследование,
| предполагающее сбор панельных данных, могут отказаться от сотрудничества; для одних домашних
8 хозяйств невозможно определить их новое местонахождения, другие распались; фирмы могут завер-шить свой бизнес или слиться с другими фирмами; а инвестиционные фонды могут закрыться. С дру-
| гой стороны, фирмы могут войти в бизнес на более поздней стадии; можно извлечь обновленную
8 выборочную информацию, компенсирующую потерянную; или панельные данные могут собираться
Ф
+ 1+а,
1-СГ
1—ф|
VI
а,
если Уц= 1 , если у|( = 0.
-
Ив 1 2006
в виде панели ротации. В панели ротации на каждом такте времени определенная доля выборочных g единиц заменяется другими выборочными единицами. Последствие всех таких событий состоит в том, о. что получающаяся совокупность панельных данных больше не является «прямоугольной». со
Несмотря на то, что общее количество индивидуумов равно N, а число тактов времени равно Т, об- S щее количество наблюдений оказывается существенно меньшим, чем NT. ^
Первая особенность, присущая работе с неполными панельными данными — это возникновение вычислительных проблем. Если наблюдения отсутствуют, то большинство выражений для представленных выше оценок больше просто неприемлемо. Простое «решение» состоит в том, чтобы любого индивидуума, по которому мы имеем неполную информацию, исключить из панельных данных, и работать только с полностью наблюдаемыми выборочными единицами. При таком подходе для оценивания используются только «сбалансированная субпанель». В вычислительном отношении этот подход заманчив, но потенциально очень неэффективен: можно «потерять» существенное количество информации. Потери в эффективности можно устранить, учитывая все имеющиеся наблюдения, включая тех индивидуумов, которые наблюдались в Т периодах времени только частично. В этом случае используется «несбалансированная субпанель». В принципе применение несбалансированных панельных данных является прямой процедурой, но в вычислительном отношении требуются определенные корректировки формул, представленных в предыдущих разделах. Мы обсудим некоторые из корректировок в пункте 1 параграфа 10.7. К счастью, большая часть программного обеспечения, которое может обрабатывать панельные данные, также учитывает несбалансированные данные.
Другое потенциальное и еще более серьезное последствие применения неполных панельных данных заключается в опасности смещения, обусловленного ограничениями в отборе выборочных единиц, т.е. так называемой выборочной селективностью («selection bias»). Если индивидуумы наблюдаются неполностью из-за эндогенной причины, использование сбалансированной субпанели или несбалансированных панельных данных может привести к смещенным оценкам и вводящим в заблуждение критериям. Для пояснения этого предположим, что интересующая нас модель задается в виде
у„=х;(Р + а,+б,(. (10.84)
Кроме того, определим индикаторную переменную гп («отклик») в виде: л/(=1, если (хи,уи) наблюдалось, и rit= 0 в противном случае. Наблюдения (хп,уи) отсутствуют (пропущены) случайным образом, если гп не зависит от эффекта а,, и остатка е/(. Это означает, что заданные условия процесса отбора выборочных единиц не влияют на условное распределение yjt для данного хп. Если мы хотим сконцентрироваться на сбалансированной субпанели, то условия процесса отбора определяются соотношениями /",. 1 = ■■■ =г, г = 1, и мы требуем, чтобы индикатор гп был независим от эффекта
а, и остатков е(1..... е|Т. В этих случаях обычные свойства состоятельности функций оценивания не
изменяются, если мы ограничиваем внимание только доступными или полными наблюдениями. Если процесс отбора зависит от МНК-оцененных остатков уравнения, то оценки случайных и фиксированных эффектов могут пострадать от «выборочного» смещения (см. гл. 7). В п. 10.7.2 описываются подробности по этой проблеме, включая некоторые простые тесты. В случаях с выборочным смещением, следует использовать альтернативные оценки, которые в вычислительном отношении являются, как правило, непривлекательными, что обсуждается в п. 10.7.3. Дополнительные детали и обсуждение методов анализа, основанного на неполных панельных данных, и вопросов «селективного» смещения можно найти в статьях (Verbeek, Nijman, 1992,1996).
10.7.1. Оценивание со случайно пропущенными данными
Выражения для оценок с фиксированными и случайными эффектами легко обобщить на несбалансированный случай. Оценку с фиксированными эффектами, как и прежде, можно определить как МНК-оценку в линейной модели, где для каждого / (номера индивидуума) определен свой свободный член. Альтернативно, оценку вектора неизвестных параметров (3 можно получить непосредственным приме-
N_
Ня 1 2006
нением МНК к внутригрупповой преобразованной модели, где теперь все переменные являются отклонениями от среднего значения по доступным наблюдениям. Индивидуумы, которые наблюдаются только один раз, не обеспечивают никакой информации относительно 3 и их следует исключить из процесса оценивания. Определив «доступные средние значения» как29
У/
Е[=1 гцУн . - _ Е (= 1 гц хп
X. —
(10.85)
Е [= 1 г, ( Е (= 1 I
функцию оценивания фиксированных эффектов можно кратко написать в виде
Зре=[е Е гп(хп-х,)(х11-х1)') Е Е гИ(х!1-х1)(уи-у1У.
Таким образом, просто все суммируется только по доступным наблюдениям. Аналогичным образом можно обобщить оценку со случайными эффектами. Для несбалансированного случая ее можно получить в виде
-1
3
омнк
N Т
Е Е л,((х„-х,)(х„-х/)'+ Е ^,7-,(х„-х)(х,!-х)'
= 1 г = 1 / = 1
Е Е гп(хп-х1)(у!,-у1)+ Е ^(Т((х,-х)(у(.-у)'
X
/ = 1 (= 1
(10.86)
где 7~ = Е ]= 1 Гц обозначает число тактов времени, а когда наблюдался индивидуум /',
т2 +Т,а2
I
£ 4
I
г
1
I
I I
Иначе эту функцию можно получить с помощью МНК, примененного к следующей преобразованной модели
(У!1-х%У1) = ^-$1)+(хп-Ъ,х1)+и!„ (10.87)
где = "1 — -ф,17 2. Отметим, что применяемое здесь преобразование является индивидуальной спецификацией, поскольку оно зависит от числа наблюдений для индивидуального /'.
По существу, более общие формулы для оценок с фиксированными и случайными эффектами характеризуются тем, что все суммы и средние значения вычисляются только по доступным наблюдениям и что 7" заменяется на Г,.. Полностью аналогичные корректировки применяются к выражениям для ковариационных матриц этих двух оценок, которые задаются выражениями (10.13) и (10.23). Состоятельные
2 а
1
оценки неизвестных дисперсий а^ и а2 имеют вид
<т?=-
N Т
ЕГ=1 т,-м ,=1^1
Е Е г|((у„-у|-(х,,-х/)'3ФЭ)2
N / = 1
1
(у-хХ)2-^
(10.88)
(10.89)
соответственно, где Зм — межгрупповая оценка для вектора параметров 3 (вычисляемая как МНК-оценка в выражении (10.18), где средние значения теперь отражают «доступные средние значения»). Поскольку эффективность оценок для о2а и а2 асимптотически не влияет на эффективность оценки со случайными эффектами, то в вычислительном отношении можно использовать более простые состоятельные оценки для агп и а2. Например, можно использовать стандартные оценки, вычислен-
9Мы предполагаем, что £ ,г= , г,, > 1, т.е. каждый индивидуум наблюдался, по крайней мере, один раз.
Ns 1 2006
ные только по остаткам, полученным из оценивания, основанного на сбалансированной субпанели, а затем использовать выражение (10.86) или (10.87), чтобы вычислить оценку со случайными эффектами.
1С
<о
I <0
10.7.2. Смещение, обусловленное выборочной селективностью, §
I
и некоторые простые тесты «
В дополнение к обычным условиям для состоятельности оценок со случайными и фиксированными эффектами, основанных на сбалансированной субпанели или на несбалансированных панельных данных, выше предполагалось, что индикатор отклика rit независим от всех ненаблюдаемых переменных в модели. Такое предположение может быть нереалистичным. Например, основанное на таком предположении объяснение работы фондов может быть некорректным из-за того, что менее вероятно продолжение существования фондов с плохой работой (Ter Horst, Nijman, Verbeek, 1998), исследование эксперимента по эффективности политики использования дохода может пострадать от смещений, если более вероятен отказ от участия в панельном обследовании людей, которые извлекают меньшую выгоду из эксперимента (Hausman, Wise, 1979), или оценивание воздействия уровня безработицы на индивидуальную заработную плату может нарушаться, если в случае увеличивающейся безработицы более вероятен уход с трудового рынка людей с относительно высокой заработной платой (Keane, Moffitt, Runkle, 1988).
Если rit зависит от эффекта а,, или остатка е/(, то в стандартных оценках может возникнуть смещение, которое в дальнейшем мы будем называть селективным смещением (см. гл. 7). Это означает, что распределение у при заданном х и условное по способу отбора выборочных единиц в выборке отличается от распределения у при заданном х (которое нас интересует). Для состоятельности оценки с фиксированными эффектами теперь требуется, чтобы
Е{(х„-х,.)е„1л(1.....г1Т} = 0. (10.90)
Это означает, что оценка с фиксированными эффектами несостоятельна, если факт, находится ли индивидуум в выборке или нет, говорит нам кое-что об ожидаемом значении остатка, который связан с хп. Ясно, что если справедливо условие (10.11) и ги не зависит от эффекта а, и всех остатков eis (для данного xis), то сформулированное выше условие удовлетворяется. Заметим, что отбор единиц в выборку может зависеть от эффекта а,-, не влияя на состоятельность оценки с фиксированными эффектами для вектора параметров ß . Фактически, даже е(7 может зависеть от ги до тех пор, пока их соотношение не зависит от времени (подробности см. в работах (Verbeek, Nijman, 1992,1996)).
В дополнение к условию (10.90), условия для состоятельности оценки со случайными эффектами теперь задаются в виде
I'm..... Пг) = 0
и
е{х,а,\гп.....гп ) = 0. (10.91)
Условия не позволяют математическому ожиданию любой компоненты остатка зависеть от индикаторов пропущенных данных (наблюдений). Если менее вероятно, что индивидуумы с определенными значениями для их ненаблюдаемой гетерогенности а, будут наблюдаться в некотором такте времени панельных данных, то, как правило, это будет приводить к смещению оценки со случайными эффектами. Аналогично, если более вероятно, что индивидуумы с определенными возмущениями е(( имеют пропущенные данные (наблюдения), то оценка со случайными эффектами, как правило, несостоятельна. Заметим, что поскольку оценка с фиксированными эффектами позволяет пропущенным данным зависеть от эффектов а, и от возмущений еи независимо от времени, то она является более устойчивой к смещениям из-за пропущенных данных, чем оценка со случайными эффектами. Другое важное наблюдение, сделанное в статье (Verbeek, Nijman, 1992) состоит в том, что оценки для несбалансированных панельных данных не обязательно страдают меньше от смещения из-за пропущенных данных, чем оценки для сбалансированных подпанельных данных. В общем, смещения из-за пропущенных данных в
He 1 2006
оценках для несбалансированных и сбалансированных выборок не обязательно будут одинаковыми, и их относительная величина априори не известна.
В статье (Verbeek, Nijman, 1992) предлагается ряд простых тестов на смещение из-за пропусков в данных. Эти тесты основаны на вышеупомянутых наблюдениях. Во-первых, поскольку условия для состоятельности утверждают, что остатки модели должны, в том или другом смысле, не зависеть от индикаторных
переменных, то их можно протестировать, просто включая некоторую функцию от rn..... riT в модель и
проверяя ее значимость. Ясно, что нулевая гипотеза, говорящая о том, что индивидуум наблюдался в любом из тактов времени от 1 до Т, не давала бы нам никакой информации о его ненаблюденных значениях в модели. Очевидно, что добавление rit в модель (10.84) приводит к мультиколлинеарности, так как rjt =1
для всех наблюдений в выборке. Вместо этого следует добавить некоторые функции от rn..... riT, такие,
например, как л,. ,_1( с, =П(=Л ИЛИ = Е Li ги < показывающие соответственно наблюдалась ли выборочная единица / в предыдущем временно'м такте, или она наблюдалась в течение всех тактов времени, или какое общее число тактов времени эта единица наблюдалась. Заметим, что в сбалансированной субпанели все значения переменных таких функций идентичны для всех индивидуумов, и таким образом включаются в свободный член. В статье (Verbeek, Nijman, 1992) предполагается, что включение с,, и 7", может обеспечить приемлемую процедуру, чтобы проверить наличие смещения из-за пропущенных данных. Отметим, что это требует, чтобы модель оценивалась в рамках схемы со случайными эффектами, поскольку внутригрупповое преобразование исключило бы с, и 7" . Конечно, если нулевые гипотезы не отклоняются, то это еще не является основанием для их принятия, т. е. для утверждения об отсутствии смещения из-за пропущенных данных, поскольку мощность критериев может быть низкой.
Другая группа тестов основана на идее, что четыре различных оценки для моделей со случайными и фиксированными эффектами, основанные либо на сбалансированной субпанели, либо на несбалансированных панельных данных, обычно имеют различные смещения из-за пропуска данных. Поэтому сравнение этих оценок может служить показанием правдоподобия смещения из-за пропущенных данных. Однако, хотя и можно сравнить любую пару оценок (см. (Verbeek, Nijman, 1992) или (Baltagi, 1995, Section 10.5)), известно, что оценки с фиксированными и случайными эффектами могут различаться и по другим причинам, чем смещение из-за пропущенных данных (см. п. 3 параграфа 10.2). Поэтому, наиболее естественно сравнивать либо оценки с фиксированными, либо оценки со случайными эффектами, использующие сбалансированную субпанель, с их аналогами, использующими несбалансированные панельные данные. Если различные выборки, отобранные на основе индикаторов rn.....riT, приводят к значимо различным оценкам,
то процесс отбора должен говорить нам кое-что о пропущенных наблюдениях в модели. Таким образом, значимо различные оценки указывают на наличие смещения из-за пропущенных данных. Поскольку оценки, использующие несбалансированные панельные данные, эффективны внутри специфического класса оценок, то мы опять можем использовать результат Хаусмана и вывести критическую статистику, основанную на оценке со случайными эффектами, в виде (сравните с критической статистикой (10.27)),
^сэ = (Рсэ -Рсэ)'[^Рсэ}-^Гсэ}Г1(^э -Рсэ)< <10-92)
^ где V обозначают оценки ковариационных матриц, а надстрочные прописные буквы С и Н относятся
| к сбалансированной и несбалансированной выборке соответственно. Точно так же можно получить
Ц тест, основанный на двух оценках с фиксированными эффектами. При нулевой гипотезе критическая
* статистика подчиняется хи-квадрат распределению с /(степенями свободы. Заметим, что неявная ну-
| левая гипотеза для такого теста состоит в том, что рИт((3£э-(3£э) = 0. Если такая гипотеза верна
| приближенно, или обе эти оценки страдают от смещения из-за пропущенных данных в равной степе-
§ ни, то тест не имеет никакой мощности30. Отметим, что можно проводить такое же тестирование лишь
о для подмножества элементов вектора (3.
§ "Предложенный здесь тест реально не является тестом Хаусмана, поскольку при альтернативной гипотезе ни одна из оценок
§ не является состоятельной. Тем не менее, тест, сам по себе, является корректным; просто, при применении в определенных обсто-
£ ятельствах он может характеризоваться ограниченной мощностью.
10.7.3. Оценивание с неслучайно пропущенными данными *
Как и в пространственном («cross-sectional») случае (см. параграф 7.5) смещение из-за пропущенных о.
данных порождает проблему идентификации. В результате при наличии смещения из-за пропущенных и
данных, если не наложить дополнительные предположения, состоятельное оценивание параметров §
модели невозможно. В качестве примера предположим, что индикатор пропущенных данных ги мож- ^ но объяснить пробит-моделью со случайными эффектами, т.е.
r^z^ + ^+n,.,, (10.93)
где ги =1, если r*t >0 и rit = 0 в противном случае, a zn —(хорошо-мотивированный) вектор экзогенных переменных, который включает хи. Интересующая нас модель задается в виде
yit=x'it\3 + a,+ei(. (10.94)
Предположим, что компоненты остатков модели в этих двух уравнениях имеют совместное нормальное распределение. Тем самым приходим к обобщению пространственной выборочной модели с пропущенными данными, которая рассматривалась в пункте 1 параграфа 7.4. Влияние ограничений на формирование выборки для модели (10.94) отражается в математических ожиданиях ее ненаблюдаемых компонентов, условных по экзогенным переменным и индикаторам пропуска, т.е.
£{<*; I z(1.....ziT,rn.....rIT] (10.95)
и
Е{е„ I zn.....ziT,riv...,riT}. (10.96)
Можно показать (Verbeek и Nijman, 1992), что условное математическое ожидание (10.96) не зависит от времени, если cov{ е/(, цп } = 0, или если z'( 4 не зависит от времени. Это требуется для состоятельности оценок с фиксированными эффектами. Далее условное математическое ожидание (10.95) равно нулю если cov{ а,, } = 0, тогда как условное математическое ожидание (10.96) равно нулю если cov{ е/(, т\и} = 0, так что оценка со случайными эффектами состоятельна если ненаблюдаемые переменные в основном уравнении (10.94) и в уравнении для индикатора пропуска (10.93) некоррелированы.
В общем случае оценивание относительно более сложное. В статье (Hausman, Wise, 1979) рассматривается случай, когда панельные данные включают два такта времени, и пропущенные наблюдения имеют место только на втором такте. В более общем случае применение метода максимального правдоподобия для одновременного оценивания этих двух уравнений требует численного интегрирования в пространстве размерности выше двух (чтобы с помощью интегрирования исключить эти два индивидуальных эффекта). В статьях (Nijman, Verbeek, 1992) и (Vella, Verbeek, 1999) представлены альтернативные оценки, основанные на двухшаговом методе оценивания для пространственной выборочной модели с пропущенными данными. По существу, идея состоит в том, что члены в условных математических ожиданиях (10.95) и (10.96), кроме константы, можно определить из пробит-модели (10.93), так что оценки этих членов могут включаться в основное уравнение. В статье (Wooldridge, 1995) представлены некоторые альтернативные оценки на основе несколько других предположений.
Упражнения
Упражнение 1 (линейная модель)
Рассмотрим следующую простую модель панельных данных
у„ = xif0 + a*+ei(, / = 1.....N, t = 1.....Г, (10.97)
Не 1 2006
133
Не 1 2006 ^
в которой ß — одномерный неизвестный параметр, и предполагается, что
а*=х,\ + а,. а а, ~НОНР (0,ст2), е,( ~ НОНР (0,а*),
взаимно независимы, и независимы от всех xit, где х, = (1/7~)E[=i хи.
Параметр ß в модели (10.97) можно оценить с помощью оценки с фиксированными эффектами (или с помощью внутригрупповой оценки), заданной в виде
Е,^ ELi(x„-x,)(y„-y,) РфЭ Е/^ЕЫ*,,-*,)2 '
Как альтернатива, корреляция между остатком а* +е,( и переменной х/( может быть учтена с помощью применения метода инструментальных переменных.
а. Приведите выражение для МИП-оценки Зип параметра ß в модели панельных данных (10.97), используя в качестве инструментальной переменной для х/( переменную хп — х(. Покажите, что ßMn и ßao идентичны.
Другой способ исключать индивидуальные эффекты а* из модели состоит во взятии первых разностей. В результате приходим к выражению
У/(-Уи-1 = (*„-*;. f_i)3 + (e,.f —е, /' = 1.....Л/, t = 1.....Т. (10.98)
б. Обозначьте МНК-оценку, основанную на модели первых разностей (ПР) (10.98), через ßnp. Покажите, что оценка ßnp идентична оценкам ßMn и ß(D3, если Т = 2. Эта идентичность для Т >2 больше не справедлива. В таком случае какую из этих двух оценок Вы бы предпочли? Объясните. (Примечание: для дополнительного обсуждения см. (Verbeek, 1995).)
в. Рассмотрите межгрупповую оценку ßM параметра ß в модели (10.97). Дайте выражение для оценки ßM и покажите, что она является несмещенной для векторного параметра ß + X.
г. И, наконец, предположите, что мы подставляем выражение для а* в модель (10.97) и получаем
У,, =x'tß + xi\ + a,+£it, /=1.....Л/, f = 1.....Т. (10.99)
Вектор (ß, X)' можно оценить с помощью ОМНК (случайные эффекты) из модели (10.99). Можно показать, что полученная таким образом оценка параметра ß идентична оценке ßos . Означает ли это, что никакого реального различия между подходами случайных и фиксированных эффектов нет? Примечание: для дополнительного обсуждения см. (Hsiao, 1986, Sect. 3.4.2а).
Упражнение 2 (модель Хаусмана-Тейлора)
К Рассмотрим следующую линейную модель панельных данных
У„= х'и,3,+х'2 лРг+м'уУАК .,у2+а,.+е„, (10.100)
I
| в которой wk j не зависит от времени, а хк iv являются объясняющими переменными, изменя-i
ющимися во времени. Переменные с индексом 1 (х'и и ,) строго экзогенны в том смысле, что | Е{х1/(а( } = 0, Е{х11(.,е,,} = 0 для всех 5 и Г, Е {а,} = 0 и Е{и/1 е,(} = 0.Также предполагается, что Е{ в,,} = 0 и что выполняются обычные условия регулярности (обеспечивающие состоятельность и асимптотическую нормальность).
а. При каких дополнительных предположениях, МНК, примененный к модели (10.100), обеспечивает состоятельную оценку для векторов параметров 3 = (Р1, (32)' и ч2)'?
б. Рассмотрите (внутригрупповую) оценку с фиксированными эффектами. При каких дополнитель-
с £ £
1
о ных предположениях она являлась бы состоятельной оценкой для вектора параметров (3?
в. Рассмотрите МНК-оценку для вектора параметров р на основе регрессии в первых разностях. Ц: При каком (каких) дополнительном предположении(ях) эта оценка является состоятельной для векто-
< ра параметров ß?
На 1 2006
г. Обсудите одну или более альтернативных состоятельных оценок для векторов параметров 0 и ^ | при предположениях: Е{хг ¡5е11} = 0 (для всех 5 и г), и Е{ чч2 ;б/(} = 0. Каковы ограничения в этом о. случае на число переменных в каждой из категорий? а
д. Обсудите оценивание вектора параметров (3, если х2П равняется уи_г §
е. Обсудите оценивание вектора параметров (3, если х2 п включает у, ,_г ^
ж. Можно ли оценить состоятельно, как вектор параметров (3, так и вектор параметров % если х2 и включает у,.,_.,? Если можно, то как? В противном случае, почему нет? (В случае необходимости сделайте дополнительные предположения.)
Упражнение 3 (динамические модели и модели бинарного выбора)
Рассмотрим следующее динамическое уравнение заработной платы
иг„ + + (10.101)
где м 1 ( обозначает логарифм почасовой ставки заработной платы индивидуума, а хи — вектор персональных характеристик и характеристик работы (возраст, время обучения, пол, отрасль промышленности, и т.д.).
а. Объясните на словах, почему МНК, примененный к модели (10.101), является несостоятельным.
б. Объясните также, почему оценка с фиксированными эффектами, примененная к модели (10.101), является несостоятельной при Л/ —> сю и фиксированном Т, но состоятельная при N —* оо и Т —> оо. (Предположите, что остатки е|( являются независимо и одинаково распределенными.)
в. Объясните, почему результаты из пунктов а и б также означают, что оценка со случайными эффектами (ОМНК-оценка) для модели (10.101) будет несостоятельной и при фиксированном Т.
г. Опишите простую состоятельную (при Л/-»°о) оценку для вектора параметров |3 и параметра у, предполагая, что а и выявляются независимо и одинаково распределенными и независимыми от всеххг
д. Опишите более эффективную оценку для вектора параметров (3 и параметра ч при тех же самых предположениях.
В дополнение к уравнению заработной платы предположим, что существует модель бинарного выбора, объясняющая, работает индивидуум или нет. Пусть л/( = 1, если индивидуум / работал в такте времени Г, и л,, = 0 в противном случае. Тогда модель можно написать как
ги = 1, если г*, > 0,
л/( = 0 в противном случае. (10.102)
где ги — вектор персональных характеристик. Предположим что £,, ~НОНП(0, ст^) и Г|,( ~НОНП(0, 1-а^), взаимно независимы и независимы от всех г/г Модель (10.102) можно оценить методом максимального правдоподобия.
е. Дайте выражение для вероятности того, что ги = 1, при заданных z(.( и
ж. Используйте выражение из пункта е, чтобы получить выражение вклада индивидуума /' в правдоподобие, легко поддающееся обработке в вычислительном отношении.
з. Объясните, почему невозможно рассмотреть эффекты как фиксированные неизвестные параметры и оценить 8 состоятельно (при фиксированном Г) из пробит-модели с фиксированными эффектами?
С этого момента предположим, что соответствующее уравнение заработной платы является статическим и задается выражением (10.101) с параметром ч = 0.
и. Каковы последствия для оценки со случайными эффектами модели (10.101), если т],., и е/( кор-релированы? Почему?
к. Каковы последствия для оценки с фиксированными эффектами модели (10.101), если и а, коррелированы (в то время как т1/( и еп нет)? Почему?
N_