Прикладная эконометрика, 2018, т. 50, с. 23-42. Applied Econometrics, 2018, v. 50, pp. 23-42.
А. В. Аистов1
Доходы респондентов разных поколений
В работе использованы данные Российского мониторинга экономического положения и здоровья населения НИУ ВШЭ (RLMS-HSE) за 1994-2016 гг. для оценки и сравнения возрастных профилей доходов респондентов разных поколений. Известная методология, в основе которой лежит регрессия на главные компоненты, позволила обойти проблему мультиколлинеарности возраста, периода и когорты в уравнениях доходов. Представленное в работе сравнение выявило отставание доходов некоторых поколений мужчин от доходов молодых когорт и противоположный эффект для некоторых поколений женщин.
ключевые слова: уравнение доходов; возрастной профиль доходов; мультиколлинеарность; панельные данные; РМЭЗ НИУ ВШЭ; главные компоненты. JEL classification: D31 ; C230.
1. введение
Сопоставление идеологических ценностей и образа жизни разных поколений привлекало человечество на всех этапах развития общества. Этот очевидный факт хорошо известен, например, из уроков литературы. Настоящее исследование посвящено материальной стороне данного вопроса, а именно, сравнению доходов представителей разных поколений (в реальном выражении — с учетом инфляции).
Использование классической линейной регрессионной модели для построения возрастных профилей доходов (изменений доходов с возрастом), разделяющихся по поколениям, осложнено отсутствием идентификации некоторых параметров. Речь идет о коэффициентах наклона объясняющих переменных «год рождения», «возраст», «год наблюдения», оцененных на панельных данных, и коэффициентах «год рождения», «возраст», оцененных на кросс-секциях, для уравнений доходов Минсеровского типа (Mincer, Polachek, 1974). В литературе эта проблема хорошо известна под названием «age-period-cohort (APC) problem» (Yang, Land, 2013), ее смысл состоит в наличии полной2 мультиколлинеарности: «год наблюдения» = «год рождения» + «возраст». В рамках настоящего исследования выполнены эмпирические оценки, не страдающие указанным выше недостатком, позволяющие построить возрастные профили доходов респондентов разных поколений и сравнить их между собой.
Основной гипотезой данного исследования является утверждение о различии доходов респондентов одного возраста, принадлежащих разным поколениям. Ожидается статистически значимое превышение доходов молодых поколений по сравнению с доходами старших
1 Аистов Андрей Валентинович — Национальный исследовательский университет «Высшая школа экономики», Нижний Новгород; [email protected].
2 Некоторые авторы называют ее чистой или совершенной.
поколений в одинаковом возрасте (с учетом изменения уровня цен, поскольку доходы оцениваются в разные исторические моменты времени).
Выдвинутая гипотеза проверяется для российского рынка труда за период с 1994 по 2016 г. с использованием данных Российского мониторинга экономического положения и здоровья населения НИУ ВШЭ (RLMS-HSE), проводимого Национальным исследовательским университетом «Высшая школа экономики» и ООО «Демоскоп» при участии Центра народонаселения Университета Северной Каролины в Чапел Хилле и Института социологии РАН .
2. Обзор литературы
Проблема эмпирических оценок функций трех линейно связанных переменных (возраст, год измерения, год рождения) уходит корнями далеко в прошлое. В работе Vandeschrick (2001), посвященной истории возникновения названия «диаграмма Лексиса», сказано, что примерно в 70-х годах XIX в. демографы столкнулись с необходимостью отображения на плоскости и анализа динамики популяций как функции возраста, года измерения и года рождения.
В настоящее время вряд ли удастся выявить авторов первых работ, посвященных решению проблемы отсутствия идентификации параметров в регрессионных APC (и аналогичных APC) моделях. Возможно, одним из них является Blalock (1967). В его статье регрессионная модель (в современных обозначениях) имеет следующий вид:
У г = A X2i +Рз Х3i + А4 X4i + £,, С1)
где один из регрессоров является функцией разности других: x4i = f ( x2i — kx3i ); A — искомые параметры; k — постоянный множитель; et — случайное слагаемое; i = 1,2,..., n.
Blalock (1967) отмечает возможность идентификации параметров А2, А3, А4 в случае нелинейной функции f Если зависимость между регрессорами линейная: x4i = c( x2i — kx3i ), где c — константа, он предлагает исключить один из регрессоров модели, уточняя при этом, что такой вариант возможен, если регрессор действительно (согласно смыслу решаемой прикладной задачи) не оказывает влияние на зависимую переменную.
Mason et al. (1973) со ссылками на работы других авторов и историю США обосновывают, что, например, в объяснении индивидуальных доходов ( yi в модели (1)) важны и возраст, и год измерения доходов, и когорта (год рождения). Они также отмечают, что проблема отсутствия идентификации А2, А3, А4 исчезает, если в модель (1) ввести нелинейную связь yt с хотя бы одним из регрессоров x2, x3, x4. В большинстве прикладных задач функциональный вид этой связи априорно не известен, поэтому Mason et al. (1973) предлагают ввести в модель (1) вместо регрессоров x набор бинарных переменных. В результате модель примет вид
ylt = U + a, + yt + ôk +£,t, (2)
где и — постоянное слагаемое; af — эффект i-й возрастной группы; yt — эффект периода t; ôk — эффект k-й когорты; i = 1,2,.,n; t = 1,2,...,T; k = 1,2,.,n + T — 1.
3 Сайты обследования RLMS-HSE: http://www.cpc.unc.edu/projects/rlms и http://www.hse.ru/rlms.
Такой подход не имеет единственного решения для разностей a{, gt, ôk. Mason et al. (1973) g показали, что для устранения этой неоднозначности достаточно предположить, что хотя бы s две возрастные группы, или хотя бы два периода, или две когорты имеют одинаковые коэф- щ фициенты (например, аг = a2 ). Выполненное ими численное моделирование подтвердило ч улучшение качества оценок параметров модели (2) с ростом числа корректно наложенных на них ограничений4. Mason et al. (1973) и их последователи (Fu, Hall, 2006; Fu, 2008; Yang, Land, 2013) неоднократно отмечали, что использование такой методологии подразумевает обладание надежной априорной информацией. Неправильные ограничения приводят к существенным смещениям оценок и искажениям динамики зависимой переменной в APC координатах (Fu, 2008; Yang, Land, 2013).
Для удобства дальнейшего изложения запишем модель (2) в виде
У = Xß + e, (3)
где y и e — вектор-столбцы значений зависимой переменой yit и шоков eit модели (2); X — матрица фиктивных переменных, вводимых для спецификации постоянного слагаемого m и фиксированных эффектов (FE) a, g, ô, записанных в виде вектор-столбца ß.
Некоторые авторы для идентификации ai, gt, ôk использовали временные интервалы, исключающие чистую мультиколлинеарность при агрегировании микроданных (Robertson, Boyle, 1986; Boyle, Robertson, 1987; Osmond, Gardner, 1989; Yang, Land, 2013). Одна из возможных реализаций такого подхода носит название «неперекрывающиеся когорты» (Robertson, Boyle, 1986; Boyle, Robertson, 1987; Osmond, Gardner, 1989). Ее идея состоит в следующем. Если сетку Лексиса (см. пример на рис. 2) разбить квадратами со сторонами, равными, например, 5-летнему интервалу по возрасту и по периоду, то в каждой клетке такого квадрата находятся представители разных когорт (выше диагонали — старшее поколение, ниже — молодые). Таким способом одной и той же паре «возраст - период» сопоставляются две разные когорты. Формально при этом матрица регрессоров X становится матрицей полного ранга, и OLS оценки параметров модели (3) могут быть вычислены. Более простым вариантом устранения чистой мультиколлинеарности является использование различающихся по длительности временных интервалов при разбиении (агрегировании) наблюдений по возрастам, периодам и/или когортам (Yang, Land, 2013). Однако указанные выше подходы не снимают полностью проблему идентификации APC эффектов, поскольку обусловленность матрицы XX зависит от выбора временных интервалов. Такие подходы эквивалентны наложению ограничений на APC коэффициенты модели (2), см. (Zheng et al., 2011; Yang, Land, 2013).
Другим известным способом идентификации APC эффектов является использование смешанных (linear mixed, LM) моделей, содержащих FE и случайные эффекты (RE)5. Например, Yang, Land (2006) в своем прикладном исследовании использовали иерархическую модель (hierarchical linear model, HLM) в которой вариации индивидуальных особенностей респондентов (второй уровень иерархии) описывались RE по периодам и когортам.
4 Например, к ограничениям коэффициентов при возрастах можно добавить ограничения для когорт.
5 Обычно такие модели специфицируют как иерархические или многоуровневые.
O'Brien et al. (2008)6 ввели RE для когорт, оставив FE для возрастов и периодов. Аналогичные подходы использовались рядом авторов, см., например, работы (Reither et al., 2009; Piontek et al., 2012; Dassonneville, 2013; Zhang, 2015) и обзоры литературы в них. К сожалению, результат, полученный в рамках смешанных или иерархических моделей, зависит от того, какой из компонентов APC введен как RE. Это объясняется тем, что RE спецификация равносильна наложению ограничения на модель, поскольку предполагает близкий к нулю тренд соответствующего компонента APC (O'Brien et al., 2008; Bell, Jones, 2014; O'Brien, 2015, 2017). Некорректно наложенное ограничение искажает динамику FE компонент модели.
Методология идентификации параметров APC модели, лишенная субъективизма исследователя при наложении ограничений, описана в работах Yang et al. (2004) и Yang, Land (2013), со ссылкой на более раннюю публикацию Fu (2000), в соответствии с которой эта методология получила название intrinsic estimator (IE)7.
Идея IE заключается в оценке параметров регрессии зависимой переменной y на главные компоненты матрицы XX, соответствующие ненулевым собственным значениям матрицы XX, и пересчете полученных параметров в значения ß.
Обзор литературы показывает, что IE наилучшим образом подходит для решения поставленной в рамках настоящего исследования задачи. Основным аргументом в пользу выбора данной методологии является нетребовательность к наличию информативных априорных ожиданий относительно предполагаемой динамики зависимой переменной в APC координатах. В свою очередь, этот метод может дать предварительную информацию для дальнейшего изучения неожиданных результатов, если такие будут обнаружены.
С целью сосредоточения на главном, в изложенном выше кратком обзоре литературы, посвященной нахождению APC эффектов, не говорилось о включении в модели контролирующих переменных. Последние не изменяют описанные выше алгоритмы и области их применимости, если не являются линейно связанными с APC компонентами. В ходе вычисления эмпирических оценок контролирующие переменные будут добавлены в модели.
3. Данные
В работе использованы файлы данных по домохозяйствам (HH_1994_2016_v2.7z) и индивидам (IND_1994_2016_v2.7z) RLMS-HSE8. Пересчет номинальных денежных величин в реальные (рубли июня 1992 г.) был осуществлен с помощью дефлятора, построенного с использованием номинальных и реальных расходов домохозяйств (сконструированных переменных), доступных на сайте RLMS-HSE .
6 Предварительные версии работ Yang, Land (2006) и O'Brien et al. (2008) были «одновременно» доложены авторами на Ежегодном собрании Американской социологической ассоциации 16-19 августа 2003 г в Атланте.
7 Fu (2000) подробно не описывает IE, ссылаясь на более раннюю свою (в соавторстве с Rohan) неопубликованную работу, но показывает, что IE является частным случаем ридж-регрессии.
8 https://dataverse.unc.edu/dataset.xhtml?persistentId=doi:10.15139/S3/12438.
9 https://dataverse.unc.edu/dataset.xhtml?persistentId=hdl:1902.29/11735&version=10.0.
Поскольку данные RLMS-HSE достаточно часто используются в российских эмпири- ¡5 ческих исследованиях, не будем подробно останавливаться на описании самого проекта § RLMS-HSE. Отметим лишь, что изначально он создавался для «мониторинга результатов ^ проводимых в России реформ в плане их воздействия на здоровье и экономическое благо- ч состояние» населения10.
Преимуществами RLMS-HSE для достижения целей настоящего исследования являются панельный характер данных и их репрезентативность для населения России (начиная с 1994 г.).
В рамках предварительного знакомства с данными были выполнены оценки плотности вероятности возрастов респондентов, ответивших на вопросы о своих доходах за последние 30 дней (от даты проведения интервью). Полученные результаты (для мужчин и женщин) приведены на рис. 1. Распределение возрастов показано для респондентов, получавших доход в любой форме: в рамках первой и второй работы, в виде случайных заработков, пособий, пенсий, прибыли и т. п.
0.030.020.01 -
00 10 20 30 40 50 60 70 80 90 100 Возраст
- Мужчины -----Женщины
Рис. 1. Распределение возрастов респондентов, ответивших на вопросы о доходах
(RLMS-HSE, 2000-2016 гг.)
С целью сохранения максимального числа наблюдений при выполнении эмпирических оценок, выборка респондентов не ограничивалась официальным пенсионным возрастом. Такой подход в полной мере соответствует поставленной в настоящем исследовании задаче — сравнить индивидуальные доходы представителей разных поколений. Все приведенные ниже оценки выполнены на выборке респондентов в возрасте 17-72 лет. Этот интервал обозначен на рис. 1 пунктирными линиями. Его левая граница соответствует окончанию средней школы. Достаточно плавное снижение правого хвоста распределения (см. рис. 1) объясняется высокой долей работающих пенсионеров.
Согласно нашим оценкам, с введением ограничения на возраст (17-72 лет) выборка мужчин сократилась лишь на 0.83%, а женщин — на 0.73% от максимально возможных объемов12.
10 http://www. cpc.unc.edu/projects/rlms-hse.
11 Ежегодный опрос, за исключением 1997 и 1999 гг.
12 Речь идет о респондентах, предоставивших информацию о своих доходах.
Возможную длительность участия респондентов разных поколений в опросе RLMS-HSE удобно представить в виде сетки Лексиса (рис. 2). Она наглядно показывает, какие поколения респондентов дают вклад в эмпирические оценки, выполняемые на данных, соответствующих разным годам опроса. Линии жизни предложенного на рис. 2 разбиения респондентов на когорты (поколения) позволяют представителям трех когорт принять участие во всех раундах RLMS-HSE. Старшая (1933-1943 гг. рождения) и младшая (1977-1988 гг.) когорты симметрично расположились относительно 2005 г. по критериям возможной длительности участия в опросе и одновременного входа в опрос и выхода из него для всех представителей соответствующего поколения (если искусственно разделить выборку 2005 годом).
Рис. 2. Сетка Лексиса (числа около линий жизни — годы рождения; пятизначные числа — количество наблюдений, ограниченное соответствующими календарными годами и линиями жизни)
ч о
X
о
ч:,
Мужчины
Женщины
I I I I
1 I I 1 I I
i1
11
ч о
X
о
]
1994 1996 2000 2002 2004 2006 2008 2010 2012 2014 2016
Год
1944-1954 1955-1965 1966-1977
1994 1996 2000 2002 2004 2006 2008 2010 2012 2014 2016
Год
1944-1954 1955-1965 1966-1977
Рис. 3. Логарифм реальных доходов респондентов (1944-1954, 1955-1965 и 1966-1977 гг. рождения), вертикальными отрезками обозначены 95%-ные доверительные интервалы
В качестве предварительного знакомства с данными, на рис. 3 представлены средние доходы респондентов (разделенных на три когорты), имевших потенциальную возможность участвовать во всех раундах RLMS-HSE (согласно рис. 2).
9 -
8.5
8.5
7.5
7.5-
Наблюдаемые у мужчин статистически значимые различия средних доходов (рис. 3), на- ¡5 чавшиеся примерно в 2005 г., могут быть легко объяснены теоретически. Согласно рис. 2, § в рассматриваемые годы в выборку входят респонденты разных поколений. Одни из них ^ (младшая когорта) находятся на этапе роста средней отдачи от человеческого капитала, ч у других (старших поколений), возможно, амортизация начинает преобладать над инвестициями в человеческий капитал — они находятся в возрасте снижения своей средней производительности, в условиях рыночной экономики это сопровождается снижением индивидуальных доходов. В результате происходит расслоение общества по доходам.
У женщин различия средних доходов представительниц разных поколений выражены не столь ярко. Статистически значимые различия между некоторыми когортами наблюдаются лишь на «хвостах» опроса RLMS-HSE. Эти различия, аналогично примеру с мужчинами, могут быть объяснены с использованием сетки Лексиса (рис. 2) и теории человеческого капитала — немонотонное изменение индивидуальных доходов с возрастом и вхождение в выборку респондентов разных поколений.
4. Эмпирические оценки
4.1. Непараметрические оценки
Выдвинутые выше предположения о причинах различий доходов разных поколений подтверждаются простыми непараметрическими оценками. На рисунке 4 показаны результаты усреднения доходов в рамках пяти когорт, представленных на рис. 2 сеткой Лексиса. Три средние возрастные группы имели возможность участвовать во всех раундах RLMS-HSE с 1994 по 2016 гг. Младшая и старшая когорты — только в половине раундов (ограничены 2005 годом). Респонденты, попадавшие в треугольные области сетки Лексиса (рис. 2),
20 30 40 50 60 70
Возраст
---- 1933-1943 ------- 1944-1954 — ■ - 1955-1965
-- 1966-1976 - 1977-1988 ------- Все
/ ~7" ...
/ Ч
/
/7/
-f-
40 50
Возраст
---- 1933-1943
-- 1966-1976
1944-1954 --- 1955-1965
1977-1988 ------- Все
9
8.5
8.5
18
18
7.5
7.5
6.5
6.5
Рис. 4. Изменения логарифма доходов с возрастом в 1994-2016 гг.; серый цвет — 95%-ные доверительные интервалы; пунктирная кривая без доверительного интервала — оценки на выборке, включающей респондентов до 1933 г. и после 1988 г. рождения (см. рис. 2)
не учитывались в усредненных в пределах когорт профилях доходов и в усреднении по всем когортам (кривая «Все» на рис. 4). Пунктирной кривой без доверительного интервала (чтобы не загромождать рисунок) показан усредненный профиль доходов всех респондентов, включая треугольные области сетки Лексиса.
Рисунок 4 является иллюстрацией уникальности российских данных при выполнении декомпозиции доходов респондентов на составляющие «возраст-период-когорта». Особенность этих данных заключается в том, что индивидуальные реальные доходы представителей некоторых поколений имеют локальный минимум, обусловленный кризисом 1998 года. Согласно представленным на рис. 4 оценкам, минимум является статистически значимым у мужчин 1933-1943 и 1955-1965 гг. рождения и у двух старших поколений женщин. Например, у мужчин 1963 г. рождения минимум реальных доходов наблюдался в 35 лет. Женщинам, родившимся в 1951 г., было в 1998 г. 47 лет. Судя по результатам, полученным для молодых поколений (см. рис. 4), и исследованиям для других стран (Klevmarken, 1993; Myck, 2010; Cushing, Rosenbaum, 2010; Rupert, Zanella, 2015), в соответствующие годы жизни у представителей этих поколений в условиях спокойного развития экономики должен был наблюдаться рост реальных доходов.
Представленные на рис. 4 результаты ставят под сомнение возможность использования полиномов второй степени (часто применяемых в эмпирических исследованиях) для унифицированного корректного описания индивидуальных профилей доходов представителей любого поколения. Одним из выходов из данной ситуации является использование фиксированных эффектов, аналогично модели (2).
Интересно отметить, что возрастное распределение средних доходов в обществе мало зависит от года сбора данных (рис. 5) и согласуется с оценками для России, представленными в работах (Гимпельсон, Капелюшников, 2007a, b).
Мужчины
Женщины
У //
7>V
20 30 40 50 60 70
Возраст
-- 1994 ------- 1998 — ■ - 2004
------- 2009 --- 2014 - 2016
20 30 40 50 60 70
Возраст
-- 1994 ------- 1998 — ■ - 2004
------ 2009 --- 2014 - 2016
Рис. 5. Кросс-секционные оценки зависимости логарифма доходов респондентов от возраста; серый цвет — 95%-ные доверительные интервалы (для 1998 и 2016 гг.)
4.2. Параметрические оценки §
о s
Дальнейший анализ выполнен в рамках IE методологии. С целью иллюстрации преиму- ^ ществ данного метода, удобства интерпретации и сравнения результатов с предварительными непараметрическими оценками, были получены оценки параметров базовых IE моделей, содержащих лишь FE APC компоненты (аналогичные модели (2)), и оценки параметров моделей, скорректированных введением дополнительных контролирующих переменных. Контроль осуществлялся на демографические характеристики домохозяйства, уровень образования и профессию респондента, вид населенного пункта, регион.
Описательные статистики контролирующих переменных представлены в таблицах 1 и 2. Большинство этих переменных имеют самообъясняющие названия. В качестве дополнительной информации (для удобства восприятия при анализе результатов) в таблицы включены средние значения логарифма доходов, возраста и года рождения для всех поколений и выборки в целом. Средние значения возраста и года рождения округлены до ближайшего целого числа, стандартные ошибки оставлены до округления.
Судя по описательной статистике (табл. 1 и 2), число детей и размер домохозяйства в «традиционных» регрессиях (не APC моделях) могут контролировать эффекты когорт (играть для них роль прокси переменных), но не столь подробно и однозначно, как это выполнено при разбиении респондентов на пять поколений. Например, из таблиц видно, что регрессор, равный числу детей до 6 лет, выделяет две младшие когорты (поколения 1966-1988 гг. рождения) на фоне остальных, поскольку среднее значение этого показателя высоко именно для этих поколений. Следующий регрессор (дети 6-16 лет) выделяет когорты женщин и мужчин 1966-1976 гг. рождения на фоне остальных. На выборке мужчин этот показатель высок и у когорты 1955-1965 гг. рождения. Наименьший размер домохозяйства наблюдается у людей старшего поколения (когорта респондентов 1955-1943 гг. рождения).
Уровень образования является контролем на человеческий капитал респондентов (отражающийся на их доходах) — наблюдаются ожидаемые и легко объяснимые различия уровня образования у респондентов разных поколений (табл. 1 и 2).
С целью контроля возможных различий доходов респондентов, связанных с уровнем специфического человеческого капитала, в регрессионные модели были введены бинарные переменные, созданные согласно Международной стандартной классификации профессий 2008 г. (ISCO-08). Таблицы 1 и 2 подтверждают различие распределений респондентов по профессиям в разных когортах.
Когортные различия средних значений бинарных переменных, определяющих вид населенного пункта, отражают структуру выборки RLMS-HSE. В регрессиях эти переменные частично контролируют стоимость потребительской корзины (анализируются реальные доходы респондентов). То же самое можно сказать и о региональных фиктивных переменных (табл. 1 и 2).
При получении оценок параметров регрессий (табл. 3) коэффициенты APC фиктивных
72 5
переменных нормированы следующим образом: = ^gj = ^ô ■ = 0, где й — годы про-
j=17 jîQ. j=1
ведения опроса RLMS-HSE, значения индексов суммирования соответствуют FE слагаемым для всех возрастов (от 17 до 72 лет), раундам RLMS-HSE (доступным на момент выполнения исследования) и пяти когортам (см. рис. 2). Благодаря такой нормировке APC коэффициенты
Таблица 1. Описательные статистики (средние значения), мужчины (2005 г.)
Когорты (годы рождения) Все
1933-43 1944-54 1955-65 1966-76 1977-88 1933-88
1п (Доход) 8.55 8.43 8.50 8.60 8.47 8.51
(0.06) (0.05) (0.03) (0.03) (0.03) (0.02)
Возраст (годы) 66 55 45 33 24 38
(0.29) (0.16) (0.12) (0.12) (0.12) (0.25)
Год рождения 1939 1950 1960 1972 1981 1967
(0.29) (0.16) (0.12) (0.12) (0.12) (0.25)
Число детей младше 6 лет в домохозяйстве 0.11 0.09 0.11 0.35 0.41 0.25
(0.04) (0.02) (0.01) (0.02) (0.02) (0.01)
Число детей 6-16 лет в домохозяйстве 0.15 0.20 0.51 0.74 0.19 0.44
(0.04) (0.03) (0.03) (0.03) (0.02) (0.01)
Размер домохозяйства (количество людей) 2.82 3.22 3.58 3.63 3.68 3.54
(0.15) (0.08) (0.05) (0.05) (0.06) (0.03)
Незаконченное среднее 0.16 0.08 0.04 0.04 0.10 0.07
(0.04) (0.01) (0.01) (0.01) (0.01) (0.01)
Средняя школа 0.13 0.20 0.18 0.17 0.12 0.17
(0.04) (0.02) (0.02) (0.01) (0.01) (0.01)
Начальное профессиональное 0.16 0.23 0.36 0.33 0.36 0.33
(0.04) (0.02) (0.02) (0.02) (0.02) (0.01)
Среднее профессиональное 0.18 0.19 0.18 0.19 0.13 0.17
(0.04) (0.02) (0.02) (0.02) (0.01) (0.01)
Незаконченное высшее 0.04 0.05 0.03 0.07 0.11 0.07
(0.02) (0.01) (0.01) (0.01) (0.01) (0.01)
Высшее образование 0.33 0.25 0.21 0.20 0.16 0.20
(0.05) (0.02) (0.02) (0.02) (0.02) (0.01)
Вооруженные силы 0.00 0.00 0.02 0.01 0.01 0.01
(0.00) (0.00) (0.00) (0.00) (0.00) (0.00)
Менеджеры 0.02 0.09 0.09 0.07 0.03 0.07
(0.02) (0.02) (0.01) (0.01) (0.01) (0.01)
Профессионалы 0.28 0.11 0.06 0.07 0.08 0.08
(0.05) (0.02) (0.01) (0.01) (0.01) (0.01)
Техники и специалисты 0.06 0.11 0.07 0.11 0.12 0.10
(0.03) (0.02) (0.01) (0.01) (0.01) (0.01)
Конторские служащие 0.02 0.01 0.01 0.01 0.02 0.01
(0.02) (0.01) (0.00) (0.00) (0.01) (0.00)
Сотрудники по обслуживанию и продажам 0.27 0.09 0.10 0.15 0.13 0.13
(0.05) (0.02) (0.01) (0.01) (0.01) (0.01)
Квалифицированные работники сельского, 0.00 0.01 0.01 0.01 0.00 0.01
лесного и рыбного хозяйства (0.00) (0.01) (0.00) (0.00) (0.00) (0.00)
Ремесленники и смежные профессии 0.21 0.31 0.28 0.22 0.27 0.26
(0.05) (0.03) (0.02) (0.02) (0.02) (0.01)
Операторы и сборщики 0.10 0.21 0.30 0.29 0.24 0.26
(0.03) (0.02) (0.02) (0.02) (0.02) (0.01)
Неквалифицированные работники 0.04 0.05 0.06 0.06 0.10 0.07
(0.02) (0.01) (0.01) (0.01) (0.01) (0.01)
Областной центр 0.67 0.45 0.43 0.46 0.46 0.46
(0.05) (0.03) (0.02) (0.02) (0.02) (0.01)
Окончание табл. 1
Когорты (годы рождения) Все
1933-43 1944-54 1955-65 1966-76 1977-88 1933-88
Город 0.21 0.24 0.30 0.30 0.28 0.28
(0.05) (0.02) (0.02) (0.02) (0.02) (0.01)
Поселок городского типа 0.06 0.07 0.05 0.05 0.04 0.05
(0.03) (0.01) (0.01) (0.01) (0.01) (0.00)
Сельская местность 0.06 0.23 0.21 0.19 0.23 0.21
(0.03) (0.02) (0.02) (0.02) (0.02) (0.01)
Москва и Санкт-Петербург 0.27 0.15 0.15 0.13 0.15 0.15
(0.05) (0.02) (0.01) (0.01) (0.01) (0.01)
Северный и Северо-Западный регионы 0.05 0.06 0.05 0.07 0.07 0.07
(0.02) (0.01) (0.01) (0.01) (0.01) (0.01)
Центральный 0.21 0.16 0.18 0.19 0.16 0.18
и Центрально-Черноземный регионы (0.05) (0.02) (0.02) (0.01) (0.01) (0.01)
Волго-Вятский регион 0.13 0.17 0.17 0.17 0.17 0.17
и бассейн реки Волги (0.04) (0.02) (0.01) (0.01) (0.02) (0.01)
Северо-Кавказский регион 0.11 0.09 0.11 0.12 0.10 0.11
(0.03) (0.02) (0.01) (0.01) (0.01) (0.01)
Уральский регион 0.06 0.16 0.16 0.14 0.18 0.16
(0.03) (0.02) (0.01) (0.01) (0.02) (0.01)
Западно-Сибирский регион 0.05 0.07 0.10 0.09 0.06 0.08
(0.02) (0.01) (0.01) (0.01) (0.01) (0.01)
Восточно-Сибирский 0.12 0.13 0.08 0.09 0.10 0.10
и Дальневосточный регионы (0.04) (0.02) (0.01) (0.01) (0.01) (0.01)
Объем выборки 82 341 636 680 609 2348
Примечание. В скобках указаны стандартные ошибки средних.
Таблица 2. Описательные статистики (средние значения), женщины (2005 г.)
Когорты (годы рождения) Все
1933-43 1944-54 1955-65 1966-76 1977-88 1933-88
1п (Доход) 8.34 8.32 8.16 8.08 7.81 8.09
(0.06) (0.03) (0.03) (0.03) (0.04) (0.02)
Возраст (годы) 66 55 45 34 24 40
(0.29) (0.14) (0.11) (0.11) (0.11) (0.23)
Год рождения 1939 1950 1960 1971 1981 1965
(0.29) (0.14) (0.11) (0.11) (0.11) (0.23)
Число детей младше 6 лет в домохозяйстве 0.05 0.09 0.08 0.29 0.45 0.22
(0.02) (0.01) (0.01) (0.02) (0.02) (0.01)
Число детей 6-16 лет в домохозяйстве 0.21 0.15 0.39 0.88 0.25 0.46
(0.06) (0.02) (0.02) (0.03) (0.02) (0.01)
Размер домохозяйства (количество людей) 2.35 2.73 3.27 3.52 3.49 3.27
(0.13) (0.07) (0.05) (0.05) (0.06) (0.03)
Незаконченное среднее 0.15 0.05 0.02 0.03 0.04 0.04
(0.04) (0.01) (0.01) (0.01) (0.01) (0.00)
Продолжение табл. 2 Когорты (годы рождения) Все
1933-43 1944-54 1955-65 1966-76 1977-88 1933-88
Средняя школа 0.13 0.17 0.14 0.08 0.09 0.12
(0.04) (0.02) (0.01) (0.01) (0.01) (0.01)
Начальное профессиональное 0.07 0.12 0.20 0.25 0.20 0.20
(0.03) (0.02) (0.01) (0.02) (0.02) (0.01)
Среднее профессиональное 0.24 0.35 0.31 0.28 0.23 0.29
(0.05) (0.02) (0.02) (0.02) (0.02) (0.01)
Незаконченное высшее 0.01 0.03 0.05 0.06 0.18 0.08
(0.01) (0.01) (0.01) (0.01) (0.02) (0.01)
Высшее образование 0.39 0.28 0.28 0.30 0.26 0.28
(0.05) (0.02) (0.02) (0.02) (0.02) (0.01)
Вооруженные силы 0.00 0.00 0.00 0.00 0.00 0.00
(0.00) (0.00) (0.00) (0.00) (0.00) (0.00)
Менеджеры 0.02 0.06 0.06 0.04 0.02 0.04
(0.02) (0.01) (0.01) (0.01) (0.01) (0.00)
Профессионалы 0.37 0.27 0.24 0.24 0.20 0.24
(0.05) (0.02) (0.02) (0.02) (0.02) (0.01)
Техники и специалисты 0.08 0.19 0.19 0.25 0.24 0.22
(0.03) (0.02) (0.01) (0.02) (0.02) (0.01)
Конторские служащие 0.05 0.08 0.08 0.09 0.10 0.09
(0.02) (0.01) (0.01) (0.01) (0.01) (0.01)
Сотрудники по обслуживанию и продажам 0.20 0.17 0.19 0.20 0.29 0.21
(0.04) (0.02) (0.01) (0.01) (0.02) (0.01)
Квалифицированные работники сельского, 0.00 0.00 0.00 0.00 0.00 0.00
лесного и рыбного хозяйства (0.00) (0.00) (0.00) (0.00) (0.00) (0.00)
Ремесленники и смежные профессии 0.01 0.03 0.06 0.05 0.04 0.05
(0.01) (0.01) (0.01) (0.01) (0.01) (0.00)
Операторы и сборщики 0.02 0.07 0.07 0.06 0.04 0.06
(0.02) (0.01) (0.01) (0.01) (0.01) (0.00)
Неквалифицированные работники 0.24 0.12 0.10 0.07 0.07 0.09
(0.05) (0.02) (0.01) (0.01) (0.01) (0.01)
Областной центр 0.61 0.49 0.44 0.43 0.47 0.46
(0.05) (0.02) (0.02) (0.02) (0.02) (0.01)
Город 0.20 0.27 0.28 0.33 0.26 0.28
(0.04) (0.02) (0.02) (0.02) (0.02) (0.01)
Поселок городского типа 0.06 0.07 0.06 0.05 0.05 0.05
(0.03) (0.01) (0.01) (0.01) (0.01) (0.00)
Сельская местность 0.13 0.18 0.22 0.20 0.22 0.20
(0.04) (0.02) (0.01) (0.01) (0.02) (0.01)
Москва и Санкт-Петербург 0.27 0.16 0.15 0.11 0.12 0.14
(0.05) (0.02) (0.01) (0.01) (0.01) (0.01)
Северный и Северо-Западный регионы 0.10 0.08 0.07 0.08 0.07 0.07
(0.03) (0.01) (0.01) (0.01) (0.01) (0.01)
Центральный 0.18 0.18 0.18 0.18 0.15 0.17
и Центрально-Черноземный регионы (0.04) (0.02) (0.01) (0.01) (0.01) (0.01)
Волго-Вятский регион 0.14 0.16 0.17 0.17 0.18 0.17
и бассейн реки Волги (0.04) (0.02) (0.01) (0.01) (0.02) (0.01)
Северо-Кавказский регион 0.08 0.09 0.10 0.12 0.10 0.10
(0.03) (0.01) (0.01) (0.01) (0.01) (0.01)
Окончание табл. 2
Когорты (годы рождения)
Все
1933-43 1944-54 1955-65 1966-76 1977-88 1933-88
Уральский регион 0.08 0.16 0.15 0.16 0.17 0.16
(0.03) (0.02) (0.01) (0.01) (0.02) (0.01)
Западно-Сибирский регион 0.08 0.09 0.08 0.09 0.08 0.08
(0.03) (0.01) (0.01) (0.01) (0.01) (0.01)
Восточно-Сибирский 0.06 0.09 0.10 0.09 0.12 0.10
и Дальневосточный регионы (0.03) (0.01) (0.01) (0.01) (0.01) (0.01)
Объем выборки 84 442 779 751 592 2648
о S
со
Примечание. В скобках указаны стандартные ошибки средних.
Таблица 3. Оценки параметров уравнений доходов
Мужчины
Женщины
(Б)
(К)
(Б)
(К)
FE возраста FE периода
1977-1988 гг. рождения
1966-1976 гг. рождения
1955-1965 гг. рождения
1944-1954 гг. рождения
1933-1943 гг. рождения
Число детей младше 6 лет в домохозяйстве
Число детей 6-16 лет в домохозяйстве
Размер домохозяйства
Средняя школа
Начальное профессиональное
Среднее профессиональное
Незаконченное высшее
Высшее образование
Вооруженные силы
Менеджеры
Да Да 0.060*** (0.022) 0.046*** (0.013) -0.009 (0.007) 0.027** (0.013) -0.123*** (0.024)
Да Да 0.031 (0.021) 0.048*** (0.012) -0.000 (0.007) 0.015 (0.012) -0.094*** (0.024)
0.081*** (0.007) 0.051*** (0.005) -0.008*** (0.003) 0.101*** (0.013) 0.082*** (0.012) 0.177*** (0.013) 0.189*** (0.017) 0.329*** (0.013) 0.494*** (0.030) 0.662*** (0.017)
Да Да -0.021 (0.021) -0.010 (0.012) 0.043*** (0.007) 0.050*** (0.012) -0.062*** (0.022)
Да Да -0.045** (0.021) -0.019 (0.012) 0.030*** (0.007) 0.036*** (0.012) -0.003 (0.025)
-0.193*** (0.007) 0.027*** (0.006) -0.009*** (0.003) 0.061*** (0.016) 0.018 (0.015) 0.108*** (0.015) 0.207*** (0.020) 0.345*** (0.016) 0.524*** (0.073) 0.634*** (0.016)
Окончание табл. 3
Мужчины Женщины
(Б) (К) (Б) (К)
Профессионалы 0.405*** 0.332***
(0.017) (0.013)
Техники и специалисты 0.418*** 0.300***
(0.016) (0.012)
Конторские служащие 0.234*** 0.249***
(0.026) (0.014)
Сотрудники по обслуживанию и продажам 0.213*** 0.212***
(0.015) (0.012)
Квалифицированные работники сельского, 0.181*** 0.226***
лесного и рыбного хозяйства (0.038) (0.073)
Ремесленники и смежные профессии 0.322*** 0.414***
(0.014) (0.017)
Операторы и сборщики 0.345*** 0.351***
(0.014) (0.016)
Областной центр 0.451*** 0.320***
(0.008) (0.008)
Город 0.378*** 0.258***
(0.008) (0.009)
Поселок городского типа 0.284*** 0.225***
(0.014) (0.014)
Региональные FE Да Да
Константа 8.246*** 7.442*** 7.893*** 7.343***
(0.004) (0.019) (0.003) (0.019)
Объем выборки 76799 56934 101095 66159
Примечание. В скобках указаны стандартные ошибки. *, **, *** — значимость на 10, 5, 1%-ном уровне соответственно.
(в табл. 3 и на рисунках 6-9) интерпретируются как отклонения от среднего значения. Например, коэффициент, соответствующий определенной когорте, показывает, насколько отличается среднее значение зависимой переменной для данной когорты от среднего значения по всем когортам при прочих равных условиях, определяемых другими контролирующими переменными (в том числе — возрастом и периодом). Остальные (дополнительные — не APC) контролирующие переменные введены в модели и интерпретируются, как это принято в традиционном регрессионном анализе. Например, в случае бинарной переменной коэффициент показывает отклонение от базовой категории.
Базовой категорией для бинарных переменных, отвечающих за уровень образования респондента (табл. 3), является «Незаконченное среднее». Для бинарных переменных, обозначающих профессию, базовой категорией является «Неквалифицированные работники»; для вида населенного пункта — «Сельская местность» (табл. 3).
В столбцах (Б) табл. 3 приведены оценки FE эффектов когорт для моделей, содержащих лишь APC компоненты. В столбцах (К) показаны оценки параметров моделей с дополнительными контролирующими переменными. С целью экономии места, в табл. 3 не приведены оценки FE коэффициентов для возраста и периода — они показаны графически на рис. 6-8. На этих рисунках окружности обозначают оценки параметров в рамках базовых моделей (столбцы (Б) табл. 3), сплошные кружки — в рамках моделей с дополнительными
1 - Мужчины ! 1 Женщины
0.5 - 0 1 1 ! т 1 # Ф» р й 0 5 ^ ' , i 1 «i 1 rf 1 0 л ! Ф4 а i Ф # в & [»
-0.5-1 - i ^ Ч * si 1 в 1 h -0.51 й I 1 -1 V J 0 h * i
Период
Период
Рис. 6. Оценки FE коэффициентов периодов; цифры на горизонтальной оси обозначают условный номер раунда RLMS-HSE (1 соответствует 1994 г.), вертикальными пунктирными линиями отмечены 1998 и 2009 гг.
о S
со
Мужчины
щ
$
Женщины
д^-х - "srargi
SjUieHHHlfcfiliiH«!*
. i
20 30 40 50
Возраст
60 70
20 30 40 50
Возраст
60 70
Рис. 7. Оценки FE коэффициентов возраста; вертикальными пунктирными линиями отмечены значения 33, 43, 55 и 60 лет
контролирующими переменными (столбцы (К) табл. 3), вертикальными отрезками показаны 95%-ные доверительные интервалы.
Использованная в рамках настоящего исследования 1Е методология предполагает, что ежегодные «шоки» ^Е эффекты периода) действуют одинаковым образом на все когорты и возрастные группы респондентов. Эта предпосылка заложена в записи модели (2) без перекрестных слагаемых. В результате получено качественное совпадение динамики FE эффектов периода (рис. 6) с непараметрическими оценкам, приведенными на рис. 3.
Аналогичная предпосылка используется и в отношении возрастного профиля доходов. 1Е оценки FE эффектов возраста аналогичны кросс-секционным — сравнению доходов респондентов разных возрастов (когорт) в фиксированном календарном году. Это наглядно
0.5
0.5 -
0 -
-0.5
0.5 -
-1
-1.5
1.5 -
-2
2 -
Мужчины
fi
Женщины
Когорта
Когорта
1 —
Рис. 8. Оценки FE коэффициентов когорт; цифры на горизонтальной оси обозначают респондентов: 1977-1988 гг. рождения, 2 — 1966-1976 гг. рождения, 3 — 1955-1965 гг. рождения, 4 — 1944-1954 гг. рождения, 5 — 1933-1943 гг. рождения
0.1 -
0.1 -
0 -
0 -
0.1-
0.1-
0.2-
0.2-
Мужчины
Женщины
Когорта
2 3
Когорта
Рис. 9. FE когорт на выборках 2000-2016 гг. (условные обозначения совпадают с рис. 8)
подтверждено качественным совпадением возрастных профилей доходов, представленных на рис. 7 для моделей (Б), с профилями рис. 5 и усредненным для всех когорт профилем рис. 4.
Интересные в прикладном плане изменения оценок возрастных профилей доходов происходят при введении в модели дополнительных контролирующих переменных — профили как мужчин, так и женщин становятся более горизонтальными (расширяется плато). То есть изменения реальных доходов объясняются, в основном, не возрастом, а изменениями соответствующих контролирующих переменных (которые, впрочем, могут происходить с возрастом). Следует заметить, что некоторые из этих переменных изменяют выборку наблюдений. Например, контроль профессий оставляет в данных лишь работающих респондентов. Это позволяет выявить примерно 22%-ное повышение доходов респондентов
0.1 -
0.1 -
0 -
0 -
0.1 -
0.1 -
0.2 -
0.2 -
при достижении ими пенсионного возраста (рис. 7). У работающих женщин скачок доходов g наблюдается в 55 лет. У мужчин это повышение доходов более плавное — растянуто при- s мерно на год в районе 60 лет. ^
Введение дополнительных контролирующих переменных в модель не вызвало статистически значимых изменений оценок когортных FE, если сравнивать оценку FE для отдельной когорты с той, которая была для этой когорты до введения контролирующих переменных. Изменяется лишь результат сравнения этих эффектов между собой для двух разных когорт — пропадает статистически значимое различие доходов женщин 1944-1954 и 19331943 гг. рождения (рис. 8).
Для мужчин введение в модели контролирующих переменных (см. столбцы (К) табл. 3 и рис. 8) не позволило устранить (и тем самым объяснить) статистически значимое (на 95%-ном уровне значимости) отставание доходов респондентов 1955-1965 гг. рождения от доходов когорты 1966-1976 гг. рождения и отставание доходов когорты 1933-1943 гг. рождения от доходов когорты 1944-1954 гг. рождения. Аналогичные выводы можно сделать и про статистически значимое превышение доходов женщин 1955-1965 и 1944-1954 гг. рождения над доходами женщин младших поколений (рис. 8).
Для проверки робастности полученных результатов к выбору временного интервала, на котором выполняются измерения, были выполнены IE оценки параметров APC моделей на данных 2000-2016 гг. — периоде относительно спокойного развития экономики, за исключением небольшого спада реальных доходов в 2009 г. (рис. 6).
Смена выборки не привела к качественным изменениям оценок APC эффектов. В качестве примера на рис. 9 показаны оценки эффектов когорт. Так же как и на данных, включающих кризис 1998 г. (и докризисный период), в моделях с дополнительными контролирующими переменными доходы мужчин 1955-1962 гг. рождения отстают от доходов респондентов 1966-1976 гг. рождения, а доходы когорты 1933-1943 гг. рождения в среднем ниже доходов респондентов 1944-1954 гг. рождения. Неизменными остались и оценки для женщин — доходы когорт 1944-1965 гг. рождения выше доходов младших поколений респондентов.
5. Заключение
В работе использованы данные RLMS-HSE 1994-2016 гг. для оценки возрастных профилей реальных (в ценах июня 1992 г.) доходов россиян и сравнения доходов нескольких поколений.
Предварительные оценки выполнены непараметрически. Они показали превышение доходов (более высокие профили в осях «доход - возраст») молодых поколений над доходами предшествующих генераций. К сожалению, такие выводы не вполне корректны, поскольку в рамках выполненных непараметрических оценок не был реализован контроль значений других объясняющих переменных. Другими словами, было бы интересно, например, оценивать условные математические ожидания доходов, контролируя не только когорту (год рождения респондента), но и год измерения дохода.
Одним из способов решения такой задачи является использование параметрических регрессионных моделей. Для преодоления чистой мультиколлинеарности (возникающей при одновременном включении в модели возраста, периода и когорты в качестве объясняющих переменных) при оценке параметров этих моделей в работе использована методология IE (Yang et al., 2004). Она заключается в выполнении проекций объясняющих переменных
исходной модели на ортогональный базис, оценке параметров регрессии зависимой переменной на этот базис и обратном пересчете полученных оценок параметров к исходным ре-грессорам.
Поскольку представители разных поколений могут различаться запасами человеческого и социального капитала (коррелирующими с их доходами), в модели были введены дополнительные контролирующие переменные — прокси для описания возможного расслоения респондентов по указанным выше характеристикам.
Полученные в рамках настоящего исследования зависимости доходов респондентов от возраста согласуются с результатами предыдущих исследований, относящихся к России, представленными, например, в работах (Гимпельсон, Капелюшников, 2007a, b).
В качестве новых результатов можно отметить обнаруженное отставание доходов некоторых поколений мужчин от доходов более молодых когорт респондентов и противоположный эффект для некоторых поколений женщин.
Основные полученные в рамках настоящего исследования результаты оказались устойчивыми к выбору контролирующих переменных, за исключением лишь изменений, связанных с ограничением выборки работающими респондентами при включении в модель некоторых контролирующих переменных. Побочным эффектом такого ограничения явилось выявление примерно 20%-ного увеличения доходов работающих респондентов за счет начисления пенсий.
Благодарности. Работа выполнена при финансовой поддержке РФФИ (проект № 17-06-00572).
Описок литературы
Гимпельсон В. Е., Капелюшников Р. И. (2007a). Заработная плата в России: эволюция и дифференциация / Под ред. В. Е. Гимпельсона, Р. И. Капелюшникова. Гос. ун-т — Высшая школа экономики. М.: Изд. дом ГУ-ВШЭ.
Гимпельсон В. Е., Капелюшников Р. И. (2007b). Заработная плата в России: эволюция и дифференциация. Экономический вестник «Beyond Transition» (октябрь-декабрь 2007), 7-8. http://www.cefir.ru/ index.php?l=rus&id=275.
Bell A. J., Jones K. (2014). Another 'futile quest'? A simulation study of Yang and Land's hierarchical age-period-cohort model. Demographic Research, 30 (11), 333-360.
Boyle P., Robertson C. (1987). Statistical modelling of lung cancer and laryngeal cancer incidence in Scotland, 1960-1979. American Journal of Epidemiology, 125, 731-744.
Cushing M. J., Rosenbaum D. I. (2010). Cohort effects in age-earnings profiles for women: Implications for forensic analysis. Eastern Economic Journal, 36 (3), 353-369.
Fu W. J. (2000). Ridge estimator in singular design with application to age-period-cohort analysis of disease rates. Communications in Statistics — Theory and Methods, 29 (2), 263-278.
Fu W. J., Hall P. (2006). Asymptotic properties of estimators in age-period-cohort analysis. Statistics and Probability Letters, 76 (17), 1925-1929.
Fu W. J. (2008). A smoothing cohort model in age-period-cohort analysis with applications to homicide arrest rates and lung cancer mortality rates. Sociological Methods and Research, 36 (3), 327-361.
Klevmarken N. A. (1993). Demographics and the dynamics of earnings. Journal of Population Economics, 6 (2), 105-122.
Mincer J., Polachek S. (1974). Family investment in human capital: Earnings of women. Journal of Po- щ
litical Economy, 82 (2), S76-S108. g
s
Myck M. (2010). Wages and ageing: Is there evidence for the 'inverse-U' profile? Oxford Bulletin of Economics and Statistics, 72 (3), 282-306. ^
O'Brien R. M., Hudson K., Stockard J. (2008). A mixed model estimation of age, period, and cohort effects. Sociological Methods and Research, 36 (3), 402-428.
O'Brien R. M. (2015). Age-period-cohort models: Approaches and analyses with aggregate data. CRC Press.
O'Brien R. M. (2017). Mixed models, linear dependency, and identification in age-period-cohort models. Statistics in Medicine, 36 (16), 2590-2600.
Osmond C., Gardner M. J. (1989). Age, period, and cohort models. Non-overlapping cohorts don't resolve the identification problem. American Journal of Epidemiology, 129 (1), 31-35.
Robertson C., Boyle P. (1986). Age, period and cohort models: The use of individual records. Statistics in Medicine, 5 (5), 627-638.
Rupert P., Zanella G. (2015). Revisiting wage, earnings, and hours profiles. Journal of Monetary Economics, 72 (C), 114-130.
Yang Y., Fu W. J., Land K. C. (2004). A methodological comparison of age-period-cohort models: The intrinsic estimator and conventional generalized linear models. Sociological Methodology, 34 (1), 75-110.
Yang Y., Land K. C. (2006). A mixed models approach to the age-period-cohort analysis of repeated cross-section surveys, with an application to data on trends in verbal test scores. Sociological Methodology, 36 (1), 75-97.
Yang Y., Land K. C. (2013). Age-period-cohort analysis: New models, methods, and empirical applications. CRC Press.
Zheng H., Yang Y., Land K. C. (2011). Variance function regression in hierarchical age-period-cohort models: Applications to the study of self-reported health. American Sociological Review, 76 (6), 955-983.
Поступила в редакцию 01.03.2018; принята в печать 31.04.2018.
Aistov A. V. Age-earnings profiles of different generations. Applied Econometrics, 2018, v. 50, pp. 23-42.
Andrey Aistov
National Research University Higher School of Economics, Nizhny Novgorod, Russian Federation; [email protected]
Age-earnings profiles of different generations
In this paper we compare age-earnings profiles between generations. Our empirical estimates are based on the Russia Longitudinal Monitoring Survey of HSE (RLMS-HSE), 1994-2015. Using intrinsic estimator, we overcome age-period-cohort problem inherent in Mincer-type earnings functions. Comparison presented in the work revealed that some male generations' income is less than that of the young cohorts and the opposite effect for some generations of women.
Keywords: earnings function; age-earnings profile; age-period-cohort problem; panel data; RLMS-HSE; intrinsic estimator. JEL classification: D31; C230.
References
Gimpelson V. E., Kapeljushnikov R. I. (2007a). Zarabotnaja plata v Rossii: jevoljucija i differenciacija / Pod red. V E. Gimpel'sona, R. I. Kapeljushnikova. Higher School of Economics.
Gimpelson V. E., Kapeljushnikov R. I. (2007b). Zarabotnaja plata v Rossii: jevoljucija i differenciacija. Jekonomicheskij vestnik «Beyond Transition» (oktjabr'- dekabr' 2007), 7-8.
Bell A. J., Jones K. (2014). Another 'futile quest'? A simulation study of Yang and Land's hierarchical age-period-cohort model. Demographic Research, 30 (11), 333-360.
Boyle P., Robertson C. (1987). Statistical modelling of lung cancer and laryngeal cancer incidence in Scotland, 1960-1979. American Journal of Epidemiology, 125, 731-744.
Cushing M. J., Rosenbaum D. I. (2010). Cohort effects in age-earnings profiles for women: Implications for forensic analysis. Eastern Economic Journal, 36 (3), 353-369.
Fu W. J. (2000). Ridge estimator in singular design with application to age-period-cohort analysis of disease rates. Communications in Statistics — Theory and Methods, 29 (2), 263-278.
Fu W. J., Hall P. (2006). Asymptotic properties of estimators in age-period-cohort analysis. Statistics and Probbility Letters, 76 (17), 1925-1929.
Fu W. J. (2008). A smoothing cohort model in age-period-cohort analysis with applications to homicide arrest rates and lung cancer mortality rates. Sociological Methods and Research, 36 (3), 327-361.
Klevmarken N. A. (1993). Demographics and the dynamics of earnings. Journal of Population Economics, 6 (2), 105-122.
Mincer J., Polachek S. (1974). Family investment in human capital: Earnings of women. Journal of Political Economy, 82 (2), S76-S108.
Myck M. (2010). Wages and ageing: Is there evidence for the 'inverse-U' profile? Oxford Bulletin of Economics and Statistics, 72 (3), 282-306.
O'Brien R. M., Hudson K., Stockard J. (2008). A mixed model estimation of age, period, and cohort effects. Sociological Methods and Research, 36 (3), 402-428.
O'Brien R. M. (2015). Age-period-cohort models: Approaches and analyses with aggregate data. CRC Press.
O'Brien R. M. (2017). Mixed models, linear dependency, and identification in age-period-cohort models. Statistics in Medicine, 36 (16), 2590-2600.
Osmond C., Gardner M. J. (1989). Age, period, and cohort models. Non-overlapping cohorts don't resolve the identification problem. American Journal of Epidemiology, 129 (1), 31-35.
Robertson C., Boyle P. (1986). Age, period and cohort models: The use of individual records. Statistics in Medicine, 5 (5), 627-638.
Rupert P., Zanella G. (2015). Revisiting wage, earnings, and hours profiles. Journal of Monetary Economics, 72 (C), 114-130.
Yang Y., Fu W. J., Land K. C. (2004). A methodological comparison of age-period-cohort models: The intrinsic estimator and conventional generalized linear models. Sociological Methodology, 34 (1), 75-110.
Yang Y., Land K. C. (2006). A mixed models approach to the age-period-cohort analysis of repeated cross-section surveys, with an application to data on trends in verbal test scores. Sociological Methodology, 36 (1), 75-97.
Yang Y., Land K. C. (2013). Age-period-cohort analysis: New models, methods, and empirical applications. CRC Press.
Zheng H., Yang Y., Land K. C. (2011). Variance function regression in hierarchical age-period-cohort models: Applications to the study of self-reported health. American Sociological Review, 76 (6), 955-983.
Received 01.03.2018; accepted 31.04.2018.