Обобщение регрессионных моделей с эндогенным переключением и неслучайным отбором на многомерный случай тема диссертации и автореферата по ВАК РФ 08.00.13, кандидат наук Потанин Богдан Станиславович

  • Потанин Богдан Станиславович
  • кандидат науккандидат наук
  • 2020, ФГАОУ ВО «Национальный исследовательский университет «Высшая школа экономики»
  • Специальность ВАК РФ08.00.13
  • Количество страниц 121
Потанин Богдан Станиславович. Обобщение регрессионных моделей с эндогенным переключением и неслучайным отбором на многомерный случай: дис. кандидат наук: 08.00.13 - Математические и инструментальные методы экономики. ФГАОУ ВО «Национальный исследовательский университет «Высшая школа экономики». 2020. 121 с.

Оглавление диссертации кандидат наук Потанин Богдан Станиславович

Введение

Неслучайный отбор как проблема эконометрического анализа

Краткий обзор методологии статистического оценивания параметров экономических моделей в условиях многокритериального неслучайного отбора наблюдений

Цели и задачи исследования

Научная новизна исследования

Структура исследования

Публикация результатов исследования

1 Обзор литературы

1.1 Классические методы оценивания параметров экономических моделей на цензурированных выборках

1.1.1 Метод Тобина

1.1.2 Метод Хекмана

1.2 Полупараметрические методы коррекции смещения отбора

1.2.1 Мотивация использования полупараметрических методов

1.2.2 Метод Ньюи

1.2.3 Полупараметрический двухшаговый подход Дас-Ньюи-Веллы

1.2.4 Полупараметрический трехшаговый разностный подход Робинсона

1.2.5 Полу-непараметрический подход Галланта и Нички

1.3 Методы коррекции многокритериального смещения отбора

1.3.1 Параметрические обобщения

1.3.2 Непараметрические обобщения

1.4 Краткий обзор альтернативных подходов

2 Обобщение метода Хекмана и модели с переключением на случай произвольного числа уравнений отбора

2.1 Обобщенная модель Хекмана

2.2 Оценивание обобщенной модели Хекмана методом максимального правдоподобия

2.3 Двухшаговая процедура оценивания обобщенной модели Хекмана

2.4 Состоятельная оценка асимптотической ковариационной матрицы

2.5 Предельные эффекты

3 Обобщение классических полупараметрических методов коррекции смещения отбора

3.1 Обобщение Метода Галланта и Нички

3.1.1 Двумерный случай

3.1.2 Общий случай

3.2 Обобщение Метода Ньюи

4 Анализ симулированных данных

4.1 Обзор исследований свойств и качества оценок модели Хекмана

4.2 Анализ обобщенной модели Хекмана на симулированных данных

4.2.1 Дизайн анализа симулированных данных

4.2.2 Первая спецификация

4.2.3 Вторая спецификация

4.3 Анализ точности оценок метода Хекмана при нарушении допущения о совместном нормальном распределении случайных ошибок

4.3.1 Дизайн эксперимента

4.3.2 Результаты симуляций со случайными ошибками из распределения Стьюдента

4.3.3 Результаты симуляций со случайными ошибками из Бета-распределения

4.3.4 Результаты симуляций со случайными ошибками из бимодального распределения

4.3.5 Выводы

5 Примеры практического использования предложенных методов

5.1 Применение обобщенного метода Хекмана для оценивания уравнения заработной платы по данным РМЭЗ за 2016 год

5.2 Оценка влияния высшего образования на заработную плату работника в условиях неслучайного отбора

5.2.1 Введение

5.2.2 Методология оценивания эффекта образования на зарплату

5.2.3 Эконометрическая модель

5.2.4 Эмпирическая база исследования

5.2.5 Анализ оценок эконометрической модели

5.2.6 Выводы о влиянии высшего образования на заработную плату мужчин

5.3 Оценивание эффекта брака на зарплату мужчин в России

5.3.1 Введение

5.3.2 Описание используемых данных

5.3.3 Методология

5.3.4 Результаты эконометрического анализа

5.3.5 Выводы о влиянии брака на заработную плату мужчин

Заключение

Приложение

A. Обозначения

B. Некоторые факты, связанные с многомерным нормальным распределением

В.1. Условное распределение

В.2. Изменение знака

B.3 Дифференцирование

C. Усеченное многомерное нормальное распределение

C.1. Определение

С.2. Маржинальная плотность

С.3. Моменты

С.4. Специальный случай

С.5. Дифференцирование в точке верхней границы

Б. Распределение Филипса-Галланта-Нички

Б.1. Определение

Б.2. Функция плотности

Б.3. Функция распределения и интервальная функция распределения

Б.4. Моменты

Б.5. Условное и маржинальное распределения

Б.6. Усеченное распределение

Е. Дополнительные результаты анализа симулированных данных

Список литературы

Рекомендованный список диссертаций по специальности «Математические и инструментальные методы экономики», 08.00.13 шифр ВАК

Введение диссертации (часть автореферата) на тему «Обобщение регрессионных моделей с эндогенным переключением и неслучайным отбором на многомерный случай»

Введение

Неслучайный отбор как проблема эконометрического анализа

Впервые проблема неслучайного отбора (selection bias1) была поднята А. Роем2. Он изучал влияние выбора профессии на распределение доходов и навыков среди различных профессиональных групп (Roy, 1951). В рамках предложенной им модели индивиды выбирают работу не случайно, а исходя из своих способностей и спроса на них. В результате навыки и доходы оказываются распределены внутри профессиональных групп не так, как между представителями всего общества. Это распределение может зависеть от количества профессий и совместного распределения навыков, а также от их влияния на оплату труда.

На базе данной модели возник обширный пласт литературы, посвященной проблемам идентификации и методам статистического оценивания параметров экономических моделей в условиях неслучайного отбора3.

Неслучайный отбор, в зависимости от механизма формирования выборки (sample selection), может приводить к цензурированию (censoring) или усечению (truncation). В обоих случаях предполагается существование некоторого правила, при соблюдении которого наблюдения попадают в выборку (sample selection rule). Классическим примером является наблюдение заработной платы индивидов4: на вопрос о зарплате отвечают лишь занятые респонденты (Heckman

1 Данный термин используется в англоязычной литературе как для указания на неслучайный характер формирования выборки, так и для обозначения смещения в статистических оценках параметров, вызванного использованием некорректного эконометрического инструментария, должным образом не учитывающего неслучайный отбор наблюдений. Смещение в оценках, возникающее в последнем случае будем именовать смещением отбора или систематической ошибкой отбора, а использование методов, позволяющих её избежать — коррекцией смещения (систематической ошибки) отбора или коррекцией смещения (систематической ошибкой) отбора.

2 В контексте модели Роя неслучайный отбор зачастую именуют самоотбором (self-selection), тем самым подчеркивая, что индивид самостоятельно выбирает профессию исходя из соображений максимизации дохода. Самоотбор, в свою очередь, является частным случаем цензурирования.

3 Обзор соответствующих исследований в контексте их соотношения с моделью Роя, а также её математическая формализация представлены, например, в (Heckman & Taber, Roy model, 2010) и (Heckman & Honore, 1990).

4 Если выборка была сформирована на основе опроса, проведенного лишь среди работающей части населения, то оценить вероятность попадания зарплаты случайно взятого индивида в данную выборку невозможно, в результате чего она оказывается усеченной. Если же выборка была собрана посредством опроса случайно выбранных

5

& Killingsworth, 1987). Ключевое различие между усеченными и цензурированными выборками заключается в том, что "при использовании усеченной выборки нельзя воспользоваться имеющейся информацией для того, чтобы оценить вероятность доступности наблюдения" (Heckman J. , 1976, p. 478). При этом, в контексте регрессионного анализа, речь идет, как правило, о наблюдаемости зависимых переменных. Тогда под усечением подразумевается, что в выборку попадают лишь наблюдения с принадлежащими определенному множеству значениями зависимой переменной, не совпадающему с её носителем5. При цензурировании попадание наблюдений в выборку не зависит от значений зависимой переменной, однако часть самих этих значений может не наблюдаться. Например, наблюдения по зарплате будут отсутствовать в выборке для тех, кто не работает. В результате механизм, определяющий занятость индивида, будет выступать в качестве правила отбора наблюдений. Отметим, что в диссертационном исследовании рассматриваются методы работы лишь с цензурированными выборками.

Подходы к статистическому оцениванию параметров, не учитывающие цензурированный или усеченный характер выборки, могут давать несостоятельные оценки. При этом выборки, подверженные смещению отбора, встречаются в экономических исследованиях довольно часто и, как правило, возникают либо в результате самоотбора, либо по причине того, что те, кто собирают данные, устанавливают определенные критерии попадания наблюдений в выборку (Heckman J. , 1979, стр. 1), (Хекман, 2013, стр. 130). Соответствующие обстоятельства обусловили продолжающееся вплоть до настоящего времени интенсивное развитие эконометрических методов оценивания в условиях неслучайного отбора наблюдений (sample selection models). Рассмотрим основные направления и результаты работ в области разработки данных методов, релевантные теме диссертационного исследования.

индивидов из всего общества, то может возникнуть возможность оценить вероятность занятости, а значит и наблюдаемости заработной платы, что сделает выборку цензурированной.

5 Носителем (support) дискретной (непрерывной) случайной величины называется множество значений, для которых вероятность (плотность) не обращается в ноль.

Краткий обзор методологии статистического оценивания

параметров экономических моделей в условиях многокритериального неслучайного отбора наблюдений

"Классические методы коррекции смещения отбора рассматривают случаи, когда существует одно условие отбора, определяемое значением бинарного уравнения, и одно целевое уравнение (Heckman J. , 1979). Однако, некоторые задачи требуют рассмотрения более сложных селективных механизмов. Так, например, уравнение отбора может быть не бинарным, а порядковым (Kugler, 1987), (Vella, 1993), непрерывным (Garen, 1984) или категориальным (Jeffrey & McFadden, 1984). Последний случай эквивалентен ситуации, когда отбор наблюдения определяется несколькими бинарными правилами, т.е. значением многомерной бинарной переменной. Например, зарплата может наблюдаться лишь для индивидов, которые не только работают, но и согласились раскрыть информацию о своих трудовых доходах." (Коссова & Потанин, 2018).

Кроме того, зачастую, исследователей может интересовать оценивание нескольких форм целевого уравнения, каждая из которых определяется комбинацией правил отбора. Например, зарплата, которую индивид будет получать при условии наличия (отсутствия) у него высшего образования, может наблюдаться только если он (не) окончил высшее учебное заведение. При этом целевые уравнения, определяющие значения зарплат, могут различаться, поскольку наличие высшего образования может, например, влиять на отдачу от характеристик индивида. Такая модель может рассматриваться как регрессия с эндогенным переключением, подразумевающая существование правила, при соблюдении которого наблюдаются значения одного целевого уравнения, а при несоблюдении — другого (Lee, 1978). При этом может возникнуть необходимость в учете дополнительных правил отбора наблюдений, например, вследствие того, что еще одним условием наблюдаемости зарплаты, независимо от наличия высшего образования, является занятость индивида.

"Из-за сложностей программной реализации метода максимального правдоподобия, работы, рассматривающие многокритериальный механизм отбора наблюдений, встречаются редко и в основном ограничиваются двумерным случаем, а также предположением о независимости правил отбора (Vella, 1998)." (Коссова & Потанин, 2018).

"Исследования, учитывающие возможную связь между уравнениями отбора, также редки и, как правило, ограничиваются рассмотрением не более трех уравнений с непрерывным (Poirier, 1980), (Cinzia, 2009), (Ogundimu & Hutton, 2016) и бинарным (Rosenmana, Mandal, Tennekoon, & Hill, 2010) целевыми уравнениями." (Коссова & Потанин, 2018). В других работах при оценивании подобных моделей используют непараметрические двухшаговые процедуры (De Luca & Peracchi, 2012), (Das, Newey, & Vella, 2003), не позволяющие реконструировать совместное распределение случайных ошибок, тем самым существенно сужая горизонты интерпретации полученных результатов. При этом, в работах (Ogundimu & Hutton, 2016) и (De Luca & Peracchi, 2012) не поднимаются проблемы состоятельности оценок предлагаемых двухшаговых методов оценивания, а также вывода их асимптотического распределения и состоятельной оценки асимптотической ковариационной матрицы, что ограничивает возможность использования соответствующих подходов в силу затруднений, связанных с тестированием гипотез о параметрах.

Таким образом, возникает необходимость в разработке методов эконометрического оценивания параметров моделей в условиях многокритериального механизма отбора наблюдений и нескольких форм целевых уравнений. При этом желательно, чтобы соответствующие методы позволяли оценивать параметры совместного распределения случайных ошибок, что значительно расширит возможности интерпретации результатов.

В рамках данной работы предлагается несколько новых эконометрических

методов оценивания регрессионных моделей, предполагающих наличие

произвольного числа правил отбора и нескольких форм целевого уравнения.

Предложенные методы обобщают классический, а также некоторые

8

полупараметрические подходы к оцениванию параметров эконометрических моделей в условиях неслучайного отбора и с учетом эндогенного переключения." Задача ставится в максимально общей постановке. Какое именно целевое уравнение имеет место для изучаемого показателя, определяется комбинацией правил отбора. В частном случае, для некоторых из них, наблюдение целевого показателя может отсутствовать. Также могут отсутствовать наблюдения по некоторым комбинациям самих правил, что соответствует схеме последовательного принятия решений." (Коссова & Потанин, 2018).

Цели и задачи исследования

В качестве объекта исследования выступают эконометрические модели, в рамках которых наблюдаемость зависимых переменных определяется соблюдением нескольких правил отбора. Предметом исследования являются методы, позволяющие оценивать параметры этих моделей. Цель исследования заключается в разработке соответствующих методов для случая произвольного конечного числа правил отбора. Для достижения поставленной цели необходимо решить следующие задачи.

1. Вывести ряд свойств усеченного многомерного нормального распределения и распределения, предложенного (Gallant & Nychka, 1987). Эти свойства необходимы для получения оценок при помощи предлагаемых в диссертационном исследовании методов, а также для расчетов, с использованием полученных оценок, предельных эффектов, стандартных ошибок, условных математических ожиданий зависимых переменных и предсказанных значений.

2. Описать основные параметрические и полупараметрические методы коррекции смещения отбора наблюдений в регрессионных моделях, многокритериальные обобщения которых будут предложены в работе.

3. Предложить эконометрические методы, позволяющие оценивать параметры моделей при наличии произвольного конечного числа правил отбора

наблюдений, задающих вид целевого уравнений. Также, необходимо проанализировав свойства получаемых с помощью предложенных методов оценок.

4. Осуществить программную реализацию предложенных методов, что позволит использовать их для анализа как симулированных, так и реальных данных.

5. Проанализировать точность оценок предложенных методов на симулированных данных при различных предположениях о спецификации регрессионных уравнений, в частности, о совместном распределении случайных ошибок и о наличии уникальных переменных (присутствующих лишь в данном уравнении) в оцениваемых уравнениях (так называемых «ограничениях исключения»).

6. Применить предложенные методы для оценивания параметров эконометрических моделей на реальных данных, подверженных действию нескольких правил отбора наблюдений.

Научная новизна исследования

В рамках данной работы был осуществлен следующий вклад в развитие эконометрических методов оценивания моделей с многокритериальным смещением отбора наблюдений:

1. Предложены параметрические методы, обобщающие подход, предложенный Хекманом, к оцениванию модели со смещением отбора и модели с переключением на случай многокритериального отбора наблюдений и нескольких форм целевого уравнения зависимой переменной. Для соответствующих методов выведены выражения для предельных эффектов и условных математических ожиданий целевой переменной, что позволяет предсказывать значения зависимой переменной при различных комбинациях правил отбора. Обоснована состоятельность и асимптотическая нормальность оценок двухшаговой

процедуры оценивания, а также предложена состоятельная оценка ковариационной матрицы оценок параметров модели.

2. Предложено многокритериальное обобщение полу-непараметрического метода Галланта и Нички (Gallant & Nychka, 1987) и, с опорой на идею (De Luca & Peracchi, 2012), полупараметрического метода Ньюи (Newey, 2009). Для метода Галланта и Нички выведены формулы для расчета условных усеченных математических ожиданий случайный ошибок, позволяющие, при помощи использования численного дифференцирования, рассчитывать как условные математические ожидания зависимой переменной, так и предельные эффекты.

3. Проанализирована на симулированных данных точность оценок предложенных методов. В частности, продемонстрирована устойчивость оценок, полученных с помощью обобщенных параметрических методов коррекции смещения отбора, к нарушению допущения о совместном нормальном распределении случайных ошибок.

Научная новизна исследования с точки зрения применения соответствующей методологии к анализу реальных данных заключается в следующем:

1. Получена оценка отдачи от образования на российском рынке труда с учетом неслучайного отбора индивидов не только в число занятых, но и в число тех, кто оканчивает высшее учебное заведение. Результаты исследования свидетельствуют в пользу того, что образование является эндогенным по отношению к уравнению заработной платы. Без учета неслучайного отбора эффект образования может быть недооценен, что согласуется с результатами ряда предшествовавших исследований, осуществленных на данных рынка труда США с использованием метода инструментальных переменных.

2. Показано, что семейный статус является эндогенной переменной по отношению к заработной плате мужчин в России. Полученные в рамках проведенного анализа результаты свидетельствуют в пользу того, что без учета эндогенности брака по отношению к уравнению зарплаты смещение в оценке

эффекта брака на зарплату может оказаться весьма существенным, вплоть до изменения знака с сохранением значимости соответствующего коэффициента.

3. Найдены свидетельства в пользу того, что отказ от ответа на вопрос о заработной плате может являться дополнительным источником смещения при оценивании уравнения заработной платы. Однако, по данным РМЭЗ за 2016 год возникающее смещение не существенно.

Отметим, что выведенные в рамках данного исследования выражения для условных, усечённых и маржинальных функций плотности и распределения, а также моментов распределения (Gallant & Nychka, 1987), могут быть использованы для полу-непараметрического обобщения обширного класса эконометрических моделей, оценивание которых осуществляется при помощи метода максимального правдоподобия.

Структура исследования

Исследование имеет следующую структуру.

Глава № 1.

В данной главе 6 рассматриваются основные подходы к оцениванию параметров экономических моделей в условиях неслучайного отбора. Подробно описываются классические параметрические подходы (см. параграф 1.1), а также ряд наиболее популярных полупараметрических методов (см. параграф 1.2), обобщения которых рассматриваются в диссертационном исследовании. Наконец, приводится обзор предложенных в литературе методов коррекции многокритериального смещения отбора (см. параграф 1.3) и кратко рассматриваются альтернативные подходы, подразумевающие использование копул и байесовской статистики (см. параграф 1.4).

6 Параграфы 1.2.2, 1.2.3, 1.2.4 и 1.2.5 основаны на материалах работы (Коссова, Куприянова, & Потанин, Сравнение точности оценок параметрических и полупараметрических методов коррекции многомерного смещения отбора, 2020).

Глава № 2.

В этой главе7 осуществляется обобщение метода Хекмана при допущении о многомерном нормальном распределении случайных ошибок на случай нескольких уравнений отбора и дифференциации функциональной формы целевого уравнения в зависимости от различных комбинаций правил отбора (см. параграф 2.1). При этом, во-первых, выводится функция правдоподобия, максимизация которой, при соблюдении ряда условий, позволяет получить состоятельные, асимптотически эффективные и асимптотически нормальные оценки параметров в условиях многокритериального неслучайного отбора (см. параграф 2.2). Во-вторых, предлагается многомерный аналог двухшаговой процедуры и обосновывается состоятельность и асимптотическая нормальность получаемых данным методом оценок (см. параграф 2.3). В-третьих, для оценок двухшаговой процедуры выводится состоятельная оценка ковариационной матрицы, что позволяет тестировать гипотезы о параметрах8 (см. параграф 2.4). Наконец, выводится выражение предельного эффекта для условного математического ожидания целевой переменной. (см. параграф 2.5). Отметим, что для вывода формул из параграфов 2.4 и 2.5 в приложении С.5 были получены вычислительно удобные выражения для дифференцирования маржинальных плотностей усеченного сверху многомерного нормального распределения по границе усечения.

7 Основан на статье (Коссова & Потанин, 2018).

8 В работе (Ogundimu & Hutton, 2016) также осуществляется обобщение двухшаговой процедуры Хекмана на двумерный и трехмерный случаи. Авторы получают частный случай метода, представленного диссертантом и его научным руководителем в работе (Коссова & Потанин, 2018): рассматривается число уравнений отбора не большее трёх, а также не предусмотрены возможности переключения и последовательного принятия решений. При этом (Ogundimu & Hutton, 2016) не обосновывают состоятельность оценок предложенного ими метода, а также не выводят состоятельную оценку ковариационной матрицы оценок, что не позволяет тестировать гипотезы о параметрах и тем самым ограничивает возможность применения предложенного ими подхода в экономических исследованиях. Также, следует отметить, что диссертант ознакомился с результатами данного исследования лишь недавно, уже после публикации собственной работы и поэтому не ссылался на него в своем исследовании (Коссова & Потанин, 2018). При этом диссертант и авторы упомянутого исследования используют ссылки на различные математические работы для вывода необходимых для реализации двухшаговой процедуры свойств усеченного многомерного нормального распределения: авторы (Ogundimu & Hutton, 2016) обращаются к (Arellano-Valle, Branco, & Genton, 2006), (Cartinhour, 1990) и (Copas & Li, 1997), в то время как диссертант опирается на исследование (Manjunath & Wilhelm, 2012).

Глава № 3.

Недостатком предложенного в главе 2 метода является допущение о совместном нормальном распределении случайных ошибок. Нарушение данного допущения может привести к несостоятельности оценок. Поэтому, в главе 3 предлагаются обобщения ряда классических полупараметрических методов коррекции смещения отбора 9 : выводятся модификации соответствующих методов, учитывающие возможность многокритериального характера неслучайного отбора. Данные методы позволяют ослабить допущение о совместном распределении случайных ошибок и получить состоятельные оценки в случае, когда совместное распределение случайных ошибок не является нормальным.

В параграфе 3.1 обобщается полу-непараметрический метод (Gallant & Nychka, 1987), объединяющий в себе гибкость полупараметрических методов с легкостью интерпретации параметрических. Суть метода заключается в аппроксимации функции плотности неизвестного распределения при помощи полиномов в форме Эрмита. Для обобщения данного метода понадобилось вывести ряд свойств предложенного (Gallant & Nychka, 1987) распределения. Вывод свойств описан в приложении D. В частности, были выведены выражения для усеченных условной и маржинальной функций плотности и распределения, начальных моментов компонент случайного вектора, подчиняющегося соответствующему распределению. Отметим, что недостатком данного подхода является вычислительная сложность, обусловленная большим числом оцениваемых параметров.

В параграфе 3.2 осуществляется обобщение двухшагового полупараметрического метода Ньюи (Newey, 2009), основанного на применении метода наименьших квадратов с аппроксимацией условного математического ожидания случайной ошибки при помощи полиномов, аргументами которых являются некоторые сглаживающие функции от оценок латентных переменных,

9 Приводится обобщение на случай произвольного числа уравнений отбора методов, рассмотренных в (Коссова, Куприянова, & Потанин, Сравнение точности оценок параметрических и полупараметрических методов коррекции многомерного смещения отбора, 2020).

относящихся к уравнениям отбора, получаемых на первом шаге при помощи полупараметрического оценивания систем бинарных уравнений. Вычислительная сложность данного подхода невелика и сопоставима с той, что необходима для реализации обобщенной параметрической двухшаговой процедуры. Предлагается обобщение, основанное на подходе, предложенном (De Luca & Peracchi, 2012), а также две существенно менее вычислительно затратные альтернативы. При этом в качестве сглаживающей функции предлагается использовать выведенные в (Коссова & Потанин, 2018) обобщенные обратные отношения Миллса.

Глава № 4.

Данная глава посвящена изучению точности оценок предложенных в диссертационной работе методов на симулированных данных. В параграфе 4.1 приводится обзор основных исследований по соответствующей тематике10.

Сравнение точности оценок методов, предложенных в параграфах 2.2 и 2.3, осуществляется в параграфе 4.2, при допущении о двумерном смещении отбора11 (см. параграф 4.2.1), а также, раздельно, при наличии (см. параграф 4.2.2) и отсутствии ограничений исключений (см. параграф 4.2.3). Кратко обозначим основные результаты. Во-первых, оценки метода наименьших квадратов и одномерного метода Хекмана в условиях двумерного неслучайного отбора подвержены достаточно сильному смещению. Во-вторых, они значительно уступают в точности оценкам обобщенных методов и по мере увеличения объемов выборки разрыв в точности увеличивается. В-третьих, вероятно, вследствие сильной мультиколлинеарности, при отсутствии ограничений исключения (exclusion restrictions) обобщенная двухшаговая процедура дает значительно менее точные оценки, чем обобщенный подход на основе метода максимального правдоподобия. При этом точность оценок метода максимального правдоподобия несколько выше, когда ограничения исключений соблюдены.

В параграфе 4.3 сравниваются различные полупараметрические, параметрические и полу-непараметрические методы коррекции

10 Основан на статье (Коссова & Потанин, 2018).

11 Основан на статье (Коссова & Потанин, 2018).

многокритериального смещения отбора 12 , в том числе предложенные в параграфах 2.2, 2.3, 3.1 и 3.2. Результаты проведенного анализа не позволяют говорить о существенном смещении в оценках параметрических подходов вследствие нарушения допущения о совместном нормальном распределении случайных ошибок. Более того, параметрические методы уступали в точности полупараметрическим лишь при бимодальном совместном распределении случайных ошибок. Также отметим, что в данном параграфе сравниваются различные подходы к спецификации полупараметрических методов коррекции смещения отбора, при этом некоторые из них оказываются заметно более точными, чем другие, в зависимости от особенностей совместного распределения случайных ошибок.

Глава № 5.

В данной главе рассматриваются примеры практического использования предложенных методов. В параграфе 5.1 уравнение заработной платы оценивается при допущении о том, что источником неслучайного отбора может являться не только занятость, но и ответ на вопрос о зарплате 13. Для этого используется обобщенный при помощи двухшаговой процедуры и метода максимального правдоподобия метод Хекмана, предложенный в параграфах 2.3 и 2.2 соответственно. Оценки коэффициентов и предельных эффектов оказались схожи с теми, что были получены при использовании обычного метода Хекмана. Однако, согласно результатам теста отношения правдоподобия обобщенная модель не может быть сведена к классической модели Хекмана. Об этом же свидетельствует значимая корреляция между случайными ошибками уравнений зарплаты и ответа на вопрос о её объемах.

В параграфе 5.2, при помощи обобщенного с помощью метода максимального правдоподобия метода Хекмана из параграфа 2.2, оценивается эффект высшего образования на зарплату индивидов14. Оценивается система из

12 Основан на статье (Коссова, Куприянова, & Потанин, Сравнение точности оценок параметрических и полупараметрических методов коррекции многомерного смещения отбора, 2020).

13 Основан на (Коссова & Потанин, 2018).

14 Основан на (Потанин, 2019).

трех уравнений: зарплаты, занятости и высшего образования, что позволяет в явном виде учесть эндогенность последнего в отношении уравнения заработной платы. Результаты проведенного анализа свидетельствуют в пользу того, что без учета неслучайного отбора в число получателей высшего образования оценка его эффекта на заработную плату может оказаться смещенной. При этом, как и в ряде предшествовавших работ на данных США, оценка корреляции между случайными ошибками уравнений высшего образования и зарплаты оказалась отрицательной, что может быть связано как, например, с отсутствием достаточного развития мягких навыков (soft-skills) среди студентов, так и с массовым характером обеспечения населения высшим образования, что сопровождается ослаблением критериев отбора в число его получателей.

Похожие диссертационные работы по специальности «Математические и инструментальные методы экономики», 08.00.13 шифр ВАК

Список литературы диссертационного исследования кандидат наук Потанин Богдан Станиславович, 2020 год

Список литературы

Amemiya, T. (1984). Tobit models: a survey. Journal of Econometrics, 24(1-2), 3-61.

Angrist, J. D., & Guido, W. I. (1995). Two-Stage Least Squares Estimation of Average Causal Effects in Models with Variable Treatment Intensity. Journal of the American Statistical Association, 90(430), 431-442.

Arellano-Valle, R. B., Branco, M. D., & Genton, M. G. (2006). A Unified View on Skewed Distributions Arising from Selections. The Canadian Journal of Statistics, 34(4), 581-601.

Becker, G. S. (1981). A treatise on the family. Cambridge, MA: Harvard University Press, 1-304.

Birch, E. R., & Miller, P. W. (2006). How Does Marriage Affect the Wage of Men in Australia? The Economic Record, 82, 150-164.

Blundell, R., & MaCurdy, T. (1999). Labor supply: A review of alternative approaches. Labor supply: A review of alternative approaches, 1559-1659.

Bonilla, R., Kiraly, F., & Wildman, J. (2019). Beauti Premium and Marriage Premium in Search Equilibrium: Theory and Empirical Test. International Economic Review, 60(2), 851-877.

Cartinhour, J. (1990). One-dimensional marginal density functions of a truncated multivariate normal density function. Communications in Statistics - Theory and Methods, 19(1), 197-203. doi:https://doi.org/10.1080/03610929008830197

Chavent, M., Liquet, B., & Saracco, J. (2010). A semiparametric approach for a multivariate sample selection model. Statistica Sinica, 20(2), 513-536.

Chen, S., & Zhou, X. (2011). Semiparametric estimation of a bivariate Tobit model. Journal of Econometrics, 165(2), 266-274.

Cinzia, D. N. (2009). Sample selection correction in panel data models when selectivity is due to two sources. Institute of Public Policy and Public Choice (POLIS) Working Papers.

Cook, J. A., & Siddiqui, S. (2019). Random forests and selected samples. Bulletin of economics research (принята к печати). doi:https://doi.org/10.1111/boer.12222

Copas, J. B., & Li, H. G. (1997). Inference for non-random samples. Journal of the Royal Statistical Society. Series B (Methodological), 59, 55-95.

Das, M., Newey, K., & Vella, F. (2003). Nonparametric Estimation of Sample Selection Models. The Review of Economic Studies, 1(1), 33-58.

De Luca, G. (2008). SNP and SML estimation of univariate and bivariate binary-choice models. StataJournal, 8(2).

De Luca, G., & Peracchi, F. (2012). Estimating Engel curves under unit and item nonresponse. Journal of Applied Econometrics, 27(7), 1076-1099.

Deming, D. J. (2017). The Growing Importance of Social Skills in the Labor Market. The Quarterly Journal of Economics, 132(4), 1593-1640.

Ding, P. (2014). Bayesian robust inference of sample selection using selection-t models. Journal of Multivariate Analysis, 124, 451-464.

Dogan, O., & Taspinar, S. (2017). Bayesian Inference in Spatial Sample Selection Models. Oxford Bulletin of Economics & Statistics, 80, 90-121.

Eisenhauer, P., Heckman, J. J., & Mosso, S. (2015). Estimation of Dynamic Discrete Choice Models by Maximum Likelihood and the Simulated Method of Moments. International Economic Review, 56(2), 331-357.

Eisenhauer, P., Heckman, J. J., & Vytlacil, E. (2015). The Generalized Roy Model and the Cost-Benefit Analysis of Social Programs. Journal of Political Economy, 123(2), 413-443.

Gallant, A., & Nychka, D. (1987). Semi-Nonparametric Maximum Likelihood Estimation. Econometrica, 55(2), 363390.

Garen, J. (1984). The retums to schooling: A selectivity bias approach with a continuous choice variable. Econometrica, 52(5), 1199-1218.

Griliches, Z. (1977). Estimating the Return to Schooling: Some Econometric Problems. Econometrica, 45(1), 1-22.

Griliches, Z., Hall, Z. B., & Hausman, J. (1978). Missing Data and Self-Selection in Large Panel. Annales de l'INSEE, 30(31), 137-176.

Gronau, R. (1974). Wage Comparisons - A Selectivity Bias. Journal of Political Economy, 82(6), 1119-1143.

Gupta, N. D., Smith, N., & Stratton, L. S. (2007). Is Marriage Poisonous? Are Relationships Taxing? An Analysis of the Male Marital Wage Differential in Denmark. Southern Economic Journal, 74, 412-433.

Hassetl, M. (2011). Bayesian inference in a sample selection model. Journal of Econometrics, 2, 221-232.

Hausman, J. A., & Taylor, W. E. (1981). Panel Data and Unobservable Individual Effects. Econometrica, 49, 13771398.

Hay, J., Leu, R., & Rohrer, P. (1987). Ordinary least squares and sample-selection models of health-care demand: Monte Carlo comparison. Journal of Business, Economic Statistics, 5, 499-506.

Heckman, J. (1974). Shadow Prices, Market Wages, and Labor Supply. Econometrica, 42(4), 679-694.

Heckman, J. (1976). The Common Structure of Statistical Models of Truncation, Sample Selection and Limited

Dependent Variables and a Simple Estimator for Such Models. Annals of Economic Social Measurement, 5(4), 475-492.

Heckman, J. (1979). Sample selection bias as a specification error. Econometrica, 47(1), 153-161.

Heckman, J. J., & Taber, C. (2010). Roy model. Durlauf S.N., Blume L.E. (eds) Microeconometrics. The New Palgrave Economics Collection. Palgrave Macmillan. doi:10.1057/9780230280816_27

Heckman, J. J., Lochner, L. J., & Todd, P. E. (2006). Earnings Functions, Rates of Return and Treatment Effects: The Mincer Equation and Beyond. Handbook of the Economics of Education, 1, 307-458.

Heckman, J., & Honore, B. E. (1990). The Empirical Content of the Roy Model. Econometrica, 1121-1149.

Heckman, J., & Killingsworth, M. (1987). Female labor supply: a survey. O. Ashenfelter and R. Layard (eds.) Handbook of Labor Economics, 1, 103-204.

Jeffrey, D., & McFadden, D. (1984). An econometric analysis of residential electric appliance holdings and consumption. . Econometrica, 52(2), 345-362.

Joe, H. (2006). Generating random correlation matrices based on partial correlations. Journal of Multivariate Analysis, 97, 2177-2189.

Killingsworth, M., & Heckman, J. (1987). Female labor supply: A survey. Handbook of Labor Economics, 1(1), 103204.

Kim, S., Egerter, S., Cubbin, C., Takahashi, E., & Braveman, P. (2007). Potential implications of missing income data in population-based surveys: an example from a pospartum survey in California. Public Health, 122, 753-763.

Klein, R., & Spady, R. (1993). An Efficient Semiparametric Estimator of the Binary Choice Model. Econometrica, 61(2), 387-421.

Konning, R., & van der Klaauw, B. (2003). Testing the Normality Assumption in the Sample Selection Model with and Application to Travel Demand. Journal of Business and Economic Statistics, 26(4), 31-42.

Kossova, E., Potanin, B., & Sheluntcova, M. (2020). Estimating effect of marriage on male wages in Russia. Journal of Economic Studies (принята к печати), 47(7).

Kugler, J. E. (1987). The earnings impact of training duration in a developing country. Journal of Human Resources, 22(2), 228-247.

Lee, L. (1978). Unionism and wage rates: A simultaneous equations model with qualitative and limited dependent variables. International Economic Review, 19, 415-433.

Manjunath, B. G., & Wilhelm, S. (2012). Moments Calculation For the Doubly Truncated Multivariate Normal Density. arXiv.

Manning, W., Duan, N., & Rogers, W. (1987). Monte Carlo evidence on the choice between sample selection and two-part models. Journal of Econometrics, 35, 59-82.

Marchenko, Y. V., & Genton, M. G. (2012). A Heckman Selection-t Model. Journal of the American Statistical Association, 107(497), 304-317.

Messner, J. W., Mayr, G. J., & Zeileis, A. (2016). Heteroscedastic Censored and Truncated Regression with crch. The R Journal, S(1), 173-181.

Mincer, J. (1974). Schooling, Experience and Earnings. New York: National Bureau of Economic Research.

Murphy, K. M., & Topel, R. H. (1985). Estimation and inference in two-step econometric models. Journal of Business and Economic Statistics, 3, 370-379.

Nadaraya, E. A. (1964). On Estimating Regression. Theory of Probability and Its Applications, 9(1), 141-142.

Nawata, K. (1993). A note on the estimation of models with sample selection biases. Economics Letters, 42, 15-24.

Nawata, K. (1994). Estimation of sample selection bias models by the maximum likelihood estimator and Heckman's two-step estimator. Economics Letters, 45, 33-40.

Nelson, F. (1984). Efficiency of the two-step estimator for models with endogenous sample selection. Journal of Econometrics, 24, 181-196.

Newey, W. K. (2009). Two-step series estimation of sample selection models. The Econometrics Journal, 12, 217229.

Ogundimu, E. O., & Hutton, J. L. (2016). A unified approach to multilevel sample selection models. Communications in Statistics - Theory and Methods, 45(9), 2592-2611.

Paarsch, H. (1984). A Monte Carlo comparison of estimators for censored regression models. Journal of Econometrics, 24, 197-213.

Petersen, T., Penner, A. M., & Hogsen, G. (2011). The male marital wage premium: Sorting vs. differential pay. Industrial and Labor Relations Review(64), 283-384.

Phillips, P. (1982). ERA's: A new approach to small sample theory. Econometrica, 51(5), 1505-1525.

Plackett, R. L. (1954). A Reduction Formula for Normal Multivariate Integrals. Biometrika, 3, 351-360. doi:https://doi.org/10.1093/biomet/41.3-4.351

Poirier, D. L. (1980). Partial observability in bivariate probit models. Journal of Econometrics, 12(2), 209-217.

Pollmann-Schult, M. (2011). Marriage and Earnings: Why Do Married Men Earn More than Single Men? European Sociological Review, 27, 147-163.

Puhani, P. (2000). The Heckman correction for sample selection and its critique. Journal of Economic Surveys, 14(1), 53-68.

Rendtel, U. (1992). On the choice of a selection-model when estimating eegression models with selectivity. DIW-Discussion Paper, 53.

Richardson, L. F. (1911). The approximate arithmetical solution by finite differences of physical problems including differential equations, with an application to the stresses in a masonry dam. Philosophical Transactions of the Royal Society A, 210, 307-357.

Robinson, P. (1988). Root-n Consistent Semiparametric Regression. Econometrica, 56(4), 931-954.

Rodgers, W. M., & Stratton, L. S. (2010). The male marital wage differential: Race, training, and fixed effects. Economic Inquiry, 48, 722-742.

Rosenmana, R., Mandal, B., Tennekoon, V., & Hill, L. G. (2010). Estimating treatment effectiveness with sample selection. Working Paper.

Roy, A. (1951). Some thoughts on the distribution of earnings. Oxford Economic Papers, 3, 135-146.

Sobel, M. E. (2012). Does Marriage Boost Men's Wages? Identification of Treatment Effects in Fixed Effects

Regression Models for Panel Data. Journal of the American Statistical Association, 107(498), 521-529.

Stolzenberg, R., & Relles, D. (1990). Theory testing in a world of constrained research design, the significance of Heckmans' censored sampling bias correction for nonexperimental research. Sociological Methods and Research, 18(4), 395-415.

Tobin, J. (1958). Estimation of Relationships for Limited Dependent Variables. Econometrica, 26(1), 24-36.

Turrell, G. (2000). Income non-reporting: implications for health inequalities research. Epidemiol Community Health, 54, 207-214.

Vella, F. (1993). A simple estimator for models with censored endogenous regressors. International Economic Review, 34(2), 441-457.

Vella, F. (1998). Estimating models with sample selection bias: A survey. Journal of Human Resources, 34(2), 127169.

Veramendi, G., Humphries, J. E., & Heckman, J. J. (2016). Returns to Education: The Causal Effects of Education on Earnings, Health and Smoking. Working Paper.

Watson, G. S. (1964). Smooth regression analysis. Sankhya: The Indian Journal of Statistics, Series A, 26(4), 359-372.

Wojtys, M., Marra, G., & Radice, R. (2016). Copula Regression Spline Sample Selection Models: The R Package SemiParSampleSel. Journal of Statistical Software, 71(6).

Zuehlke, T., & Zeman, A. (1990). A comparison of two-stage estimators of censored regression models. The Review of Economics and Statistics, 72, 185-188.

Андрущак, Г. В., & Кононова, А. Е. (2012). Где лучше учиться: дифференциация заработков выпускников вузов. Вестник Российского мониторинга экономического положения и здоровья населения НИУ ВШЭ (RLMS - HSE), 129-136.

Гуртов, В. А., & Щёголева, Л. В. (2018). Прогнозирование потребности экономики в кадрах высшей научной квалификации. Проблемы прогнозирования, 4.

Гуртов, В. А., Гарифуллина, Н. Ю., & Сигова, С. В. (2016). О прогнозной кадровой потребности российской экономики: качественный аспект. Проблемы прогнозирования, 1.

Денисова, И. А., & Карцева, М. А. (2007). Отдача на уровни, типы и качество образования. Заработная плата в России: эволюция и дифференциация /под ред. В.Е. Гимпельсона, Р.И. Капелюшникова.

Коссова, Е. В., & Потанин, Б. С. (2018). Обобщение метода Хекмана и модели с переключением на случай произвольного числа уравнений отбора. Прикладная эконометрика, 50, 114-143.

Коссова, Е. В., Куприянова, Л. А., & Потанин, Б. С. (2020). Сравнение точности оценок параметрических и полупараметрических методов коррекции многомерного смещения отбора. Прикладная эконометрика, 57, 119-139.

Потанин, Б. С. (2019). Оценка влияния высшего образования на заработную плату работника. Проблемы прогнозирования, 3, 118-126.

Раицкая, Л. К., & Тихонова, Е. В. (2018). Soft Skills в представлении преподавателей и студентов российских университетов в контексте мирового опыта. Вестник РУДН. Серия: Психология и педагогика, 3, 350363.

РМЭЗ. (б.д.). «Российский мониторинг экономического положения и здоровья населения НИУ ВШЭ (RLMS-HSE)», проводимый Национальным исследовательским университетом «Высшая школа экономики» и ЗАО «Демоскоп» при участии Центра народонаселения Университета Северной Каролины.

Рощин, С. Ю., & Рудаков, В. Н. (2016). Влияние «качества» вуза на заработную плату выпускников. Вопросы экономики, 8, 74-95.

Флоринская, Ю. Ф. (2017). Выпускники школ из малых городов России: образовательные и миграционные стратегии. Проблемы прогнозирования, 1.

Хекман, Д. (2013). Смещение селективной выборки как ошибка спецификации. Прикладная Эконометрика, Переводчики: Катышев П. К., Малахов Д. И., Станкевич И. П., 31(3), 127-137.

Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.