Kafe-sviaz.ru

Финансовый журнал
0 просмотров
Рейтинг статьи
1 звезда2 звезды3 звезды4 звезды5 звезд
Загрузка...

Модель бинарного выбора учебник

Модели бинарного выбора

Результативная переменная у в нормальной линейной модели регрессии является непрерывной величиной, способной принимать любые значения из заданного множества. Но помимо нормальных линейных моделей регрессии существуют модели регрессии, в которых переменная у должна принимать определённый узкий круг заранее заданных значений.

Моделью бинарного выбора называется модель регрессии, в которой результативная переменная может принимать только узкий круг заранее заданных значений.

В качестве примеров бинарных результативных переменных можно привести:

Приведенные в качестве примеров бинарные переменные являются дискретными величинами. Бинарная непрерывная величина задаётся следующим образом:

Если стоит задача построения модели регрессии, включающей результативную бинарную переменную, то прогнозные значения yiпрогноз, полученные с помощью данной модели, будут выходить за пределы интервала [0;+1] и не будут поддаваться интерпретации. В этом случае задача построения модели регрессии формулируется не как предсказание конкретных значений бинарной переменной, а как предсказание непрерывной переменной, значения которой заключаются в интервале [0;+1].

Решением данной задачи будет являться кривая, удовлетворяющая следующим трём свойствам:

Данным трём свойствам удовлетворяет функция распределения вероятности.

Модель парной регрессии с результативной бинарной переменной с помощью функции распределения вероятности можно представить в следующем виде:

где prob(yi=1) – это вероятность того, что результативная переменная yi примет значение, равное единице.

В этом случае прогнозные значения yiпрогноз, полученные с помощью данной модели, будут лежать в пределах интервала [0;+1].

Модель бинарного выбора может быть представлена с помощью скрытой или латентной переменной следующим образом:

Векторная форма модели бинарного выбора с латентной переменной:

В данном случае результативная бинарная переменная yi принимает значения в зависимости от латентной переменной yi*:

Модель бинарного выбора называется пробит-моделью или пробит-регрессией (probit regression), если она удовлетворяет двум условиям:

1) остатки модели бинарного выбора εiявляются случайными нормально распределёнными величинами;

2) функция распределения вероятностей является нормальной вероятностной функцией.

Пробит-регрессия может быть представлена с помощью выражения:

где NP – это нормальная вероятность (normal probability).

Модель бинарного выбора называется логит-моделью или логит-регрессией (logit regression), если случайные остатки εi подчиняются логистическому закону распределения.

Логит-регрессия может быть представлена с помощью выражения:

Данная модель логит-регрессии характеризуется тем, что при любых значениях факторных переменных и коэффициентов регрессии, значения результативной переменной yi будут всегда лежать в интервале [0;+1].

Обобщённый вид модели логит-регрессии:

Достоинством данной модели является то, что результативная переменная yi может произвольно меняться внутри заданного числового интервала (не только от нуля до плюс единицы).

Логит-регрессия относится к классу функций, которые можно привести к линейному виду. Это осуществляется с помощью преобразования, носящего название логистического или логит преобразования, которое можно проиллюстрировать на примере преобразования обычной вероятности р:

Качество построенной логит-регрессии или пробит-регрессии характеризуется с помощью псевдо коэффициента детерминации, который рассчитывается по формуле:

Если значение данного коэффициента близко к единице, то модель регрессии считается адекватной реальным данным.

Модели бинарного выбора (логит- и пробит-модели)

Рассмотрение возможных альтернатив с помощью модели бинарного выбора. Эконометрическое моделирование переменных и гипотез. Статистическая значимость логит- и пробит-моделей выбора. Проверка значимости модели при помощи теста отношения правдоподобия.

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

ФЕДЕРАЛЬНОЕ АГЕНТСТВО СВЯЗИ

ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ ОБРАЗОВАТЕЛЬНОЕ БЮДЖЕТНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ

«СИБИРСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ

ТЕЛЕКОММУНИКАЦИЙ И ИНФОРМАТИКИ» (ФГОБУ ВПО «СибГУТИ»)

По дисциплине: «Эконометрика»

Читать еще:  Страховой рынок рф

на тему «Модели бинарного выбора (логит- и пробит-модели)»

Выполнил: Бадмаев В.А. гр. Э-13

Проверил: Никифоров И.К.

1. Логит- и пробит-модели

2. Статистическая значимость логит и пробит-моделей и факторов этих моделей

Список использованной литературы

Модели бинарного выбора используются, когда субъект совершает выбор между двумя возможными альтернативами. Выбор основывается на наборе некоторых входных факторов, характеризующих альтернативы и субъект. Обозначим сделанный выбор переменной Y, которая принимает значение 0, когда выбрана первая альтернатива, иначе значение 1. Входные факторы могут выражать и качественные, и количественные признаки. Задача состоит в установлении взаимосвязи между зависимой переменной и одной или более независимыми переменными, в общем случае принимающими все действительные значения. В том случае, когда возможных альтернатив несколько, модель называется моделью множественного выбора. В данной работе рассматривается модель бинарного выбора, как первый этап в изучении моделей множественного выбора. В качестве примера применения таких моделей можно привести социологический опрос или маркетинговые исследования, где выбор между альтернативами зависит от предпочтений выбирающего и характеристик объекта исследования.

1. Логит- и пробит-модели

В эконометрическом моделировании работают с переменными, которые могут быть измерены в:

1) Метрической шкале (являться количественными).

2) Порядковой шкале.

3) Номинальной шкале.

В этой главе мы рассмотрим, в частности, эконометрические модели, которые используют в том случае, когда зависимая переменная измерена в номинальной или порядковой шкале.

Предположим, что результирующий показатель у, «поведение» которого существенно зависит от количественных объясняющих переменных (матрица Х)

является качественной переменной, определяющей одно из двух возможных состояний характеризуемого ею объекта, то есть переменной измеренной в номинальной шкале (в общем случае этих состояний может быть больше). Например, результирующему показателю

yi может быть приписано значение равное 0, если i-й индивидуум оказался безработным в обследуемом периоде времени, и 1 — в противном случае.

альтернатива бинарный эконометрический гипотеза

В подобных ситуациях вектор

исходных статистических данных зависимой переменной будет состоять только из: «0» или «1

Можно ли построить линейную регрессионную модель, описывающую зависимость у от х в данном случае?

Ответ: вряд ли. Неясно, как интерпретировать в этом случае оцененные при помощи регрессии значения у, которые будут уже измерены в метрической непрерывной (количественной) шкале и могут принимать различные значения.

Поэтому для исследования статистической связи между у и Х строят некоторую специальную регрессионную модель зависимости вероятности

от линейной функции наблюдаемых факторов.

Модель бинарного выбора обосновывают при помощи скрытой (латентной) переменной. Например, предположим, что мы изучаем информацию о том, какое решение принимает замужняя женщина: работать ей, или нет. Считают, что ее потребительское и трудовое поведение описывается некоторой функцией полезности. Эта функция зависит от многих характеристик: дохода, свободного времени, наличия детей, образования. Женщина может принять решение выйти на работу, чтобы увеличить доход семьи, но при этом произойдет уменьшение времени, уделяемого детям, домашней работе и т.п. Или, она может принять решение не работать. Каждой из рассмотренных ситуаций, соответствует своя величина функции полезности. Предположим, что это величина полезности, если женщина работает, а — величина полезности, если женщина не работает.

Если >, то женщине выгоднее пойти работать, так как получаемый дополнительный доход перевешивает уменьшение времени на детей и домашние дела.

Модели бинарного выбора

Модели бинарного выбора используются, когда субъект совершает

выбор между двумя возможными альтернативами. Выбор основывается на

наборе некоторых входных факторов, характеризующих альтернативы и

субъект. Обозначим сделанный выбор переменной Y, которая принимает

значение 0, когда выбрана первая альтернатива, иначе значение 1.

Читать еще:  Бинарные опционы ложь или правда

Входные факторы могут выражать и качественные, и количественные

признаки. Задача состоит в установлении взаимосвязи между зависимой

переменной и одной или более независимыми переменными, в общем

случае принимающими все действительные значения. В том случае, когда

возможных альтернатив несколько, модель называется моделью

множественного выбора. В данной работе рассматривается модель

бинарного выбора, как первый этап в изучении моделей множественного

выбора. В качестве примера применения таких моделей можно привести

социологический опрос или маркетинговые исследования, где выбор

между альтернативами зависит от предпочтений выбирающего и

характеристик объекта исследования.

Пусть Yi обозначает значение переменной Y, i=1,…n, где n

количество выбирающих, и Xi =(xi1,…,xik) обозначает значения факторов, характеризующих выбор и выбирающего.

Самой простой является модель

линейной вероятности [1]:

(1)

Где β— вектор коэффициентов регрессии, εi – независимо

распределенная случайная величина с нулевым математическим

ожиданием (в дальнейшем случайная ошибка).

Из предположения о нулевом математическом ожидании случайной

ошибки следует, что она принимает только дискретные значения [1, 2].

Поскольку Y i принимает только два значения, очевидно, что:

Таким образом, модель (1) может быть записана в виде

Для данной регрессионной зависимости возможно применение

метода наименьших квадратов, однако, результаты оценивания будут не

удовлетворительными с содержательной точки зрения. Недостатками

модели линейной вероятности является сложная интерпретация дробных

значений зависимых переменных, а также возможный выход за область

определения [0, 1] значений, как зависимых переменных, так и

прогнозных значений, которые по смыслу являются прогнозными

значениями вероятности выбора одной из альтернатив. В [1, 6]

представлена модель бинарного выбора, основанная на использовании

функции распределения F(•), область значений которой лежит в отрезке

(2)

Обычно используют два вида распределений:

1) функция логистического распределения

,

соответствующую модель называют logit-моделью.

2) функция нормального распределения

,

соответствующую модель называют probit-моделью. Предполагается, что в основе выбора

альтернатив лежит некоторая ненаблюдаемая количественная переменная

Y*, связанная с входными переменными регрессионным уравнением:

,

где ошибки ε независимы и одинаково распределены с нулевым средним и

дисперсией σ. Наблюдается только дискретная величина Y, которая

связана с Y* следующим соотношением: Y=1, если Y*

; иначе Y=0.

Пороговое значение С, без ограничения общности принимаемое равным

нулю, если константа включена в число регрессоров. Примером

порогового значения С будет накопление семьи, которая принимает

решение о покупке холодильника. Предполагая, что случайные ошибки

имеют одно и тоже симметричное распределение F(•)=1–F(•), получаем

, что с точностью до нормировки совпадает с (2). Параметры β и σ

участвуют только в виде отношения и не могут быть по отдельности

идентифицированы, поэтому в данном случае можно считать, что σ =1.

Другая интерпретация модели выбора [3, 5] предполагает, что

выбор осуществляется на основе ненаблюдаемой полезности альтернатив

простейшем случае полезность является линейной функцией регрессоров:

Эта модель сводится к пороговой, если взять

, С = 0.

Таким образом, характер модели (2) можно интерпретировать как

выбор альтернативы, наиболее полезной для выбирающего. Случайная

ошибка, включенная в модель, учитывает два ключевых момента: 1) с одним и тем же набором факторов могут быть выбраны различные

альтернативы; 2) выбирающий может выбрать не максимально полезную

альтернативу, что демонстрирует иррациональное поведение.

Поскольку эти логистическое и нормальное распределения очень

близки, вопрос о том, какое из них использовать очень сложен.

В данной работе выбрана logit-модель в

силу простоты численной реализации процедуры оценивания параметров.

Модели бинарного выбора

Модели бинарного выбора используются, когда субъект совершает

выбор между двумя возможными альтернативами. Выбор основывается на

Читать еще:  Рынок экономическая теория

наборе некоторых входных факторов, характеризующих альтернативы и

субъект. Обозначим сделанный выбор переменной Y, которая принимает

значение 0, когда выбрана первая альтернатива, иначе значение 1.

Входные факторы могут выражать и качественные, и количественные

признаки. Задача состоит в установлении взаимосвязи между зависимой

переменной и одной или более независимыми переменными, в общем

случае принимающими все действительные значения. В том случае, когда

возможных альтернатив несколько, модель называется моделью

множественного выбора. В данной работе рассматривается модель

бинарного выбора, как первый этап в изучении моделей множественного

выбора. В качестве примера применения таких моделей можно привести

социологический опрос или маркетинговые исследования, где выбор

между альтернативами зависит от предпочтений выбирающего и

характеристик объекта исследования.

Пусть Yi обозначает значение переменной Y, i=1,…n, где n

количество выбирающих, и Xi =(xi1,…,xik) обозначает значения факторов, характеризующих выбор и выбирающего.

Самой простой является модель

линейной вероятности [1]:

(1)

Где β— вектор коэффициентов регрессии, εi – независимо

распределенная случайная величина с нулевым математическим

ожиданием (в дальнейшем случайная ошибка).

Из предположения о нулевом математическом ожидании случайной

ошибки следует, что она принимает только дискретные значения [1, 2].

Поскольку Y i принимает только два значения, очевидно, что:

Таким образом, модель (1) может быть записана в виде

Для данной регрессионной зависимости возможно применение

метода наименьших квадратов, однако, результаты оценивания будут не

удовлетворительными с содержательной точки зрения. Недостатками

модели линейной вероятности является сложная интерпретация дробных

значений зависимых переменных, а также возможный выход за область

определения [0, 1] значений, как зависимых переменных, так и

прогнозных значений, которые по смыслу являются прогнозными

значениями вероятности выбора одной из альтернатив. В [1, 6]

представлена модель бинарного выбора, основанная на использовании

функции распределения F(•), область значений которой лежит в отрезке

(2)

Обычно используют два вида распределений:

1) функция логистического распределения

,

соответствующую модель называют logit-моделью.

2) функция нормального распределения

,

соответствующую модель называют probit-моделью. Предполагается, что в основе выбора

альтернатив лежит некоторая ненаблюдаемая количественная переменная

Y*, связанная с входными переменными регрессионным уравнением:

,

где ошибки ε независимы и одинаково распределены с нулевым средним и

дисперсией σ. Наблюдается только дискретная величина Y, которая

связана с Y* следующим соотношением: Y=1, если Y*

; иначе Y=0.

Пороговое значение С, без ограничения общности принимаемое равным

нулю, если константа включена в число регрессоров. Примером

порогового значения С будет накопление семьи, которая принимает

решение о покупке холодильника. Предполагая, что случайные ошибки

имеют одно и тоже симметричное распределение F(•)=1–F(•), получаем

, что с точностью до нормировки совпадает с (2). Параметры β и σ

участвуют только в виде отношения и не могут быть по отдельности

идентифицированы, поэтому в данном случае можно считать, что σ =1.

Другая интерпретация модели выбора [3, 5] предполагает, что

выбор осуществляется на основе ненаблюдаемой полезности альтернатив

простейшем случае полезность является линейной функцией регрессоров:

Эта модель сводится к пороговой, если взять

, С = 0.

Таким образом, характер модели (2) можно интерпретировать как

выбор альтернативы, наиболее полезной для выбирающего. Случайная

ошибка, включенная в модель, учитывает два ключевых момента: 1) с одним и тем же набором факторов могут быть выбраны различные

альтернативы; 2) выбирающий может выбрать не максимально полезную

альтернативу, что демонстрирует иррациональное поведение.

Поскольку эти логистическое и нормальное распределения очень

близки, вопрос о том, какое из них использовать очень сложен.

В данной работе выбрана logit-модель в

силу простоты численной реализации процедуры оценивания параметров.

Ссылка на основную публикацию
Adblock
detector