Пример решения задачи. Эконометрические модели
Условие задачи
По 20
предприятиям региона изучается зависимость выработки продукции на одного
работника
(тыс.руб.) от ввода в действие новых основных
фондов
(% от стоимости фондов на
конец года) и от удельного
веса рабочих высокой квалификации в общей численности рабочих
(смотри таблицу своего варианта).
Требуется:
№ |
|
|
|
№ |
|
|
|
1 | 7 | 3.7 | 9 | 11 | 10 | 6.8 | 21 |
2 | 7 | 3.7 | 11 | 12 | 11 | 7.4 | 23 |
3 | 7 | 3.9 | 11 | 13 | 11 | 7.8 | 24 |
4 | 7 | 4.1 | 15 | 14 | 12 | 7.5 | 26 |
5 | 8 | 4.2 | 17 | 15 | 12 | 7.9 | 28 |
6 | 8 | 4.9 | 19 | 16 | 12 | 8.1 | 30 |
7 | 8 | 5.3 | 19 | 17 | 13 | 8.4 | 31 |
8 | 9 | 5.1 | 20 | 18 | 13 | 8.7 | 32 |
9 | 10 | 5.6 | 20 | 19 | 13 | 9.5 | 33 |
10 | 10 | 6.1 | 21 | 20 | 14 | 9.7 | 35 |
Решение задачи
Для
удобства проведения расчетов поместим результаты промежуточных расчетов в
таблицу:
№ |
|
|
|
|
|
|
|
|
|
1 | 7 | 3.7 | 9 | 25.9 | 63 | 33.3 | 13.69 | 81 | 49 |
2 | 7 | 3.7 | 11 | 25.9 | 77 | 40.7 | 13.69 | 121 | 49 |
3 | 7 | 3.9 | 11 | 27.3 | 77 | 42.9 | 15.21 | 121 | 49 |
4 | 7 | 4.1 | 15 | 28.7 | 105 | 61.5 | 16.81 | 225 | 49 |
5 | 8 | 4.2 | 17 | 33.6 | 136 | 71.4 | 17.64 | 289 | 64 |
6 | 8 | 4.9 | 19 | 39.2 | 152 | 93.1 | 24.01 | 361 | 64 |
7 | 8 | 5.3 | 19 | 42.4 | 152 | 100.7 | 28.09 | 361 | 64 |
8 | 9 | 5.1 | 20 | 45.9 | 180 | 102 | 26.01 | 400 | 81 |
9 | 10 | 5.6 | 20 | 56 | 200 | 112 | 31.36 | 400 | 100 |
10 | 10 | 6.1 | 21 | 61 | 210 | 128.1 | 37.21 | 441 | 100 |
11 | 10 | 6.8 | 21 | 68 | 210 | 142.8 | 46.24 | 441 | 100 |
12 | 11 | 7.4 | 23 | 81.4 | 253 | 170.2 | 54.76 | 529 | 121 |
13 | 11 | 7.8 | 24 | 85.8 | 264 | 187.2 | 60.84 | 576 | 121 |
14 | 12 | 7.5 | 26 | 90 | 312 | 195 | 56.25 | 676 | 144 |
15 | 12 | 7.9 | 28 | 94.8 | 336 | 221.2 | 62.41 | 784 | 144 |
16 | 12 | 8.1 | 30 | 97.2 | 360 | 243 | 65.61 | 900 | 144 |
17 | 13 | 8.4 | 31 | 109.2 | 403 | 260.4 | 70.56 | 961 | 169 |
18 | 13 | 8.7 | 32 | 113.1 | 416 | 278.4 | 75.69 | 1024 | 169 |
19 | 13 | 9.5 | 33 | 123.5 | 429 | 313.5 | 90.25 | 1089 | 169 |
20 | 14 | 9.7 | 35 | 135.8 | 490 | 339.5 | 94.09 | 1225 | 196 |
Сумма | 202 | 128.4 | 445 | 1384.7 | 4825 | 3136.9 | 900.42 | 11005 | 2146 |
Ср.знач. | 10.100 | 6.420 | 22.250 | 69.235 | 241.250 | 156.845 | 45.021 | 550.250 | 107.300 |
Найдем
средние квадратические отклонения признаков:
Линейное уравнение множественной регрессии
Для
нахождения параметров линейного уравнения множественной регрессии:
необходимо
решить следующую систему линейных уравнений относительно неизвестных параметров
:
либо
воспользоваться готовыми формулами:
Рассчитаем
сначала парные коэффициенты корреляции:
Таким
образом, получили следующее уравнение множественной регрессии:
Стандартизированное уравнение множественной регрессии
Коэффициенты
и
стандартизированного уравнения регрессии
находятся по формулам:
То есть
уравнение будет выглядеть следующим образом:
Так как
стандартизованные коэффициенты регрессии можно сравнивать между собой, то можно
сказать, что ввод в действие новых основных фондов оказывает большее влияние на
выработку продукции, чем удельный вес рабочих высокой квалификации.
Коэффициенты эластичности
Сравнивать
влияние факторов на результат можно также при помощи средних коэффициентов
эластичности:
Вычисляем:
Т.е.
увеличение только основных фондов (от своего среднего значения) или только
удельного веса рабочих высокой квалификации на 1% увеличивает в среднем
выработку продукции на 0,503% или 0,214% соответственно. Таким образом,
подтверждается большее влияние на результат
фактора
, чем фактора
.
Коэффициенты парной корреляции
Коэффициенты парной корреляции мы уже нашли:
Они
указывают на весьма сильную связь каждого фактора с результатом, а также
высокую межфакторную зависимость (факторы
и
явно коллинеарны, так как
). При такой сильной
межфакторной зависимости рекомендуется один из факторов исключить из
рассмотрения.
Частные коэффициенты корреляции
Частные
коэффициенты корреляции характеризуют тесноту связи между результатом и
соответствующим факторов при элиминировании (устранении влияния) других
факторов, включенных в уравнение регрессии.
При двух
факторах частные коэффициенты корреляции рассчитываются следующим образом:
Если
сравнить коэффициенты парной и частной корреляции, то можно увидеть, что из-за
высокой межфакторной зависимости коэффициенты парной корреляции дают завышенные
оценки тесноты связи. Именно по этой причине рекомендуется при наличии сильной
коллинеарности (взаимосвязи) факторов исключать из исследования тот фактор, у
которого теснота парной зависимости меньше, чем теснота межфакторной связи.
Коэффициент множественной корреляции
Коэффициент
множественной корреляции определить по формуле:
Коэффициент
множественной корреляции показывает на весьма сильную связь всего набора
факторов с результатом.
Нескорректированный коэффициент множественной детерминации
оценивает долю вариации результата за счет
представленных в уравнении факторов в общей вариации результата. Здесь эта доля
составляет 98.4% и указывает на высокую степень обусловленности вариации
результата вариацией факторов, иными словами – на весьма тесную связь факторов
с результатом.
Скорректированный
коэффициент множественной корреляции:
определяет
тесноту связи с учетом степеней свободы общей и остаточной дисперсий. Он дает
такую оценку тесноты связи, которая не зависит от числа факторов и поэтому
может сравниваться по разным моделям с разным числом факторов. Оба коэффициента
указывают на высокую (более 95%) детерминированность результата
в модели факторами
и
.
Критерий Фишера
Оценку
надежности уравнения регрессии в целом и показателя тесноты связи
дает
–критерий Фишера:
В нашем
случае фактическое значение
–критерия Фишера:
Получили,
что
(при
), то есть вероятность
случайно получить такое значение
– критерия не превышает допустимый уровень
значимости 5%. Следовательно, полученное значение не случайно, оно
сформировалось под влиянием существенных факторов, то есть подтверждается
статистическая значимость всего уравнения и показателя тесноты связи
.
С
помощью частных
–критериев Фишера оценим целесообразность
включения в уравнение множественной регрессии фактора
после
и фактора
после
при помощи формул:
Найдем
и
.
Получили,
что
. Следовательно, включение
в модель фактора
после того, как в модель включен фактор
статистически нецелесообразно: прирост
факторной дисперсии за счет дополнительного признака
оказывается незначительным, несущественным;
фактор
включать в уравнение после фактора
не следует.
Если
поменять первоначальный порядок включения факторов в модель и рассмотреть
вариант включения
после
, то результат расчета
частного
–критерия для
будет иным.
, то есть вероятность его
случайного формирования меньше принятого стандарта
. Следовательно, значение
частного
– критерия для дополнительно включенного
фактора
не случайно, является статистически значимым,
надежным, достоверным: прирост факторной дисперсии за счет дополнительного
фактора
является существенным.
Фактор
должен присутствовать в уравнении, в том числе в варианте, когда он
дополнительно включается после фактора
.
Задача
По 20
предприятиям региона изучается зависимость выработки продукции на одного
работника
(тыс.руб.) от ввода в действие новых основных
фондов
(% от стоимости фондов на
конец года) и от удельного веса рабочих высокой квалификации в общей
численности рабочих
(смотри таблицу своего варианта).
Требуется:
Построить линейную модель множественной регрессии. Записать стандартизированное
уравнение множественной регрессии. На основе стандартизированных коэффициентов
регрессии и средних коэффициентов эластичности ранжировать факторы по степени
их влияния на результат.
Найти
коэффициенты парной, частной и множественной корреляции. Проанализировать их.
Найти
скорректированный коэффициент множественной детерминации. Сравнить его с
нескорректированным (общим) коэффициентов детерминации.
С
помощью
–критерия Фишера оценить статистическую
надежность уравнения регрессии и коэффициента детерминации
С
помощью частных
–критериев Фишера оценить целесообразность
включения в уравнение множественной регрессии фактора
после
и фактора
после
.
Составить уравнение линейной парной регрессии, оставив лишь один значащий фактор.
Решение
Для
удобства проведения расчетов поместим результаты промежуточных расчетов в
таблицу:
Найдем
средние квадратические отклонения признаков:
Расчет
парных коэффициентов корреляции и параметров линейного уравнения множественной
регрессии
1) Для
нахождения параметров линейного уравнения множественной регрессии:
необходимо
решить следующую систему линейных уравнений относительно неизвестных параметров
:
Решать систему уравнений
методом Крамера,
методом обратной матрицы или
методом Гаусса достаточно трудоемко, поэтому
воспользуемся готовыми формулами:
Рассчитаем
сначала парные коэффициенты корреляции:
Находим:
Таким
образом, получили следующее уравнение множественной регрессии:
Коэффициенты
стандартизированного уравнения регрессии
Коэффициенты
и
стандартизированного уравнения регрессии
находятся по формулам:
То есть
уравнение будет выглядеть следующим образом:
Так как
стандартизованные коэффициенты регрессии можно сравнивать между собой, то можно
сказать, что ввод в действие новых основных фондов оказывает большее влияние на
выработку продукции, чем удельный вес рабочих высокой квалификации.
На сайте можно заказать решение контрольной или самостоятельной работы, домашнего задания, отдельных задач. Для этого вам нужно только связаться со мной:
ВКонтакте
WhatsApp
Telegram
Мгновенная связь в любое время и на любом этапе заказа. Общение без посредников. Удобная и быстрая оплата переводом на карту СберБанка. Опыт работы более 25 лет.
Подробное решение в электронном виде (docx, pdf) получите точно в срок или раньше.
Коэффициенты
эластичности
Сравнивать
влияние факторов на результат можно также при помощи средних коэффициентов
эластичности:
Вычисляем:
Т.е.
увеличение только основных фондов (от своего среднего значения) или только
удельного веса рабочих высокой квалификации на 1% увеличивает в среднем
выработку продукции на 0,635% или 0,142% соответственно. Таким образом,
подтверждается большее влияние на результат
фактора
, чем фактора
.
Частные
и парные коэффициенты корреляции
2) Коэффициенты парной корреляции мы уже нашли:
Они
указывают на весьма сильную связь каждого фактора с результатом, а также
высокую межфакторную зависимость (факторы
и
явно коллинеарны, так как
). При такой сильной
межфакторной зависимости рекомендуется один из факторов исключить из
рассмотрения.
Частные
коэффициенты корреляции характеризуют тесноту связи между результатом и
соответствующим факторов при элиминировании (устранении влияния) других
факторов, включенных в уравнение регрессии.
При двух
факторах частные коэффициенты корреляции рассчитываются следующим образом:
Если
сравнить коэффициенты парной и частной корреляции, то можно увидеть, что из-за
высокой межфакторной зависимости коэффициенты парной корреляции дают завышенные
оценки тесноты связи. Именно по этой причине рекомендуется при наличии сильной
коллинеарности (взаимосвязи) факторов исключать из исследования тот фактор, у
которого теснота парной зависимости меньше, чем теснота межфакторной связи.
Коэффициенты
множественной корреляции и детерминации
Коэффициент
множественной корреляции определить по формуле:
Коэффициент
множественной корреляции показывает на весьма сильную связь всего набора
факторов с результатом.
3)
Нескорректированный коэффициент множественной детерминации
оценивает долю вариации результата за счет
представленных в уравнении факторов в общей вариации результата. Здесь эта доля
составляет 98,4% и указывает на высокую степень обусловленности вариации
результата вариацией факторов, иными словами – на весьма тесную связь факторов
с результатом.
Скорректированный
коэффициент множественной корреляции:
определяет
тесноту связи с учетом степеней свободы общей и остаточной дисперсий. Он дает
такую оценку тесноты связи, которая не зависит от числа факторов и поэтому
может сравниваться по разным моделям с разным числом факторов. Оба коэффициента
указывают на высокую (более 98%) детерминированность результата
в модели факторами
и
.
Надежность
уравнения регрессии. Критерий Фишера
4) Оценку
надежности уравнения регрессии в целом и показателя тесноты связи
дает
–критерий Фишера:
В нашем
случае фактическое значение
–критерия Фишера:
Получили,
что
(при
)
(по таблице F-распределения Фишера-Снедекора, при уровне значимости α=0,05 и числе степеней свободы k1=2 и k2=20-2=18), то есть вероятность
случайно получить такое значение
– критерия не превышает допустимый уровень
значимости 5%. Следовательно, полученное значение не случайно, оно
сформировалось под влиянием существенных факторов, то есть подтверждается
статистическая значимость всего уравнения и показателя тесноты связи
.
5) С
помощью частных
–критериев Фишера оценим целесообразность
включения в уравнение множественной регрессии фактора
после
и фактора
после
при помощи формул:
Найдем
и
.
Получили,
что
. Следовательно, включение
в модель фактора
после того, как в модель включен фактор
статистически нецелесообразно: прирост
факторной дисперсии за счет дополнительного признака
оказывается незначительным, несущественным;
фактор
включать в уравнение после фактора
не следует.
Если
поменять первоначальный порядок включения факторов в модель и рассмотреть
вариант включения
после
, то результат расчета
частного
–критерия для
будет иным.
, то есть вероятность его
случайного формирования меньше принятого стандарта
. Следовательно, значение
частного
–критерия для дополнительно включенного
фактора
не случайно, является статистически значимым,
надежным, достоверным: прирост факторной дисперсии за счет дополнительного
фактора
является существенным.
Фактор
должен присутствовать в уравнении, в том числе
в варианте, когда он дополнительно включается после фактора
.
6) Общий
вывод состоит в том, что множественная модель с факторами
и
с
содержит неинформативный фактор
. Если исключить фактор
, то можно ограничится
уравнением парной регрессии:
-
Стандартизированное уравнение множественной регрессии.
Другой вид уравнения множественной
регрессии – уравнение регрессии в
стандартизированном масштабе:
где
– стандартизированные переменные;
– стандартизированные коэффициенты
регрессии.
К уравнению множественной регрессии в
стандартизированном масштабе применим
МНК. Стандартизированные коэффициенты
регрессии (
–
коэффициенты) определяются из следующей
системы уравнений:
.Связь
коэффициентов множественной регрессии
со стандартизированными коэффициентами
описывается соотношением
Параметр
определяется как
.
Средние коэффициенты эластичности для
линейной регрессии рассчитываются по
формуле
Для расчета частных коэффициентов
эластичности применяется следующая
формула:
.
-
Коэффициент множественной корреляции, скорректированный коэффициент множественной корреляции, множественный коэффициент детерминации.
Экономические явления чаще всего
адекватно описываются именно
многофакторными моделями. Поэтому
возникает необходимость обобщить
рассмотренное выше корреляционное
отношение (6.4) на случай нескольких
переменных.
Теснота линейной взаимосвязи между
переменной y и рядом переменных xj,
рассматриваемых в целом, может быть
определена с помощью коэффициента
множественной корреляции.
Предположим, что переменная y
испытывает влияние двух переменных – x
и z. В этом случае коэффициент
множественной корреляции может быть
определен по формуле:
|
(6.9) |
где ryx, ryz, rxz – простые
коэффициенты линейной парной корреляции,
определенные из соотношения (6.4).
Коэффициент множественной корреляции
заключен в пределах 0 ≤ R ≤ 1. Он не меньше,
чем абсолютная величина любого парного
или частного коэффициента корреляции
с таким же первичным индексом.
С помощью множественного коэффициента
(по мере приближения R к 1) делается вывод
о тесноте взаимосвязи, но не о ее
направлении. Величина R2, называемая
множественным коэффициентом
детерминации, показывает, какую долю
вариации исследуемой переменной (y)
объясняет вариация остальных учтенных
переменных (x, z).
Скорректированный индекс множественной
детерминации содержит поправку на число
степеней свободы и рассчитывается по
формуле:
где
n-число наблюдений; m – число факторов.
-
Оценка статистической значимости множественных коэффициентов регрессии, t-критерий Стьюдента.
Оценка значимости коэффициентов чистой
регрессии с помощью t-критерия Стьюдента
сводится к вычислению значения
где
– средняя квадратичная ошибка коэффициента
регрессии
она может быть определена по следующей
формуле:
-
Модели с переменной структурой (фиктивные переменные).
До сих пор в качестве факторов
рассматривались экономические переменные,
принимающие количественные значения
в некотором интервале. Вместе с тем
может оказаться необходимым включить
в модель фактор, имеющий два или более
качественных уровней. Это могут быть
разного рода атрибутивные признаки,
такие, например, как профессия, пол,
образование, климатические условия,
принадлежность к определенному региону.
Чтобы ввести такие переменные в
регрессионную модель, им должны быть
присвоены те или иные цифровые метки,
т.е. качественные переменные преобразованы
в количественные. Такого вида
сконструированные переменные в
эконометрике принято называть фиктивными
переменными.
Рассмотрим применение фиктивных
переменных для функции спроса. Предположим,
что по группе лиц мужского и женского
пола изучается линейная зависимость
потребления кофе от цены. В общем виде
для совокупности обследуемых уравнение
регрессии имеет вид:
,
где y – количество
потребляемого кофе; x–
цена.
Аналогичные уравнения могут быть найдены
отдельно для лиц мужского пола:
и женского пола:
.
Различия в потреблении кофе проявятся
в различии средних
и
.
Вместе с тем сила влияния
на
может быть одинаковой, т.е.
.
В этом случае возможно построение общего
уравнения регрессии с включением в него
фактора «пол» в виде фиктивной переменной.
Объединяя уравнения
и
и, вводя фиктивные переменные, можно
прийти к следующему выражению:
,
где
и
– фиктивные переменные, принимающие
значения:
Предположим, что определено уравнение
,
где
принимает значения 1 для мужчин и 0 для
женщин.
Теоретические значения размера
потребления кофе для мужчин будут
получены из уравнения
.
В отд. случаях необходимо введение двух
и более групп фиктивных переменных,
т.е. двух и более качественных факторов,
каждый из которых может иметь несколько
градаций. Например, при изучении
потребления некоторого товара наряду
с факторами, имеющими количественное
выражение (цена, доход на одного члена
семьи, цена на взаимозаменяемые товары
и др.), учитываются и качественные
факторы. С их помощью оцениваются
различия в потреблении отдельных
социальных групп населения, дифференциация
в потреблении по полу, национальному
составу и др. При построении такой модели
из каждой группы фиктивных переменных
следует исключить по одной переменной.
Так, если модель будет включать три
социальные группы, три возрастные
категории и ряд экономических переменных,
то она примет вид:
,
где y
– потребление;
– экономические (количественные)
переменные.
До сих пор мы рассматривали фиктивные
переменные как факторы, которые
используются в регрессионной модели
наряду с количественными переменными.
Вместе с тем возможна регрессия только
на фиктивных переменных. Н-р, изучается
дифференциация з/платы рабочих высокой
квалификации по регионам страны. Модель
з/платы может иметь вид:
,
где y – ср.з/плата рабочих
высокой квалификации по отдельным
предприятиям;
………………………………………………………………………..
Поскольку последний район, указанный
в модели, обозначен
,
то в исследование включено
район.
Мы рассмотрели модели с фиктивными
переменными, в которых последние
выступают факторами. Может возникнуть
необходимость построить модель, в
которой дихотомический признак, т.е.
признак, который может принимать только
два значения, играет роль результата,
например, при обработке данных
социологических опросов. В качестве
зависимой переменной
рассматриваются ответы на вопросы,
данные в альтернативной форме: «да» или
«нет». Поэтому зависимая переменная
имеет два значения: 1, когда имеет место
ответ «да», и 0 – во всех остальных
случаях. Модель такой зависимой переменной
имеет вид:
.
Модель является вероятностной линейной
моделью. В ней y
принимает значения 1 и 0, которым
соответствуют вероятности
и
.
Поэтому при решении модели находят
оценку условной вероятности события
при фиксированных значениях
.
Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]
- #
- #
- #
- #
- #
- #
- #
- #
- #
- #
- #