Эконометрика ХГАЭП, вариант 1.
Задание №1. Имеются данные за 12 месяцев года по району города о рынке вторичного жилья (Y – стоимость квартиры, тыс.у.е., Х – размер общей площади, м2). Данные приведены в таблице 1.1.
Таблица 1.1.
Месяц 1 2 3 4 5 6 7 8 9 10 11 12
,тыс.у.е. 13,0 16,4 17,0 15,2 14,2 10,5 20,0 12,0 15,6 12,5 13,2 14,6
Х, м2 37,0 60,0 60,9 52,1 40,1 30,4 43,0 32,1 35,1 32,0 33,0 32,5
Задание:
1. Рассчитайте параметры уравнений регрессии
2. Оцените тесноту связи с показателем корреляции и детерминации.
3. Рассчитайте средний коэффициент эластичности и дайте сравнительную оценку силы связи фактора с результатом.
4. Рассчитайте среднюю ошибку аппроксимации и оцените качество модели.
5. С помощью F - статистики Фишера (при оцените надежность уравнения регрессии.
6. Рассчитайте прогнозное значение прогн, если прогнозное значение фактора увеличится на 5% от его среднего значения. Определите доверительный интервал прогноза для =0,01.
Решение. Для определения параметров «а» и «b» обоих уравнений выполним необходимые в таблице промежуточные расчеты.
Мес 1 2 3 4 5 6 7 8 9 10 11 12
y 13,0 16,4 17,0 15,2 14,2 10,5 20,0 12,0 15,6 12,5 13,2 14,6 174,2
x 37,0 60,0 60,9 52,1 40,1 30,4 43,0 32,1 35,1 32,0 33,0 32,5 488,2
x2 1369 3600 3708,81 2714,41 1608,01 924,16 1849,0 1030,41 1232,01 1024,0 1089,0 1056,25 21205,06
y2 169,0 268,96 289,0 231,04 201,64 110,25 400,0 144,0 243,36 156,25 174,24 213,16 2600,9
481,0 984,0 1035,3 791,92 569,42 319,2 860,0 385,2 547,56 400,0 435,6 474,5 7283,7
13,98 17,34 17,47 16,19 14,43 13,01 14,85 13,26 13,70 13,25 13,39 13,32 174,19
0,98 0,94 0,47 0,99 0,23 2,51 5,15 1,26 1,9 0,75 0,19 1,28
7,54 5,73 2,76 6,51 1,62 23,9 25,75 10,5 12,18 6,0 1,44 8,77 112,7
6,083 7,746 7,804 7,218 6,332 5,514 6,557 5,666 5,925 5,657 5,745 5,701 75,948
79,076 127,034 132,665 109,714 89,921 57,893 131,149 67,988 92,423 70,711 75,828 83,233 1117,635
13,99 17,31 17,43 16,26 14,48 12,85 14,93 13,15 13,67 13,13 13,31 13,22 173,73
0,99 0,91 0,43 1,06 0,28 2,35 5,07 1,15 1,93 0,63 0,11 1,38
7,61 5,55 2,53 6,97 1,97 22,38 25,35 9,58 12,37 5,04 0,83 9,45 109,63
Средние величины:
Дисперсия величин х; y; u:
Параметры уравнения регрессии:
и оно примет вид:
2. Коэффициент корреляции:
Т. к коэффициент корреляции существенно меньше единицы, то связь очевидно слабая, но поскольку больше критического значения коэффициента корреляции (см. приложение 3) при и , то связь значимая.
Коэффициент детерминации: указывает, что 40% изменения стоимости квартиры связаны с изменением ее общей площади.
Значимость уравнения регрессии в целом можно оценить с помощью F- критерия Фишера.
Табличное значение F - критерия при составляет Fтабл=(0,05; 10;1)=4,96 (см. приложение 1). Т. к F> Fтабл, то на этом уровне значимости уравнение регрессии значимо.
3. Средний коэффициент эластичности определим формулой:
т. к. , то стоимость квартиры неэластична относительно ее площади и при изменении площади на 1 % в точке стоимость квартиры изменится лишь на 0,41 %.
4. Среднюю ошибку аппроксимации определим формулой
Для чего рассчитаем стоимость квартир по уравнению линейной регрессии,
абсолютное и относительные (в процентах) отклонение (заполним 7-9 строки таблицы).
Средняя ошибка аппроксимации составила:
Т.к. <10 %, то качество модели можно признать удовлетворительным.
5. F- критерий Фишера, определенный ранее F=6,67 превышает табличное значение
Fтабл=4,96 при уровне значимости и числе степеней свободы d.f.=n-2=10 и одной независимой переменной что указывает на значимость коэффициента регрессии «b», коэффициента корреляции «rxy» и уравнения регрессии в целом.
Аналогичные расчеты выполним для определения параметров уравнения , заменив величины . Необходимые суммы, средние величины и дисперсии определены ранее.
Параметры уравнения регрессии:
и оно принимает вид:
Рассчитанные по этому уравнению величины ; ; записаны в нижних строках таблицы.
Коэффициент корреляции и детерминации:
т. е.41,73% результата связаны с независимой переменной «u».
Критерий Фишера:
Коэффициент эластичности:
где - производная функции по переменной х.
Средняя ошибка аппроксимации:
По величине нелинейная модель надежнее и дальнейшие расчеты делаем для нее.
Значимость каждого параметра уравнения определим по t-критерию Стьюдента .
Определим ошибки параметров для чего определим остаточную сумму квадратов отклонений:
и сумму квадратов независимой переменной:
Тогда
Т. к. и , то коэффициенты b и r значимо отличаются от нуля, т. е. не случайны.
Поскольку А%=9,13<10% , то качество модели удовлетворительно и ее можно использовать для прогноза.
6. Прогнозное значение фактора (увеличение на 5 %)
Ошибка прогноза:
Тогда:
Доверительный интервал:
Ошибка прогноза очень велика, а при доверительной вероятности прогноз очень широк и вероятно, никому в таком виде не нужен.
Кроме того, при уровне значимости по доверительному интервалу, критическое значение коэффициента корреляции , что больше коэффициентов корреляции обеих моделей, т.е. на этом уровне коэффициент корреляции незначим, а значит незначимо и непригодно для построения доверительного интервала уравнение регрессии.
Задание № 11.
Имеются данные о деятельности крупнейших компаний, в течении 12 месяцев 199х года. Известны – чистый доход (y), оборот капитала (x1), использованный капитал (х2) в млрд у.е.
y, млрд у.е. 5,5 2,4 3,0 4,2 2,7 1,6 2,4 3,3 1,8 2,4 1,6 1,4
х1, млрд у.е. 53,1 18,8 35,3 71,9 93,6 10,0 31,5 36,7 13,8 64,8 30,4 12,1
х2, млрд у.е. 27,1 11,2 16,4 32,5 25,4 6,4 12,5 14,3 6,5 22,7 15,8 9,3
Задание:
1. Рассчитайте параметры линейного уравнения множественной регрессии.
2. Дайте оценку силы связи факторов с результатом с помощью средних коэффициентов эластичности.
3. Оцените статистическую зависимость параметров и уравнения регрессии в целом с помощью соответственно критериев Стьюдента и Фишера .
4. Рассчитайте среднюю ошибку аппроксимации. Сделайте вывод.
5. Составьте матрицы парных и частных коэффициентов корреляции и укажите информативные факторы.
Решение: Рассматриваем уравнение множественной регрессии в виде:
Для определения коэффициентов , выполним промежуточные расчеты.
№
1 5,5 53,1 27,1 292,05 149,05 1439,01 30,25 2819,61 734,41 4,285 22,09
2 2,4 18,8 11,2 45,12 26,88 210,56 5,76 353,44 125,44 2,278 5,08
3 3,0 35,3 16,4 105,9 49,2 578,92 9,0 1246,09 268,96 2,767 7,77
4 4,2 71,9 32,5 301,98 136,5 2336,75 17,64 5169,61 1056,25 4,739 12,83
5 2,7 93,6 25,4 252,72 68,58 2377,44 7,29 8760,96 645,16 2,666 1,26
6 1,6 10,0 6,4 16,0 10,24 64,0 2,56 100,0 40,96 1,623 1,44
7 2,4 31,5 12,5 75,6 30,0 393,75 5,76 992,25 156,25 2,128 11,33
8 3,3 36,7 14,3 121,11 47,19 524,81 10,89 1346,89 204,49 2,313 29,91
9 1,8 13,8 6,5 24,84 11,7 89,7 3,24 190,44 42,25 1,522 15,44
10 2,4 64,8 22,7 155,52 54,48 1470,96 5,76 4199,04 515,29 3,056 27,33
11 1,6 30,4 15,8 48,64 25,28 480,32 2,56 924,16 249,64 2,805 75,3
12 1,4 12,1 9,3 16,94 13,02 112,53 1,96 146,41 86,49 2,121 51,5
32,3 472 200,1 1456,42 622,12 10078,75 102,67 26248,9 4125,59 32,303 261,28
Сред
ние 2,692 39,333 16,675 121,368 51,843 839,896 8,556 2187,408 343,799 21,77
Дисперсии и среднеквадратические отклонения величин:
Парные коэффициенты корреляции рассчитаем по формулам:
Стандартизированное уравнение регрессии имеет вид:
Тогда стандартизированное уравнение:
Параметры уравнения регрессии естественной формы определятся:
Естественная форма уравнения регрессии имеет вид:
По этому уравнению регрессии определены значения чистого дохода и его относительные (в процентах) отклонения от фактических значений yi по месяцам (полученные величины вписаны в два последних столбца таблицы).
2. Средние коэффициенты эластичности дохода Y по обороту капитала x1 и по использованному капиталу x2, составляет:
т. к. <1; >1, то доход неэластичен по обороту капитала x1 и эластичен, по использованному капиталу. Полученные величины указывают, что 1% -ое изменение величин x1 или x2 от их средних значений вызовет изменение среднего значения чистого дохода на 0,465% и на 1,207% при изменении одного из факторов и неизменности другого. Знак «-» у Э1 означает, что рост x1 вызывает уменьшение Y и наоборот.
3. Интерпретировать коэффициенты регрессии b1 и b2, как величину изменения результативного показателя при изменении факторов на единицу нельзя, т.к. факторы x1 и x2 взаимозависимы (коллинеарны), на что указывает величина
Оценивая значимость параметров уравнения регрессии и его самого в целом, вычислим коэффициенты множественной корреляции и детерминации:
Коэффициент множественной детерминации
Фактическое значение F-критерия Фишера составит:
где К=2 – число факторных переменных в уравнении.
Частные F – статистики и t – критерии Стьюдента
Табличные значения критерия Фишера,
, критерия Стьюдента- , где - заданный уровень значимости; число степеней свободы (К=2- число независимых переменных) (для частных F- статистик число степеней свободы знаменателя равно 1, т.к. остается одна независимая переменная).
Из сравнения расчетных и табличных критериев следует, что уравнение регрессии значимо в целом (т.к. , но поскольку и , то включение в модель фактора x1 после фактора x2 нецелесообразно. Нецелесообразно на этом уровне значимости включать в уравнение и фактор x2, если туда уже включен фактор x1. На то же указывают и расчетные значения t- критериев (они меньше табличного).
Если снизить уровень значимости до , то , то уравнение регрессии значимо, при этом значим коэффициент b2(tb2>tT), а коэффициент b1 остается незначимым (tb1<tT),
Следовательно, в уравнении следует оставить фактор x2 исключив x1.
Тогда: и уравнение регрессии приобретает вид:
4. Средняя ошибка аппроксимации определена в последней колонке таблицы, как средняя относительная (в %) ошибка аппроксимированных значений дохода от фактических -y.
Ee величина составила , что значительно больше допускаемого (до 10%) для признания модели удовлетворительной. Т. о качество модели неудовлетворительное.
5. Матрица парных коэффициентов корреляции имеет вид:
Информативные факторы – чем ближе парный коэффициент корреляции к 1, тем сильнее связь между переменными. В данном случае переменная x2 сильнее влияет на Y чем x1 (0,7497>0,5348). Поскольку , то факторы x1 и x2 считаются взаимосвязаны и одновременно включение их в уравнение регрессии нецелесообразно.
Частные коэффициенты корреляции составят:
Их матрица . Значения частных коэффициентов корреляции указывают, что при закреплении одного из факторов на постоянном уровне влияние второго фактора на результативный показатель оказалось слабее, чем при изменении обоих факторов (коэффициенты 0,47<0,5348; 0,723<0,7497).
Снижении силы влияния говорит о корреляционной связи между факторами x1 и x2.
Задание № 21.
1.Используя необходимое и достаточное условие идентификации, определить, идентифицированное ли каждое уравнение модели.
2.Определить тип модели.
3.Определите метод оценки параметров модели.
4.Опишите последовательность действий при использовании этого метода.
Гипотетическая модель экономики:
-совокупное потребление в период t;
- совокупный доход в период t;
- инвестиции в период t;
- налоги в период t;
- государственные доходы в период t.
Решение:
Полагая, что предопределенные переменные – экзогенная и лаговая , а эндогенные (зависимые) переменные ; ; (исключаем , т.к эта переменная задана тождеством), проверим необходимые условия идентификации.
1-ое уравнение:
Д=1(отсутствует );Н=1(присутствует ) Д+1=1+1=2>Н=1-уравнение
сверхидентифицируемо.
2-ое уравнение:
Д=1(отсутствует ); Н=1 (присутствует ) Д+1=1+1=2>Н=1-уравнение сверхидентифицируемое.
3-ое уравнение: Д=1(отсутствует ); Н=1 (присутствует ) Д+1=1+1=2>Н=1 уравнение сверхидентифицируемое.
Проверим достаточные условие идентификации.
В 1-ом уравнении нет переменных ; ; . Строим матрицу:
2-ое уравнение b21 -1 0
3-е уравнение 0 0 -1
.
Во 2-ом уравнении нет переменных ; ; . Строим матрицу:
1-ое уравнение b11+ b12 -1 0
3-е уравнение b31 0 -1
В 3-ем уравнении нет переменных ; ; Строим матрицу:
1-ое уравнение 0 -1 0
2-е уравнение b21 0 -1
Т.о. образом, достаточные условия идентифицируемости для всех уравнений выполняются, т. к уравнения системы сверхидентифицируемы, то и модель в целом сверхидентифицируема.
3. Заданная структурная модель является одновременно приведенной моделью, т. к в правой части уравнений (кроме тождества) нет эндогенных переменных. Поэтому структурные коэффициенты (b11+ b12 ; b21 ; b31 )через коэффициенты приведенной модели
; ; ; - отклонения эндогенных переменных от средних уровней, т.е и т д, очевидно выражаются так:
Задание №31. Имеются данные за 15 дней по количеству пациентов клиники, прошедших через терапевтическое отделение клиники в течении дня.
Дни 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Число пациентов 29 40 30 52 47 28 16 51 40 35 57 28 33 42 39
Требуется:
1.Определить коэффициенты автокорреляции уровней ряда первого и второго порядков.
2. Обосновать выбор уравнения тренда и определить его параметры, сделать выводы.
3. Сделать выводы
Решение. Коэффициенты автокорреляции уровней ряда 1-ого и 2-ого порядков определим по формулам:
;
где yt - текущее значение числа пациентов за t-ый день;
yt-1 – число пациентов за предыдущий год;
yt-2 – число пациентов в день за два дня до t-ого года.
; ; ;
Необходимые расчеты выполним в таблице:
День 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
29 40 30 52 47 28 16 51 40 35 57 28 33 42 39 567
- 29 40 30 52 47 28 16 51 40 35 57 28 33 42 528
- - 29 40 30 52 47 28 16 51 40 35 57 28 33 486
- 1,571 -8,429 13,571 8,571 -10,429 -22,429 12,577 1,571 -3,429 18,571 -10,429 -5,429 -3,571 0,571 -
- -8,714 2,286 -7,714 14,286 9,286 -9,714 -21,714 13,286 2,286 -2,714 19,286 -9,714 -4,714 4,286 -
- - -8,308 13,692 8,692 -10,308 -22,308 12,692 1,692 -3,308 18,692 -10,308 -5,308 3,692 0,692 -
- - -8,385 2,615 -7,385 14,615 9,615 -9,385 -21,385 13,615 2,615 -2,385 19,615 -9,385 -4,385 -
- 2,468 71,048 184,172 73,462 108,764 503,06 158,03 2,468 11,758 344,882 108,764 29,474 12,752 0,362 1611,464
- 75,939 5,224 59,510 204,082 86,224 94,367 471,510 176,510 5,224 7,367 371,939 94,367 22,224 18,367 169,854
- - 69,023 187,471 75,551 106,255 497,647 161,087 2,863 10,943 349,391 106,255 28,175 13,631 0,479 1608,771
- - 70,302 6,840 54,533 213,609 92,456 88,071 457,302 185,379 6,840 5,686 384,763 88,071 19,225 1673,077
- -13,690 -19,269 -104,687 122,445 -96,844 217,875 -272,967 20,872 -7,839 -50,402 -201,134 52,737 -16,834 2,447 -367,29
- - 69,663 35,805 -64,190 -150,651 -214,491 -119,114 -36,183 -45,038 48,880 24,585 -104,116 -34,649 -3,034 -589,533
Тогда коэффициенты автокорреляции составят:
Т.к. коэффициенты автокорреляции первого и второго порядка намного меньше 1, то временной ряд не содержит линейной тенденции.
Для оценки возможности существования нелинейной тенденции построим график зависимости уровней ряда от времени. Получим эмпирическую ломаную линию распределения:
Ее вид указывает на отсутствие какой-либо тенденции, т. е число пациентов отделения в течение каждого дня носит случайный характер, и не может быть выражено в виде модели временного ряда. Иначе говоря, число пациентов составляет в среднем с возможным случайным отклонением от этого уровня.
|