Смекни!
smekni.com

Линейные уравнения парной и множественной регрессии (стр. 2 из 5)

Таким образом, при дополнительном включении в регрессию еще одного фактора коэффициент детерминации должен возрастать, а остаточная дисперсия уменьшаться. Если этого не происходит и данные показатели практически недостаточно значимо отличаются друг от друга, то включаемый в анализ дополнительный фактор не улучшает модель и практически является лишним фактором.

Если модель насыщается такими лишними факторами, то не только не снижается величина остаточной дисперсии и не увеличивается показатель детерминации, но, более того, снижается статистическая значимость параметров регрессии по критерию Стьюдента вплоть до статистической незначимости.

2) Для статистической оценки значимости коэффициентов регрессии (

) используем
статистику Стьюдента.

Проверяется нулевая гипотеза

.

Для проверки нулевой гипотезы необходимо знать величину наблюдаемых значений критерия

. Их значения и оценки их статистической значимости найдем в Таблице №9

Таблица №9

t-статистика P-Значение
-1,127971079 0,28850322
2,838964459 0,01943598
1,130728736 0,28740002

В этой же таблице находим границы доверительных интервалов для каждого из параметров:

Нижние 95% Верхние 95%
-5,313097658 1,777526094
0,047297697 0,418287538
-0,249694323 0,748774142

3. Значения парных коэффициентов корреляции найдем из соответствующей матрицы.

Таблица №10 Корреляционная матрица

y x1 x2
y 1
x1 0,784786247 1
x2 0,60206001 0,531178469 1

По величине парных коэффициентов корреляции может обнаруживаться лишь явная коллинеарность факторов. Наибольшие трудности в использовании аппарата множественной регрессии возникают при наличии мультиколлинеарности факторов, когда более чем два фактора связаны между собой линейной зависимостью, т.е. имеет место совокупное воздействие факторов друг на друга.

Наличие мультиколлинеарности факторов может означать, что некоторые факторы будут всегда действовать в унисон. В результате вариация в исходных данных перестает быть полностью независимой и нельзя оценить воздействие каждого фактора в отдельности. Чем сильнее мультиколлинеарность факторов, тем менее надежна оценка распределения суммы объясненной вариации по отдельным факторам с помощью метода наименьших квадратов (МНК).

Частные коэффициенты корреляции найдем по формулам

,

,

их значения показывают, что при отсутствии влияния других факторов, связь с рассматриваемым фактором усиливается т.е. мультиколлинеарность между ними существует.

4. Рассчитаем прогнозное значение результата, если прогнозные значения факторов составляют 110% их максимального значения. Найдем прогнозные значения факторов и подставим их в полученное уравнение регрессии.

По условию прогнозные значения составляют 110% их максимального значения.


Таблица №11

maxX1 maxX2
28 10

Далее вычисляем прогнозные значения факторов:

. Затем, подставив эти значения в уравнение регрессии, получим прогнозное (предсказанное) значение фактора
. Доверительный интервал прогноза оценивается формулой:
, где
- ошибка прогноза,
стандартная ошибка регрессии.

Таблица №12

Стандартная ошибка 1,104878833

;

- коэффициент Стьюдента, который в данном случае имеет смысл кратности случайной (стандартной) ошибки прогноза
;

- число, которое получим в результате операций над матрицами:

-

матрица значений факторных переменных

,

транспонированная матрица
;

- произведение матриц
;

- матрица, обратная к матрице
;

- матрица прогнозных значений факторов;

- транспонированная матрица прогнозов.

Фактор

представляет собой фиктивную переменную, которую необходимо ввести в уравнение регрессии для того, чтобы преобразовать его в "приведенную" форму вида
.

Максимальную ошибку прогноза

=11,07714043: 1) нижняя граница прогноза
=44,92285957, 2) верхнюю границу прогноза
=67,07714043. Интервал прогнозных значений результативного признака

=>

Задача № 3

Используя данные, представленные в таблице проверить наличие гетероскедастичности, применяя тест Голдфельда-Квандта.

Таблица№13. Данные

Страна Индекс человеческого развития, У Расходы на конечное потребление в текущих ценах, % к ВВП, Х
Австрия 0,904 75,5
Австралия 0,922 78,5
Англия 0,918 84,4
Белоруссия 0,763 78,4
Бельгия 0,923 77,7
Германия 0,906 75,9
Дания 0,905 76,0
Индия 0,545 67,5
Испания 0,894 78,2
Италия 0,900 78,1
Канада 0,932 78,6
Казахстан 0,740 84,0
Китай 0,701 59,2
Латвия 0,744 90,2
Нидерланды 0,921 72,8
Норвегия 0,927 67,7
Польша 0,802 82,6
Россия 0,747 74,4
США 0,927 83,3
Украина 0,721 83,7
Финляндия 0,913 73,8
Франция 0,918 79,2
Чехия 0,833 71,5
Швейцария 0,914 75,3
Швеция 0,923 79,0

1) Найдем параметры линейного уравнения множественной регрессии и значения остатков.

Определим остаточные суммы квадратов

и
, то есть суммы квадратов остатков регрессии по "урезанным выборкам".

Таблица№14

Y X Yp ei (ei) ^2
1 0,932 78,6 77,90431365 0,695686352 0,483979501
2 0,927 67,7 77,85057558 -10,15057558 103,0341846
3 0,927 83,3 77,85057558 5,44942442 29,69622651
4 0,923 77,7 77,80758513 -0,107585125 0,011574559
5 0,923 79,0 77,80758513 1, 192414875 1,421853234
6 0,922 78,5 77,79683751 0,703162488 0,494437485
7 0,921 72,8 77,7860899 -4,986089898 24,86109247
8 0,918 84,4 77,75384706 6,646152943 44,17134894 S1
9 0,918 79,2 77,75384706 1,446152943 2,091358334 206,2660556
10 0,914 75,3 77,7108566 -2,410856603 5,812229559
11 0,913 73,8 77,70010899 -3,900108989 15,21085013
12 0,906 75,9 77,62487569 -1,724875694 2,975196159
13 0,905 76,0 77,61412808 -1,61412808 2,60540946
14 0,904 75,5 77,60338047 -2,103380467 4,424209388
15 0,900 78,1 77,56039001 0,539609988 0,291178939
16 0,894 78,2 77,49590433 0,704095669 0,495750712
17 0,833 71,5 76,8402999 -5,3402999 28,51880303
18 0,802 82,6 76,50712388 6,092876121 37,12313943
19 0,763 78,4 76,08796695 2,312033052 5,345496834
20 0,747 74,4 75,91600513 -1,51600513 2,298271555
21 0,744 90,2 75,88376229 14,31623771 204,9546622
22 0,740 84,0 75,84077183 8,159228165 66,57300425
23 0,721 83,7 75,63656718 8,063432824 65,0189489
24 0,701 59,2 75,4216149 -16,2216149 263,1407901 S2
25 0,545 67,5 73,74498718 -6,244987181 38,99986489 743,7878055

1) Находим наблюдаемое значение критерия

. По условию задачи
. Из таблицы значений
Фишера находим, что