Таким образом, при дополнительном включении в регрессию еще одного фактора коэффициент детерминации должен возрастать, а остаточная дисперсия уменьшаться. Если этого не происходит и данные показатели практически недостаточно значимо отличаются друг от друга, то включаемый в анализ дополнительный фактор не улучшает модель и практически является лишним фактором.
Если модель насыщается такими лишними факторами, то не только не снижается величина остаточной дисперсии и не увеличивается показатель детерминации, но, более того, снижается статистическая значимость параметров регрессии по критерию Стьюдента вплоть до статистической незначимости.
2) Для статистической оценки значимости коэффициентов регрессии (
Проверяется нулевая гипотеза
Для проверки нулевой гипотезы необходимо знать величину наблюдаемых значений критерия
Таблица №9
t-статистика | P-Значение |
-1,127971079 | 0,28850322 |
2,838964459 | 0,01943598 |
1,130728736 | 0,28740002 |
В этой же таблице находим границы доверительных интервалов для каждого из параметров:
Нижние 95% | Верхние 95% |
-5,313097658 | 1,777526094 |
0,047297697 | 0,418287538 |
-0,249694323 | 0,748774142 |
3. Значения парных коэффициентов корреляции найдем из соответствующей матрицы.
Таблица №10 Корреляционная матрица
y | x1 | x2 | |
y | 1 | ||
x1 | 0,784786247 | 1 | |
x2 | 0,60206001 | 0,531178469 | 1 |
По величине парных коэффициентов корреляции может обнаруживаться лишь явная коллинеарность факторов. Наибольшие трудности в использовании аппарата множественной регрессии возникают при наличии мультиколлинеарности факторов, когда более чем два фактора связаны между собой линейной зависимостью, т.е. имеет место совокупное воздействие факторов друг на друга.
Наличие мультиколлинеарности факторов может означать, что некоторые факторы будут всегда действовать в унисон. В результате вариация в исходных данных перестает быть полностью независимой и нельзя оценить воздействие каждого фактора в отдельности. Чем сильнее мультиколлинеарность факторов, тем менее надежна оценка распределения суммы объясненной вариации по отдельным факторам с помощью метода наименьших квадратов (МНК).
Частные коэффициенты корреляции найдем по формулам
их значения показывают, что при отсутствии влияния других факторов, связь с рассматриваемым фактором усиливается т.е. мультиколлинеарность между ними существует.
4. Рассчитаем прогнозное значение результата, если прогнозные значения факторов составляют 110% их максимального значения. Найдем прогнозные значения факторов и подставим их в полученное уравнение регрессии.
По условию прогнозные значения составляют 110% их максимального значения.
Таблица №11
maxX1 | maxX2 |
28 | 10 |
Далее вычисляем прогнозные значения факторов:
Таблица №12
Стандартная ошибка | 1,104878833 |
матрица значений факторных переменных
Фактор
Максимальную ошибку прогноза
Используя данные, представленные в таблице проверить наличие гетероскедастичности, применяя тест Голдфельда-Квандта.
Таблица№13. Данные
Страна | Индекс человеческого развития, У | Расходы на конечное потребление в текущих ценах, % к ВВП, Х |
Австрия | 0,904 | 75,5 |
Австралия | 0,922 | 78,5 |
Англия | 0,918 | 84,4 |
Белоруссия | 0,763 | 78,4 |
Бельгия | 0,923 | 77,7 |
Германия | 0,906 | 75,9 |
Дания | 0,905 | 76,0 |
Индия | 0,545 | 67,5 |
Испания | 0,894 | 78,2 |
Италия | 0,900 | 78,1 |
Канада | 0,932 | 78,6 |
Казахстан | 0,740 | 84,0 |
Китай | 0,701 | 59,2 |
Латвия | 0,744 | 90,2 |
Нидерланды | 0,921 | 72,8 |
Норвегия | 0,927 | 67,7 |
Польша | 0,802 | 82,6 |
Россия | 0,747 | 74,4 |
США | 0,927 | 83,3 |
Украина | 0,721 | 83,7 |
Финляндия | 0,913 | 73,8 |
Франция | 0,918 | 79,2 |
Чехия | 0,833 | 71,5 |
Швейцария | 0,914 | 75,3 |
Швеция | 0,923 | 79,0 |
1) Найдем параметры линейного уравнения множественной регрессии и значения остатков.
Определим остаточные суммы квадратов
Таблица№14
№ | Y | X | Yp | ei | (ei) ^2 | |
1 | 0,932 | 78,6 | 77,90431365 | 0,695686352 | 0,483979501 | |
2 | 0,927 | 67,7 | 77,85057558 | -10,15057558 | 103,0341846 | |
3 | 0,927 | 83,3 | 77,85057558 | 5,44942442 | 29,69622651 | |
4 | 0,923 | 77,7 | 77,80758513 | -0,107585125 | 0,011574559 | |
5 | 0,923 | 79,0 | 77,80758513 | 1, 192414875 | 1,421853234 | |
6 | 0,922 | 78,5 | 77,79683751 | 0,703162488 | 0,494437485 | |
7 | 0,921 | 72,8 | 77,7860899 | -4,986089898 | 24,86109247 | |
8 | 0,918 | 84,4 | 77,75384706 | 6,646152943 | 44,17134894 | S1 |
9 | 0,918 | 79,2 | 77,75384706 | 1,446152943 | 2,091358334 | 206,2660556 |
10 | 0,914 | 75,3 | 77,7108566 | -2,410856603 | 5,812229559 | |
11 | 0,913 | 73,8 | 77,70010899 | -3,900108989 | 15,21085013 | |
12 | 0,906 | 75,9 | 77,62487569 | -1,724875694 | 2,975196159 | |
13 | 0,905 | 76,0 | 77,61412808 | -1,61412808 | 2,60540946 | |
14 | 0,904 | 75,5 | 77,60338047 | -2,103380467 | 4,424209388 | |
15 | 0,900 | 78,1 | 77,56039001 | 0,539609988 | 0,291178939 | |
16 | 0,894 | 78,2 | 77,49590433 | 0,704095669 | 0,495750712 | |
17 | 0,833 | 71,5 | 76,8402999 | -5,3402999 | 28,51880303 | |
18 | 0,802 | 82,6 | 76,50712388 | 6,092876121 | 37,12313943 | |
19 | 0,763 | 78,4 | 76,08796695 | 2,312033052 | 5,345496834 | |
20 | 0,747 | 74,4 | 75,91600513 | -1,51600513 | 2,298271555 | |
21 | 0,744 | 90,2 | 75,88376229 | 14,31623771 | 204,9546622 | |
22 | 0,740 | 84,0 | 75,84077183 | 8,159228165 | 66,57300425 | |
23 | 0,721 | 83,7 | 75,63656718 | 8,063432824 | 65,0189489 | |
24 | 0,701 | 59,2 | 75,4216149 | -16,2216149 | 263,1407901 | S2 |
25 | 0,545 | 67,5 | 73,74498718 | -6,244987181 | 38,99986489 | 743,7878055 |
1) Находим наблюдаемое значение критерия