Таблица 3.
Y | X1 | X2 | X3 | X4 | X5 | X6 | X7 | X8 | |
Y | 1 | ||||||||
X1 | -0,41056 | 1 | |||||||
X2 | -0,62049 | 0,817335 | 1 | ||||||
X3 | -0,14167 | 0,750202 | 0,304572 | 1 | |||||
X4 | 0,684791 | -0,31544 | -0,63666 | -0,13627 | 1 | ||||
X5 | 0,863179 | -0,39974 | -0,4795 | -0,21126 | 0,494364 | 1 | |||
X6 | 0,984045 | -0,36981 | -0,55741 | -0,09167 | 0,560132 | 0,89804 | 1 | ||
X7 | 0,719717 | -0,08272 | -0,45151 | 0,36154 | 0,360766 | 0,610648 | 0,762909 | 1 | |
X8 | 0,752448 | -0,40384 | -0,42926 | -0,26069 | 0,440197 | 0,978356 | 0,790727 | 0,493109 | 1 |
Из свойств корреляции известно, что если
> 0, то связь прямая ( ); если < 0, то связь обратная ). Факторы (Х1), (Х3), (Х2) имеют обратную связь с ицпу, то есть если индекс цен платных услуг растет, они падают, и наоборот. Факторы (Х4), (Х5), (Х6), (Х7), (Х8) имеют прямую связь с индексом цен платных услуг (вместе с ним растут или падают).Самая сильная связь наблюдается между индексом цен платных услуг и железнодорожным транспортом. Самая слабая связь наблюдается между обрабатывающим производством и производством и распределением электроэнергии, газа и воды.
При процедуре выбора факторов должны выполняться следующие условия:
Факторы должны быть количественно измеримы или допускать кодировку. В нашем случае это условие выполняется.
Факторы должны "объяснять" поведение изучаемого показателя согласно принятым положениям экономической теории. Это должно подтверждаться индексами корреляции факторов с показателями. Это условие тоже выполняется, так как для всех факторов индексы корреляции рассчитаны.
Факторы не должны находиться в точной функциональной связи (допустим, коллинеарной). Включение в модель факторов с индексами корреляции, близкими по модулю к единице может привести к нежелательным последствиям:
1) факторы будут дублировать друг друга, и будет затруднена экономическая интерпретация параметров модели;
2) система уравнений для определения параметров может оказаться плохо обусловленной и повлечь ненадежность полученных уравнений регрессии т нежелательность их использования для анализа и прогноза.
При наличии корреляции ≥0,7 между факторами один из них следует исключить. Оставить рекомендуется тот, который при достаточно тесной связи с показателем имеет более слабую связь с другими факторами.
Рассмотрим таблицу 3, используя метод исключения, отберем факторы для построения регрессионных моделей. Так как связь между факторами должна быть слабой, исключим все факторы, коэффициент корреляции которых больше или равен по модулю 0,3. Для построения модели оставляем факторы сильно или умеренно влияющие на данный показатель, то есть коэффициент корреляции должен быть больше или равен 0,3.
Следующее необходимое условие при построении регриссионных моделей: Число включаемых факторов должно в 6 раз меньше объема наблюдений, по которым строится регрессия. N-число наблюдений в нашем случае равно 12. Тогда m ≤
, то есть m=1 или m=2.Число параметров при факторах в линейной модели совпадают с их количеством: m=p.
Итак, можно предложить следующие регрессионные модели:
1.
2.
.3.
.Используя инструмент РЕГРЕССИЯ, оценим 1 модель.
1 этап. Оценка значимости модели в целом.
Таблица 4.
ВЫВОД ИТОГОВ | |||||
Регрессионная статистика | |||||
Множественный R | 0,985324602 | ||||
R-квадрат | 0,970864572 | ||||
Нормированный R-квадрат | 0,963580715 | ||||
Стандартная ошибка | 0,453164887 | ||||
Наблюдения | 11 | ||||
Дисперсионный анализ | |||||
df | SS | MS | F | Значимость F | |
Регрессия | 2 | 54,74441 | 27,3722 | 133,289901 | 0,00000072 |
Остаток | 8 | 1,642867 | 0, 205358 | ||
Итого | 10 | 56,38727 | |||
Модель линейной регрессии с двумя фактором Х1 и X6 значима в целом согласно F-критерию (F=133,2899) с приемлемым уровнем значимости 0,00000072 ≤ 0,05 Итак, получаем модель | |||||
Коэф-ты | Станд. ошибка | t-стат. | P-Значение | ||
Y-пересечение | 27,18887556 | 17,92439 | 1,516864 | 0,16777466 | |
Х1 | -0,1220023 | 0,146648 | -0,83194 | 0,42957614 | |
Х6 | 0,86279739 | 0,058131 | 14,84242 | 0,000000418 |
Согласно критерию Стьюдента 2 параметра модели a=27,18 и
=-0,122 незначимы с приемлемыми уровнями >0,05 и >0,05. Следовательно, эта модель неудачна и не может быть использована к анализу и прогнозу индекса цен платных услуг. Следует изменить спецификацию модели (необходимо убрать фактор Х1).Используя инструмент РЕГРЕССИЯ, оценим 2 модель.
1 этап. Оценка значимости модели в целом.
Таблица 5.
ВЫВОД ИТОГОВ | |||||
Регрессионная статистика | |||||
Множественный R | 0,984045 | ||||
R-квадрат | 0,968344 | ||||
Нормированный R-квадрат | 0,964827 | ||||
Стандартная ошибка | 0,445346 | ||||
Наблюдения | 11 | ||||
Дисперсионный анализ | |||||
df | SS | MS | F | Значимость F | |
Регрессия | 1 | 54,60227273 | 54,60227 | 275,3055768 | 0,0000000468 |
Остаток | 9 | 1,785 | 0, 198333 | ||
Итого | 10 | 56,38727273 | |||
Модель линейной регрессии с фактором X6 значима в целом согласно F-критерию (F=275,306) с приемлемым уровнем значимости 0,0000000468 ≤ 0,05 Итак, получаем модель 2 этап. Оценка параметров модели. | |||||
Коэф-ты | Станд. ошибка | t-стат. | P-Значение | ||
Y-пересечение | 12,98182 | 5,351909883 | 2,425642 | 0,038255004 | |
X6 | 0,880682 | 0,05307763 | 16,59233 | 0,0000000468 |
Согласно критерию Стьюдента 2 параметра модели a=12,98 и b=0,88 значимы с приемлемыми уровнями
<0,05 и <0,05.3 этап. Проверка наличия необходимых свойств у остатка модели.
Таблица 6.
ВЫВОД ОСТАТКА | |||
Наблюдение | Предсказанное Y | Остатки | Стандартные остатки |
1 | 101,05 | -0,05 | -0,118345267 |
2 | 101,05 | -0,45 | -1,065107404 |
3 | 101,05 | 0,15 | 0,355035801 |
4 | 101,05 | -0,25 | -0,591726335 |
5 | 101,05 | -0,05 | -0,118345267 |
6 | 108,8 | 0,00000000000132 | 0,000000000003128 |
7 | 101,05 | 1,15 | 2,721941143 |
8 | 101,05 | 0,15 | 0,355035801 |
9 | 101,05 | -0,25 | -0,591726335 |
10 | 101,05 | -0,25 | -0,591726335 |
11 | 101,05 | -0,15 | -0,355035801 |
График 1.
Проверяем случайность остатков Первое, что требуется, это чтобы график остатков располагался в горизонтальной полосе, симметричной относительно оси абсцисс. Согласно предпосылкам МНК возмущение должно быть случайной величиной с нулевым математическим ожиданием. Это имеет место для получения однофакторной регрессии. График остатка (возмущения, ошибки) располагается в горизонтальной полосе. Имеется большое количество локальных экстремумов (максимумов и минимумов).
-значит остатки случайные.