Смекни!
smekni.com

Порушення основних припущень лінійного регресійного аналізу (стр. 11 из 16)

3) залишки

, „ідеальної” моделі некорельовані;

4) залишки

„ідеальної” моделі нормально розподілені випадкові величини з параметрами
;

5) дисперсія залишків

„ідеальної” моделі величина постійна.

2.2 Модель лінійної регресії, в якій дисперсія спостережень

величина змінна

Нехай

– незалежні нормально розподілені випадкові величини з середніми
, лінійними за параметрами
та дисперсією
, що змінюється від спостереження до спостереження.

Параметри

невідомі,
– відомі невипадкові величини.

За спостереженнями

, які описуються моделлю

, (2.2.1)

необхідно оцінити невідомі параметри

, перевірити адекватність лінійної моделі (2.2.1), значущість лінійної регресії
, а також з’ясувати, чи виконуються основні припущення
лінійного регресійного аналізу.

Стохастичний експеримент. Проведемо стохастичний експеримент, який полягає в моделюванні вибірок з нормальних розподілів з середніми, що дорівнюють сумі координат точок квадрата, і змінними дисперсіями:

Проста лінійна регресія. Знайдемо МНК – оцінки параметрів

та перевіримо гіпотези про адекватність та значущість лінійної моделі регресії. Також з’ясуємо, чи виконуються припущення
в цій моделі.

Результати стохастичного експерименту, за умов, що змінна

, наведено на рисунку 2.2.1.

Рис. 2.2.1. Модель простої лінійної регресії, в якій дисперсія спостережень
величина змінна

Результати перевірки адекватності та значущості цієї моделі простої лінійної регресії наведено в таблиці 2.2.1.

Таблиця 2.2.1. Результати перевірки адекватності та значущості моделі простої лінійної регресії, в якій дисперсія спостережень

величина змінна

Джерело варіації SS df MS F
Обумовлена регресією 124615,2 1 124615,2 166,26
Відносно регресії 478200,8 638 749,5
Відносно середнього 602816 639
Неадекватність 3025,8 6 504,3 0,67
"Чиста помилка" 475175 632 751,9

F1 = 0,67 < 2,11 = F0,05;6;632, лінійна модель адекватна.

F2 = 166,26 > 3,86 = F0,05;1;638, регресія

значуща.

|t1| = 0,04 < 1,96 = t0,025;638, гіпотеза

не відхиляється.

|t2| = 0,38 < 1,96 = t0,025;638, гіпотеза

не відхиляється.

Перевіримо припущення про некорельованість залишків

за допомогою критерію Дарбіна-Уотсона. Статистика критерію
. Оскільки
, то залишки
цієї моделі некорельовані.

Рис. 2.2.2. Графік залишків – дисперсія змінюється

Гіпотезу про нормальний розподіл залишків

перевіримо за допомогою критерію
.

Рис.2.2.3. Нормальний розподіл залишків

Статистика

,тому залишки
не можна вважати нормально розподіленими.

Статистика Бартлетта

, тому дисперсія залишків
змінна величина.

Отже,

1) лінійна модель адекватна;

2) регресія

значуща (гіпотеза
не відхиляється; гіпотеза
відхиляється, а гіпотеза
не відхиляється);

3) залишки

некорельовані;

4) залишки

не можна вважати нормально розподіленими;

5) дисперсія залишків

змінна величина.

Лінійна регресія з двома незалежними змінними. Знайдемо МНК – оцінки параметрів

та перевіримо гіпотези про адекватність та значущість лінійної моделі регресії. Також з’ясуємо, чи виконуються припущення
в цій моделі.

Результати стохастичного експерименту, за умов, що незалежні змінні

обрані згідно з рис. 2.1.1, наведено на рисунку 2.2.4.

Рис. 2.2.4. Модель лінійної регресії, в якій дисперсія спостережень
величина змінна

Результати перевірки адекватності та значущості цієї моделі лінійної регресії наведено в таблиці 2.2.2.

Таблиця 2.2.2. Результати перевірки адекватності та значущості моделі лінійної регресії, в якій дисперсія спостережень

величина змінна

Джерело варіації SS df MS F
Обумовлена регресією 209188,2 2 104594,1 132,29
Відносно регресії 503614,7 637 790,6
Відносно середнього 712802,9 639
Неадекватність 32906,7 61 539,5 0,66
"Чиста помилка" 470708,0 576 817,2

F1 = 0,66 < 1,34= F0,05;61;576, лінійна модель адекватна.

F2 = 132,29 > 3,01= F0,05;2;637, регресія

значуща.

|t1| = 1,09 < 1,96 = t0,025;637, гіпотеза

не відхиляється.

|t2| = 1,88 < 1,96 = t0,025;637, гіпотеза

не відхиляється.

|t3| = 0,38 < 1,96 = t0,025;637, гіпотеза

не відхиляється.

Перевіримо припущення про некорельованість залишків

за допомогою критерію Дарбіна-Уотсона. Статистика критерію
. Оскільки
, то залишки
цієї моделі некорельовані.