Смекни!
smekni.com

Порушення основних припущень лінійного регресійного аналізу (стр. 12 из 16)

Рис. 2.2.5. Графік залишків – смуга постійної ширини


Гіпотезу про нормальний розподіл залишків

перевіримо за допомогою критерію
.

Рис. 2.2.6. Нормальний розподіл залишків

Статистика

,тому залишки
не можна вважати нормально розподіленими.

Статистика Бартлетта

, тому дисперсія залишків
змінна величина.

Отже,

1) лінійна модель адекватна;

2) регресія

значуща (гіпотеза
не відхиляється; гіпотеза
відхиляється, гіпотеза
не відхиляється, гіпотеза
не відхиляється);

3) залишки

некорельовані;

4) залишки

не можна вважати нормально розподіленими;

5) дисперсія залишків

змінна величина.

2.3 Модель лінійної регресії, в якій спостереження

величини залежні

Нехай

– залежні нормально розподілені випадкові величини з однаковою дисперсією
та середніми
, лінійними за параметрами
.

Параметри

невідомі,
– відомі невипадкові величини.

За спостереженнями

, які описуються моделлю

, (2.3.1)

необхідно оцінити невідомі параметри

, перевірити адекватність лінійної моделі (2.3.1), значущість лінійної регресії
, а також з’ясувати, чи виконуються основні припущення
лінійного регресійного аналізу.

Стохастичний експеримент. Проведемо стохастичний експеримент, який полягає в моделюванні вибірки

з нормального розподілу з параметрами 0 та 1.

Наступні 7 вибірок рахуються за формулою

,

де сталі

– елементи послідовності Фібоначчі, а саме:
.

Проста лінійна регресія. Знайдемо МНК – оцінки параметрів

та перевіримо гіпотези про адекватність та значущість лінійної моделі регресії. Також з’ясуємо, чи виконуються припущення
в цій моделі.

Результати стохастичного експерименту, за умов, що

, наведено на рисунку 2.3.1.

Рис. 2.3.1. Модель лінійної регресії, в якій спостереження
величини залежні

Результати перевірки адекватності та значущості цієї моделі простої лінійної регресії наведено в таблиці 2.3.1.

Таблиця 2.3.1. Результати перевірки адекватності та значущості моделі простої лінійної регресії, в якій спостереження

величини залежні

Джерело варіації SS df MS F
Обумовлена регресією 0,97 1 0,97 0,03
Відносно регресії 22892,15 638 35,88
Відносно середнього 22893,13 639
Неадекватність 9,81 6 1,64 0,05
"Чиста помилка" 22893,13 632 36,21

F1 = 0,05 < 2,11 = F0,05;6;632, лінійна модель адекватна.

F2 = 0,03 < 3,86 = F0,05;1;638, регресія

незначуща.

|t1| = 0,29 < 1,96 = t0,025;638, гіпотеза

не відхиляється.

|t2| = 100 > 1,96 = t0,025;638, гіпотеза

відхиляється.

Рис. 2.3.2. Графік залишків – дисперсія змінюється


Гіпотезу про нормальний розподіл залишків

перевіримо за допомогою критерію
.

Рис.2.3.3. Нормальний розподіл залишків

Статистика

,тому залишки
не можна вважати нормально розподіленими.

Статистика Бартлетта

, тому дисперсія залишків
змінна величина.

Отже,

1) лінійна модель адекватна;

2) регресія

незначуща (гіпотеза
не відхиляється; гіпотеза
не відхиляється, а гіпотеза
відхиляється);

3) залишки

некорельовані;

4) залишки

не можна вважати нормально розподіленими;

5) дисперсія залишків

змінна величина.

Лінійна регресія з двома незалежними змінними. Знайдемо МНК – оцінки параметрів

та перевіримо гіпотези про адекватність та значущість лінійної моделі регресії. Також з’ясуємо, чи виконуються припущення
в цій моделі.

Результати стохастичного експерименту, за умов, що незалежні змінні

обрані згідно з рис. 2.1.1, наведено на рисунку 2.3.4.

Рис. 2.3.4. Модель лінійної регресії, в якій спостереження
величини залежні

Результати перевірки адекватності та значущості цієї моделі лінійної регресії наведено в таблиці 2.3.2.