Смекни!
smekni.com

Анализ данных в линейной регрессионной модели (стр. 2 из 3)

Используя соотношение

, вычислим остаточную сумму

;

;

;

.

;

Тогда оценка дисперсии ошибок наблюдений равна

.

Коэффициент детерминации равен

.

Поскольку

(знак
)
, то сделаем проверку правильности расчетов:

(верно).

Полученный результат для коэффициента детерминации означает, что уравнение регрессии

на 49,7% объясняет общий разброс результатов наблюдений относительно горизонтальной прямой
.

Построим доверительные интервалы для параметров линейной регрессии и дисперсии ошибок наблюдений.

С помощью Matlab найдем квантили распределений Стьюдента и

:

,
,
;

– доверительный интервал для параметра

:

;

;

– доверительный интервал для параметра

:

;

;

– доверительный интервал для дисперсии ошибок наблюдений

:

;

.

-Найдем границы доверительных интервалов для среднего значения

при
:

;

.

Задание 7. Для негруппированных данных проверить значимость линейной регрессии Y на x (уровень значимости α = 0,05).

Гипотеза

:
отклоняется на уровне значимости
, так как доверительный интервал
не накрывает нуль с доверительной вероятностью 0,95.

Этот же результат можно получить, используя для проверки гипотезу

:
и статистику
.

С помощью Matlab найдем квантили распределения Фишера:

,
.

Выборочное значение статистики

равно:

.

Поскольку

, то гипотеза
:
отклоняется на уровне значимости
. Таким образом, линейная регрессия
на
статистически значима.

Задание №8

Для данных, сгруппированных только по

, проверить адекватность линейной регрессии
на
(уровень значимости
).

Для проверки адекватности воспользуемся корреляционной таблицей. Будем считать, что середины интервалов группировки

,
, являются значениями компоненты
. Тогда число
повторных наблюдений равно 4. Запишем результаты этих наблюдений в виде таблицы

Таблица 1.2

2,5 5,5 8,5 11,5
11,94 12,34 14,68 9,87 11,52 9,71 14,61 9,66 11,19 8,54 10,73 10,13 5,38 9,19 8,09 16,35 7,70 7,41 10,51 9,97 9,87 4,39 6,48 7,77 4,76 3,72 14,32 10,64 5,79 9,13 10,33 7,15 5,64 4,52 4,52 3,57 3,14 4,05 2,22 3,57 4,95 -2,23 4,52 2,06 3,11 2,88 4,58 6,78 2,15 3,87
13 17 12 8
10,79 8,59 9,65 3,74

Для удобства расчетов в последней строке таблицы приведены средние значения

,
.

.

Получим уравнение выборочной линейной регрессии

на
для данных, сгруппированных по
:

;

,
,
,
,
;

y(x) = 8,29 – 0,9x.

;

.

Выборочное значение статистики

равно

.

Так как квантиль распределения Фишера, вычисленный с помощью Matlab, равен

3,19,

то

, а значит, линейная регрессия
на
для данных, сгруппированных по
, адекватна результатам наблюдений.