Основы практического использования прикладного регрессионного анализа (стр. 2 из 4)

Приведем свойства и предпосылки регрессионной ошибки:

а) Свойства регрессионной ошибки:

1) В каждом опыте

имеет нормальный закон распределения;

2) В каждом опыте математическое ожидание

равно нулю;

3) Во всех опытах дисперсия

постоянна и одинакова;

4) Во всех опытах ошибки

независимы.

б) предпосылки регрессионной ошибки:

1). Матрица наблюдений

имеет полный ранг;

2). Структура модели адекватна истинной зависимости;

3). Значения случайной ошибки

не зависят от значений регрессоров

;

4). Ошибки регистрации

регрессоров пренебрежимо малы по сравнению со случайной ошибкой

1.2 Проверка предпосылок и предположений регрессионного анализа

Регрессионный анализ является одним из самых распространённых методов обработки результатов наблюдений. Он служит основой для целого ряда разделов математической статистики и методов обработки данных. Регрессионный анализ базируется на ряде предположений и предпосылок, нарушение которых приводит к некорректному его использованию и ошибочной интерпретации результатов.

Если F-критерий и показал, что подгонка модели в целом является удовлетворительной; целесообразно провести анализ остатков для проверки соблюдений предпосылок и предположений.

В этом случае исследуется набор отклонений между экспериментальными и предсказанными значениями зависимой переменной,

Проверка предпосылок и предположений регрессионного анализа включает в себя следующие задачи:

1) оценка случайности зависимой переменной;

2) оценка стационарности и эргодичности зависимых и независимых переменных;

3) Проверка гипотезы о нормальности распределения ошибок E;

4) Обнаружение выбросов;

5) Проверка постоянства математического ожидания и дисперсии ошибок;

6) Оценка коррелированности остатков;

7) Обнаружение мультиколлинеарности.

1.2.1 Проверка случайности

Построение моделей методом множественного регрессионного анализа требуется выполнение предположения случайности

в нормальной линейной модели вида

где

– вектор наблюдений зависимой переменной;

– матрица наблюдений независимых переменных;

– вектор неизвестных коэффициентов;

– вектор ошибок.

Задача проверки случайности может быть разбита на 2 подзадачи:

1) проверка случайности собственной величины Y;

2) проверка случайности выборки, то есть допущения об отсутствии существенного смещения средней величины во времени.

Первая подзадача решается с использованием критерия серий. Для этой цели последовательность наблюдений величины Y представляют последовательностью нулей и единиц, где единицей обозначают значение, превышающее среднее или медиану, и нулем, собственно, значение меньшее медианы. После обозначения вектор наблюдений преобразуется в последовательность серий

где

– количество подряд идущих элементов одного вида, i – номер серии.

Доказано, что при

распределение величины r близится к нормальному с характеристиками

Тогда с вероятностью 0,954 теоретическое число серий r будет находиться в пределах

Если фактическое значение

попадает в указанные пределы, то Y можно считать случайной величиной.

Серией называется последовательность наблюдаемых значений, перед которыми и после которых расположены наблюдаемые значения другой категории. Если последовательность N наблюдений представляет собой независимые наблюденные значения одной и той же случайной величины, т.е. вероятность знаков (+) и (–) не меняется от одного наблюдения к другому, то выборочное распределение числа серий в последовательности есть случайная величина r со средним значением

(3.1)

и дисперсией

(3.2)

Здесь

– число наблюдений со знаком (+),

– число наблюдений со знаком (–).

Когда

соотношения (3.1) и (3.2) принимают вид

Для решения второй подзадачи используется метод последовательных разностей. Элементы исследуемой выборки

располагаются в порядке получения наблюдений и для них вычисляются выборочные среднее и дисперсия

Определяют разности

между соседними наблюдениями

и математическое ожидание квадрата разности

где

– оценка генеральной дисперсии.

Фактическая величина критерия случайности выборки

Теоретическое значение критерия

При

для конкретного N гипотеза случайности отвергается.

1.2.2 Проверка стационарности

Анализ случайных процессов может производиться осреднением величин по ансамблю выборочных реализаций или по одной реализации.

Поскольку на практике проверка по ансамблю достаточно длинных выборочных реализаций неосуществима, то для использования тестов проверки стационарности процесса принимается ряд допущений:

а) проверка заключается в исследовании поведения не ансамбля, а его отдельных реализаций; это означает, что доказательство внутренней стационарности отдельных реализаций может служить доказательством стационарности случайного процесса, которому принадлежит эта реализация;

б) для большинства процессов достаточно проверить слабую стационарность, поскольку, во-первых, для эффективного использования спектрального и корреляционного анализа случайных процессов достаточно выполнения условия слабой стационарности, а во-вторых, для реальных процессов обычно слабая стационарность влечет за собой и строгую; если процесс определяется нормальной плотностью, то это доказательство осуществляется автоматически, поскольку все моменты высших порядков полностью определяются средним и автокорреляционной функцией;