Приведем свойства и предпосылки регрессионной ошибки:
а) Свойства регрессионной ошибки:
1) В каждом опыте
2) В каждом опыте математическое ожидание
3) Во всех опытах дисперсия
4) Во всех опытах ошибки
б) предпосылки регрессионной ошибки:
1). Матрица наблюдений
2). Структура модели адекватна истинной зависимости;
3). Значения случайной ошибки
4). Ошибки регистрации
1.2 Проверка предпосылок и предположений регрессионного анализа
Регрессионный анализ является одним из самых распространённых методов обработки результатов наблюдений. Он служит основой для целого ряда разделов математической статистики и методов обработки данных. Регрессионный анализ базируется на ряде предположений и предпосылок, нарушение которых приводит к некорректному его использованию и ошибочной интерпретации результатов.
Если F-критерий и показал, что подгонка модели в целом является удовлетворительной; целесообразно провести анализ остатков для проверки соблюдений предпосылок и предположений.
В этом случае исследуется набор отклонений между экспериментальными и предсказанными значениями зависимой переменной,
Проверка предпосылок и предположений регрессионного анализа включает в себя следующие задачи:
1) оценка случайности зависимой переменной;
2) оценка стационарности и эргодичности зависимых и независимых переменных;
3) Проверка гипотезы о нормальности распределения ошибок E;
4) Обнаружение выбросов;
5) Проверка постоянства математического ожидания и дисперсии ошибок;
6) Оценка коррелированности остатков;
7) Обнаружение мультиколлинеарности.
1.2.1 Проверка случайности
Построение моделей методом множественного регрессионного анализа требуется выполнение предположения случайности
где
Задача проверки случайности может быть разбита на 2 подзадачи:
1) проверка случайности собственной величины Y;
2) проверка случайности выборки, то есть допущения об отсутствии существенного смещения средней величины во времени.
Первая подзадача решается с использованием критерия серий. Для этой цели последовательность наблюдений величины Y представляют последовательностью нулей и единиц, где единицей обозначают значение, превышающее среднее или медиану, и нулем, собственно, значение меньшее медианы. После обозначения вектор наблюдений преобразуется в последовательность серий
Доказано, что при
Тогда с вероятностью 0,954 теоретическое число серий r будет находиться в пределах
Если фактическое значение
Серией называется последовательность наблюдаемых значений, перед которыми и после которых расположены наблюдаемые значения другой категории. Если последовательность N наблюдений представляет собой независимые наблюденные значения одной и той же случайной величины, т.е. вероятность знаков (+) и (–) не меняется от одного наблюдения к другому, то выборочное распределение числа серий в последовательности есть случайная величина r со средним значением
и дисперсией
Здесь
Когда
Для решения второй подзадачи используется метод последовательных разностей. Элементы исследуемой выборки
Определяют разности
и математическое ожидание квадрата разности
где
Фактическая величина критерия случайности выборки
Теоретическое значение критерия
При
1.2.2 Проверка стационарности
Анализ случайных процессов может производиться осреднением величин по ансамблю выборочных реализаций или по одной реализации.
Поскольку на практике проверка по ансамблю достаточно длинных выборочных реализаций неосуществима, то для использования тестов проверки стационарности процесса принимается ряд допущений:
а) проверка заключается в исследовании поведения не ансамбля, а его отдельных реализаций; это означает, что доказательство внутренней стационарности отдельных реализаций может служить доказательством стационарности случайного процесса, которому принадлежит эта реализация;
б) для большинства процессов достаточно проверить слабую стационарность, поскольку, во-первых, для эффективного использования спектрального и корреляционного анализа случайных процессов достаточно выполнения условия слабой стационарности, а во-вторых, для реальных процессов обычно слабая стационарность влечет за собой и строгую; если процесс определяется нормальной плотностью, то это доказательство осуществляется автоматически, поскольку все моменты высших порядков полностью определяются средним и автокорреляционной функцией;