Смекни!
smekni.com

Основы практического использования прикладного регрессионного анализа (стр. 1 из 4)

СОДЕРЖАНИЕ

Содержание

Введение

1. Теоретическая часть

1.1 Теоретические основы прикладного регрессионного анализа

1.2 Проверка предпосылок и предположений регрессионного анализа

1.2.1 Проверка случайности

1.2.2 Проверка стационарности

1.3 Обнаружение выбросов в выборке

1.4 Мультиколлинеарность переменных

1.4.1 Рекомендации по устранению мультиколлинеарности

1.4.2 Доверительные интервалы для уравнения регрессии

1.4.3 Определение доверительного интервала для истинного значения уравнения регрессии

1.4.4 Свойства доверительных интервалов

1.5 Адекватность модели

2. Практическая часть

Вывод

Список литературы


ВВЕДЕНИЕ

Общее назначение множественной регрессии (этот термин был впервые использован в работе Пирсона - Pearson, 1908) состоит в анализе связи между несколькими независимыми переменными (называемыми также регрессорами или предикторами) и зависимой переменной. Например, агент по продаже недвижимости мог бы вносить в каждый элемент реестра размер дома (в квадратных футах), число спален, средний доход населения в этом районе в соответствии с данными переписи и субъективную оценку привлекательности дома. Как только эта информация собрана для различных домов, было бы интересно посмотреть, связаны ли и каким образом эти характеристики дома с ценой, по которой он был продан. Например, могло бы оказаться, что число спальных комнат является лучшим предсказывающим фактором (предиктором) для цены продажи дома в некотором специфическом районе, чем "привлекательность" дома (субъективная оценка). Могли бы также обнаружиться и "выбросы", т.е. дома, которые могли бы быть проданы дороже, учитывая их расположение и характеристики.

Специалисты по кадрам обычно используют процедуры множественной регрессии для определения вознаграждения адекватного выполненной работе.

Как только эта так называемая линия регрессии определена, аналитик оказывается в состоянии построить график ожидаемой (предсказанной) оплаты труда и реальных обязательств компании по выплате жалования. Таким образом, аналитик может определить, какие позиции недооценены (лежат ниже линии регрессии), какие оплачиваются слишком высоко (лежат выше линии регрессии), а какие оплачены адекватно.


1. ТЕОРЕТИЧЕСКАЯ ЧАСТЬ

1.1 Теоретические основы прикладного регрессионного анализа

Регрессионный анализ применяется для построения математических зависимостей объектов, явлений по результатам экспериментальных данных, полученных на основе проведения активного или пассивного экспериментов.

Предполагается, что математическая зависимость относится к определенному классу функций с несколькими неизвестными параметрами. В общем виде эти функции представим в виде:

,

где

- вектор зависимой (выходной) переменной размерностью
;

- матрица независимых (входных) переменных размерностью
;

- вектор неизвестных параметров размерностью
;

- вектор возмущений размерностью
;

- количество независимых переменных;

- количество экспериментальных данных;

- класс функциональных зависимостей.

В зависимости

– является случайной величиной, значения
могут рассматриваться либо как фиксированные, либо как случайные. При этом ожидаемое значение одной случайной переменной соотносится с наблюдаемыми значениями других случайных переменных в виде условной регрессии.

Рассмотрим зависимость между случайными величинами

и
, представленную в виде некоторой таблицы наблюдений значений
и
.

Перенося табличные значения

и
на плоскость
, получаем поле корреляции, приведенное на рисунке 3.1

Рисунок 1.1 — Экспериментальное уравнение регрессии

Разобьем диапазон изменения

на
-равных интервалах
. Все точки, попавшие в интервал
, отнесем к середине интервала
, в результате получаем трансформированное поле корреляции.

Определим частичные средние арифметические

для каждого значения
:

,

где

- число точек, оказавшихся в интервале
, причем
, где

- общее число наблюдений.

Соединим последовательно точки с координатами

и
отрезками прямых. Полученная ломаная линия называется эмпирической линией регрессии
по
; она показывает, как в среднем меняется
с изменением
. Предельное положение эмпирической линии регрессии, к которому она стремится при неограниченном увеличении числа наблюдений и одновременном уменьшении
, называется предельной теоретической линией регрессии. Ее нахождение и составляет основную задачу регрессионного анализа. Отметим, что по линии регрессии невозможно точно определить значение
по
в одном опыте. Однако зависимость
позволяет определить в среднем значение
при многократном повторении опыта при фиксированном значении
. В регрессионном анализе рассматривается связь между одной переменной, называемой зависимой, и несколькими другими, называемыми независимыми. Эта связь представляется в виде математической модели, т.е. в виде функции регрессии. Если функция линейна относительно параметров, но не обязательно линейна относительно независимых переменных, то говорят о линейной модели. В противном случае нелинейная. Статистическими проблемами обработки в регрессионном анализе являются:

а) Получение наилучших точечных и интервальных оценок неизвестных параметров регрессионного анализа;

б) Проверка гипотез относительно этих параметров;

в) Проверка адекватности;

г) Проверка множества предполагаемых предположений.

Исследуемый объект представлен на рисунке 3.2

Рисунок 1.2 — Вид исследуемого объекта

Для корректного использования регрессионного анализа существует следующие предпосылки и следующие допущения на свойства регрессионной ошибки

,
;
- значение зависимой переменной, полученное подстановкой
в уравнение
,
,
;
- количество экспериментальных данных,
- количество независимых переменных: