Смекни!
smekni.com

Основы практического использования прикладного регрессионного анализа (стр. 4 из 4)

Различие между

и
объясняется действием различных ошибок.

Отметим, что

имеет случайный характер, оценки
и
распределены нормально с параметрами

,

.

Можно утверждать, что

. Другими словами y является состоятельной оценкой истинного значения
, соответствующего опыту
, т.е. при неограниченном числе опытов эмпирическая линия регрессии совпадает с действительной зависимостью


Составляя дробь Стьюдента, получаем:

.

Задавшись уровнем значимости

и найдя табличное значение
можно построить достоверный интервал для
в виде

.

1.4.4 Свойства доверительных интервалов

а) Доверительный интервал симметричен относительно выборочной оценки

;

б) Ширина доверительного интервала зависит от

и
;

в) Ширина доверительного интервала минимальна, если

, (ортогональны);

г) Ширина доверительного интервала равна бесконечности, если:

вектор-столбцы

и
в матрице наблюдений
коллинеарные, т.е.если:

д) В общем случае в регрессионных уравнениях доверительный интервал для отдельно взятого регрессионного коэффициента

определяется выражением


1.5 Адекватность модели

Существует соотношение, которое можно использовать для оценки адекватности модели, сравнивая

и
. Расчетное
определяется по формуле

(3.4)

Табличное значение

берется с таблиц с определенным числом степенем свобода и для притятого уровня значимості
.Если расчетное значение
більше
, то это значит, что дисперсияMSR статистически меньше дисперсии MSD относительно
,в этом случае полученное уравнение регрессии можно считать дееспособным.

2. ПРАКТИЧЕСКАЯ ЧАСТЬ

Поставлена следующая задача: построить зависимость количества выигранных голов от характеристик сыгранных игр на основе модели множественной регрессии.

На основе имеющейся выборки сделаем следующие оценки:

1) параметры модели βi(для данной модели существенными являются переменные WIN и DP):

2) оценки: множественный коэффициент корреляции R, R2 ,F, p, и StdErrorofestimate:


3) график для вычисленных значений и исходных:

К такому ряду можно применить модель линейной регрессии, так как он стационарный;

4) построение регрессии:


По графику видно, что в целом модель адекватна: практически все значения легли на линию регрессии;

5) гистограммы исходных и вычисленных значений имеют нормальное распределение:


ВЫВОД

Как показано выше, множественная регрессии применима в случае стационарности ряда и позволяет производить мониторинг результатов, основываясь на предикторах.

В общественных и естественных науках процедуры множественной регрессии чрезвычайно широко используются в исследованиях. В общем, множественная регрессия позволяет исследователю задать вопрос (и, вероятно, получить ответ) о том, "что является лучшим предиктором для...". Например, исследователь в области образования мог бы пожелать узнать, какие факторы являются лучшими предикторами успешной учебы в средней школе. А психолога мог быть заинтересовать вопрос, какие индивидуальные качества позволяют лучше предсказать степень социальной адаптации индивида. Социологи, вероятно, хотели бы найти те социальные индикаторы, которые лучше других предсказывают результат адаптации новой иммигрантской группы и степень ее слияния с обществом. Термин "множественная" указывает на наличие нескольких предикторов или регрессоров, которые используются в модели, следовательно такая модель увеличивает спектр анализа регрессоров, что позволит построить более точный прогноз.


ПЕРЕЧЕНЬ ССЫЛОК

1) Демиденко Е.З. Линейная и нелинейная регрессии. – М.: Финансы и статистика, 2010. – 302 с

2) Дрейпер Н., Смит Г. Прикладной регрессионный анализ. – М.: Статистика, 2009. - 437 с.

3) Афифи А., Эйзен С. Статистический анализ. Подход с использованием ЭВМ. Пер. с англ. – М.: Мир, 1982. – 488 с.

4) Тюрин Ю.Н.., Макаров А.А. Статистический анализ данных на компьютере.- М.:Инфра, 1997.-528с.

5) www.statsoft.ru

6) Ясницкий Л.Н. Введение в искусственный интеллект. М. Academia, 2005г.,176 стр.: ил.