В этом выр-ии заменяем σ² несмещенной оценкой по эмпир ур-ию регр-ии σ²=∑ei²/n-2 и тогда мы м рассчитать Т стат-ку
, получаемого из значения теорет дисп-ии заменой дисп теорет откл-ия σ² на So², вычис-ое по выборке ∑ei²/n-2. А тогда мы м, используя табл Стьюдента, выч-ть вер-ть того, что |T|≤tрасчТогда
ν=n-2.И м посчитать, сделав такие же преобр-ия как для коэф-в ур-ия, что мат ожидание нах-ся в инт-ле:
2). Предсказание индив знач-ий завис перем-й.
Предположим, что нас интер-т нек-ое конкр-е знач-ие вел-ны завис-й перем-й yo. При ее сопост-ии со знач-м, кот-ое м.б. рассч-но по ур-ию регре-ии.
Мы знаем, что yo б норм распр-но с пар-ми ỹ~N(βo+β1xпр;σ²). Одновр-но с этим
с таким же ср и дисп-ей, рассч-й для ỹпр.Построим нов перем-ую U= ỹo- ỹпр и нас б интер-ть поведение такой случ вел-ны.
М(ỹо- ỹпр)= М(ỹо)-М(ỹпр)=0
D(ỹо- ỹпр)= D(ỹо)+D(ỹпр)=>
Каждую из кот-ых мы м оценить, используя выбор значения.
=>S²(ỹj-ỹпр)= S²(ỹо)+S²(ỹпр)
Каждая из них нам изв-на. Первая вел-на оцен-ся
Т.о. мы м расч-ть стандарт ее откл-ия в рез-те чего получили Трасч данной случ вел-ны.
Проверка общего кач-ва ур-ия регрессии. Коэф-т детерминации R².
Расчет ур-ие регр-ии всегда проходит так, что не все точки выборки принадлежат этой прямой. Обычно оно лишь частично объясняет поведение точек выборки. Сущ-т диаграмма Венна, позволяющая интерпретир-ть ур-нь этой оценки.
5 графиков:
На счеме 1 х никак не влияет на поведение У. 2;3;4 пок-т все усиливающееся влияние объясняющей перем-й на объясняемую. На 5 ф-р х полностью объясняет поведение У.
Суммарной мерой общего кач-ва ур-ия регр-ии яв-ся коэф-т детерминации R².
Поясним его смысл и покажем методику вычисления.
Предпол-м, что мы рассч-ли эмпир ур-ие рер-ии ỹ=bo+b1x. Тогда yi=ỹ+ei.
Рассм-м вел-ну откл-ия точек выборки завис-й перем-й от их ср вел-ны.
Преобразуем эту разность прибавив и отняв от нее соответ-е знач-ие, рассчит-е по ур-ию регр-ии.Тогда 2 слогаемое – та часть, кот-ая не объяснена в этом откл-ие ур-ем регр-ии, а 1 это часть объясненная ур-ем регр-ии. Получ выр-ие возведем в квадрат.
и просуммир-м по всем знач-м i.Рассм-м сред слогаемое
Мы получили знач-ие для мат ожидания вел-ны
Разделим это рав-во на лев часть.
В лев сто-не записана доля разброса точек выборки отн-но ур-ия регр-ии и доля разброса не объясненная этим ур-ем.
Т.е. объясненная доля разброса, если ее принять за коэф-т детер-ии ур-ия б опр-ся как
Очевидно, что 0≤R²≤1, т.е. когда ∑ei²=0, все точки выборки лежат а прямой линии регр-ии, то R²=1 идеальный вар-т.
А если
совпадает с дисп-ей разброса объясняемой перем-й, т.е. ур-ие регр-ии ничего не объяснило в поведении завис перем-й R²=0.Возм-ны усл-ия наруш-ия этого соотн-ия, при кот-ых R²≤0. Они связаны с тем, что неправ-но выбрана специф-ия модели, т.е. вид зав-ти м/у х и У.
Если модель строится на основе данных врем-х рядов, то R² как правило нах-ся в диапазоне 0,6≤R²≤0,7.
Покажем как в случае парной регр-ии коэф-т детер-ии связан с вел-ной выбороч-й коррел-ии м/у перем-ми х и У.
Для этого выпишем долю разброса, объясненную ур-ем регр-ии.
Запишем вместо b1 его вел-ну:
Числ-ль и знам-ль преоб-м для чего умножим их на ∑ квадратов откл-ий по объясняющ перем-й
Заметим, что
Тогда мы в нашем выраж-ии
Множественная линейная регрессия.
Общеиз-но, что на люб эк пок-ль чаще всего оказ-т влияние не 1, а какие-то мно-во ф-ров. Тогда мы д исп-ть ур-ие множест регр-ии y=βo+β1x1+β2x2…+βmxm+ε, те.е знач-ие у зависит от m ф-ров.
При m≥2, регр-ия сч-ся множест-й. Если мы составим нек-ый вектор
m х 1, то мы м рассм-ть как ур-ие заданное в векторно-матричной форме, сформировав из значений объясняющ-х перем-ых некую матрицу, строками кот-ый яв-ся значения объясн-й перем-й, входящие в 1 выборочную компоненту.Столбцы представлены наборами значений каждого из фак-ров, входящих в модель.
Тогда сов-ые знач-ия завис перем-й м.б. предст-ны в виде в-ра столбца.
Случ откл-ия также м рассм-ся как нек-ый столбец
Но исходя из того, что в модели при βо всегда коэф-т =1, то матрицу значений объясн-их перем-ых пополняют 1-м столбцом, состоящим из 1 и обознач-т за Х.
Эта матрица имеет размерность nx (m+1).
Ур-ие регр-ии в матрично-вей форме мы м представить как У=Хβ+ε
При этом д вып-ся усл-ие n≥3m-1 и все усл-ия Гауса-Маркова, кот-ые кратко запишем в форме
1). М(εi)=0 для люб i.
2).D(εi)=D(εi)=σ² для люб i и j
3). Отсут-т связь м/у откл-ми
4). Случ откл-ия не зависят от объясняющ перем-ых cov(εi;xi)=0.
5). Модель линейна отн-но расчет пар-ов, но в ур-ях множест регр-ии возн-т необ-ть выпол-ия еще одного усл-ия.
6). В модели отсут-т соверш мульт-ть м/у объясняющ перем-ми. Нап-р: в модель нельзя одновр-но включать данные годовые и квартальные в этом же году, т.к. годовые склад-ся из поквартальных.
7). Как уже б показано для исп-ия t стат-ки и расчета стандартов откл-ий д вып-ся требование о том, что случ откл-ия εi имеют норм распр-ие εi~N(0;σ²). Выполнимость этой предпосылки дает возм-ть при соотв-ии модели осн требованиям модели Гауса-Маркова утвер-ть, что мы нашли наилучшие оценки коэф-в ур-ия, чем м бы их получить, используя люб др метод нахождения.
Предпол-м, что мы вычислили оценки коэф-та, тогда ур-ие множест регр-ии, построенное на основе выборки, б запис-ть в форме аналогич записи в парной регр-ии.
ỹ=bo+b1x1+b2x2+…+bmxm
y=bo+b1x1+b2x2+…+bmxm+e, где е – вектор расчетных откл-ий
И для любого набора значений ф-ров в выборке б вып-ся
ỹi=bo+b1xi1+b2xi2+…+bmxim
yi- ỹi=ei
А тогда по методу МНК мы м опр-ть ф-ию Q=∑ei²= ∑(yi-bo-b1xi1-b2xi2-…-bmxim)²
И найти от этой ф-ии част производные по ее парам-м (коэф-там ур-ия).
Получаем сис-му из m+1 ур-ия с m+1 неизв-м. Если ее приравнят к 0, то получим сис-му лин ур-ий отн-но коэф-в ур-ия регр-ии, кот-ая всегда б иметь единств решение, т.к. мы м добиться того, чтобы опр-ль сис-мы был ≠0.
Но в тех случаях, когда кол-во объясняющ перем-х m>2, решение таких сис-м нач-т вызывать трудности, поэтому расчет коэф-в делают в матрчно-вект-й форме.
Расчет коэффициентов множественной линейной регрессии.
Предпол-м, что исход выборка предст-на как
Век-р искомых коэф-в и вектор откл-ий
Тогда вел-на Q м.б. запис-на в виде произв-ия 2-х век-ров как