Стандартная ошибка прогноза вычисляется по формуле
Величина стандартной ошибки достигает минимума когда Хк=Х ср и возрастает при удалении от Х ср в любом направлении. При прогнозировании на основе уравнения регрессии следует помнить, что величина прогноза зависит не только от стандартной ошибки но и от точности прогнозного значения фактора Х ( т.е. от Хр). Его величина может задаваться на основе анализа других моделей исходя из конкретной ситуации.
8. корреляция для нелинейной регрессии
Также как и в линейной регрессии используется линейный коэффициент корреляции. В нелинейной регрессии служит индекс корреляции.
Р [0;1]. Чем ближе к 1 том больше связь между рассматриваемыми признаками и тем надежнее уравнение. Коэффициент детерминации- используется для проверки существенности уравнения линейной регрессии по f-критерию Фишера.
где м –число параметров при переменной х, n –число наблюдений.
Число m характеризует число степеней свободы для факторной суммы квадратов. Величина n-m-1 характеризует число степеней свободы для остаточной суммы квадратов. Для степенной функции
для параболыy=a+bx+cx2
.9. нелинейная регрессия
Нелинейная регрессия бывает 2 видов:
- регрессии нелинейные, относительно включаемых в анализ объясняющих переменных, но линейные относительно оцениваемых параметров.
- регрессии нелинейные по параметрам.
Примером первого вида являются полиномы различных степеней:
y=a+bx+cx2, y=a+bx+cx2+dx3, y=a+bx+cx2+dx3+…+zxn.’
Сюда же можно отнести равностепенную гиперболу y=a+b/x. Ко второму типу относятся степенная, показательная, экспоненциальная функции. Полиномы любого порядка сводятся к линейной регрессии с ее методами проверки гипотез и оцениванием параметров. Параболу целесообразно применять для оцениваемого интервала значения фактора X, когда меняется характер среди исследуемых признаков. При этом применяется МНК для оценивания неизвестных параметров a,b,c. В результате получается система из 3 линейных уравнений с 3 неизвестными.
Решение данной системы возможно методом Крамера.
Если b>0, c<0, то кривая симметрична относительно высшей точки, т.е. точки перелома кривой, изменяющей направление связи, а именно рост сменяется падением. Такую функцию используют при изучении зависимости з\п работников от возраста. Если b<0, c>0, то кривая симметрична относительно низшей точки и это позволяет определить минимум в точке, меняющей направление связи, а именно падение сменяется ростом.
Такая функция используется при изучении зависимости объема выпуска производства от затрат на производство. Ввиду симметричности кривой второго порядка ее не всегда удобно использовать в конкретных исследованиях, поэтому если на диаграмме рассеивания нет четко выраженной параболы, то использовать ее не нужно, а заменить степенной функцией. Среди нелинейных функций параметры которой можно найти с помощью МНК y-a+b/x можно назвать равносторонней гиперболой. Примером такой функции является кривая Филипса, которая характеризует соотношение между нормой безработицы Х и приростом з\п У. регрессии нелинейные оцениваемые по параметрам делятся также на 2 вида:
- нелинейные модели внутренне линейные.
- Нелинейные модели внутренне нелинейные.
Если модель внутренне линейна, то она с помощью некоторых преобразований может быть приведена к линейному виду. Если модель внутренне нелинейная, то она не может быть приведена к линейному виду. Внутренне линейной можно назвать y=axb. чтобы привести ее к линейному виду нужно ее линеаризовать с помощью логарифмирования.lny=ln(ax)b; lny=Y, lna=c; blnx=X. Далее в помощью МНК находится коэффициенты С и В c=lna; a=ec. к таким моделям относятся показательная, логистическая функции. В экономических исследованиях степенная функция используется для определения коэффициента эластичности.
.эконометрика регрессия прогноз ошибка
Коэффициенты эластичности для различных математических функций.
Вид функции У | Первая производная | Коэффициент эластичности |
1. линейная y=a+b*x | B | |
2. парабола 2 порядка y=a+b*x+c*x2 | b+2cx | |
3. гипербола y=a+b\x | -b\x2 | |
4. показательная y=a*bx | a*bx*lnb | |
5. степенная y=a*xb | a*b*xb-1 | |
6. полулогарифмическая y=a+b*lnx | b/x | |
7.логистическая y=a\(1+b*e-cx) | ||
8. обратная y=1/(a+bx) | -b\(a+bx)2 |
Если модель внутренне нелинейная, то для оценки параметров используются итеративные процедуры. Решение такого типа задач реализовано в стандартных пакетах прикладных программ.
10. средняя ошибка аппроксимации
Фактические значения результативного признака отличаются от теоретических, рассчитанных по уравнению регрессии. Чем меньше это отличие, тем ближе теоретические значения подходят к эмпирическим данным, тем лучше модель. Величина отклонений фактических данных от теоретических, т.е (y-y^) – ошибка аппроксимации, а т.к. эта величина может быть +\-, то ошибка аппроксимации для каждого наблюдения определяется в % по модулю.
.Допустимый уровень 8-10%.
11. множественная регрессия и корреляция.спецификация модели
Парная регрессии может дать хороший результат при моделировании, если влиянием др. факторов, воздействующих на объект исследования, можно пренебречь. Множественная регрессия широко используется в решении проблем спроса, доходности акций, при изучении функции издержек производства, в макроэкономических расчетах и т.д. основная цель: построить модель с большим числом факторов, определив при этом влияние каждого фактора в отдельности, а также совокупное влияние на моделирование показателей. Множественная регрессия в общем виде можно записать сл. Уравнением:
y=f(x1,x2,…,xn).
12.отбор факторов множественной регрессии
факторы, включаемые в уравнение множественной регрессии должны удовлетворять сл. Требованиям: - должны быть количественно измеримы, не должны быть интеркоррелированы ( т.е. не должны быть связаны друг с другом и тем более не находиться в функциональной зависимости). Если между факторами существует большая корреляция, то нельзя определить их изолированное влияние на результативный признак. Тогда параметры регрессии оказываются не интерпретируемыми. Насыщение модели линейными факторами не снижает величину остаточной дисперсии и не увеличивает показатель детерминации, зато приводит к статистической не значимости уравнения регрессии. И хотя уравнение множественной регрессии позволит получить большое количество факторов, практически необходимости в этом нет, поэтому отбор факторов производится на основе качественного теоретико-экономического анализа. Отбор факторов обычно производится в 2 стадии. На первой выбираются факторы исходя из сущности проблем. На второй стадии на основе матрицы показателей корреляции определяется t- статистики Стьюдента для параметров уравнения регрессии. Это позволяет исключить из модели дублирующие факторы. Считается, что 2 переменные явно коллинеарные, т.е. зависимы, если коэффициент корреляции между ними больше или равен 0,7. 2 переменные дублируют друг друга, поэтому от одной из них необходимо избавиться. В этом случае предпочтение отдается переменной, для которой наблюдается связь с результатом в наименьшей степени. Наибольшие трудности в использовании множественной регрессии возникают при наличии мультиколлинеарности, когда более чем 2 фактора связаны между собой. Включают в модель мультиколлинеарности факторов т.к.: затрудняется интерпретация параметров (теряют смысл); оценки параметров не надежны и обнаруживают большие нестандартные ошибки. Для оценки мультиколлинеарности используется определитель матрицы парных коэффициентов корреляции между факторами. Например, уравнение множественной регрессии имеет вид:
y=a+b1x1+b2x2+b3x3+E.
если rxixi=1, означает что факторы не колленируют между собой. Если между факторами существует полная линейная зависимость, то detR=0. чем он ближе к нулю, тем сильнее мультиколлинеарность факторов и не надежнее уравнение регрессии. Самый простой способ устранения мультиколлинеарности состоит в исключении одного из факторов из модели. Другой подход связан с преобразованием факторов при котором снижается корреляция между ними. Чтобы учесть внутреннюю корреляцию факторов иногда переходят к совмещенным уравнениям.