h =
= 0,978В нашем примере h = 0,978, h² = 0,958.
Как видим, степенная форма связи точнее отражает зависимость потребления товара А от дохода.
Статистическая гипотеза - это предположение о случайной величине, проверяемые по выборке (результатам наблюдений). Будем обозначать высказанные предположения (гипотезу) буквой Н. Наша цель - проверить, не противоречит ли высказанная нами гипотеза Н имеющимся выборочным данным. Процедура сопоставления высказанной гипотезы с имеющимися выборочными данными (x1,x2,…,xn) и количественная оценка степени достоверности полученного вывода называется статистической проверкой гипотез.
Результат сопоставления может быть отрицательным или неотрицательным. Отрицательный результат означает, что данные противоречат высказанной гипотезе, следовательно, от нее надо отказаться. Неотрицательный - данные наблюдения не противоречат высказанной гипотезе, и ее можно принять в качестве одного из допустимых решений.
В регрессионном анализе проверке статистической значимости подвергаются коэффициенты регрессии и корреляции.
Статистическая значимость коэффициента регрессии проверяется с помощью t-критерия Стьюдента. Для этого сначала необходимо определить остаточную сумму квадратов
s2ост=å (yi- ŷi) 2 (6)
и ее среднее квадратическое отклонение
s=
(7)Таблица 4
№ группы | Расходы на потреблениетовара А | Отклонение фактических расходов от расчетных (у - ŷ) | Остаточная сумму квадратов | ||
фактические (у) | расчетные(ŷ) | абсолютные | относительные (в процентах) | ||
1 | 114,00 | 118,00 | - 4,00 | -4% | 16 |
2 | 123,00 | 126,00 | - 3,00 | -2% | 9 |
3 | 132,00 | 133,00 | - 1,00 | -1% | 1 |
4 | 143,00 | 141,00 | 2,00 | 1% | 4 |
5 | 152,00 | 148,00 | 4,00 | 3% | 16 |
6 | 161,00 | 156,00 | 5,00 | 3% | 25 |
7 | 169,00 | 164,00 | 5,00 | 3% | 25 |
8 | 171,00 | 171,00 | - | 0% | 0 |
9 | 178,00 | 179,00 | - 1,00 | -1% | 1 |
10 | 182,00 | 186,00 | - 4,00 | -2% | 16 |
11 | 191,00 | 194,00 | - 3,00 | -2% | 9 |
Всего | - | - | 0 | 122 |
s = 122
s =
= 11,045Затем определяется стандартная ошибка коэффициента регрессии по формуле:
(8)se (b)
Таблица 5
№ группы | х | ¯х | |
1 | 200,00 | - 250,00 | 62500 |
2 | 250,00 | - 200,00 | 40000 |
3 | 300,00 | - 150,00 | 22500 |
4 | 350,00 | - 100,00 | 10000 |
5 | 400,00 | - 50,00 | 2500 |
6 | 450,00 | - | 0 |
7 | 500,00 | 50,00 | 2500 |
8 | 550,00 | 100,00 | 10000 |
9 | 600,00 | 150,00 | 22500 |
10 | 650,00 | 200,00 | 40000 |
11 | 700,00 | 250,00 | 62500 |
Всего | 4 950,00 | 275000 |
Рассчитаем фактическое значение t-критерия Стьюдента для коэффициента регрессии по формуле
(9), tb =Можно построить доверительный интервал для b. Из (9) имеем:
[b - tкр*se (b), b + tкр*se (b)].
0,513 - 2,26*0,021 < b < 0,1513 + 2, 26*0,021
0,1038 < b < 0, 1988.
Оценка статистической значимости построенной модели регрессии в целом производится с помощью F-критерия Фишера. Фактическое значение F-критерия для уравнения парной регрессии, линейной по параметрам определяется как:
(10)где s2фактор-дисперсия для теоретических значений ŷ (объясненная вариация);
s2ост - остаточная сумма квадратов;
r2 - коэффициент детерминации.
Fф =
Выдвигаем ноль-гипотезу о том, что коэффициент регрессии статистически незначим:
H0: b = 0. Статистическая значимость коэффициента регрессии проверяется с помощью t- критерия Стьюдента.
Определим стандартную ошибку коэффициента регрессии и рассчитаем фактическое значение t-критерия Стьюдента для коэффициента регрессии: se (b) = 0,021; tb = 7, 205.
По таблице находим значение t-критерия с n-2 степенями свободы t0,05 (9) = 2,26 и сравниваем с ним фактическое значение (tb).
Так как фактическое значение t-критерия Стьюдента превышает табличное, то ноль-гипотеза отклоняется и принимается альтернативная гипотеза о статистической значимости коэффициента регрессии.
Оценка статистической значимости производится с помощью F - критерия Фишера. Фактическое значение F-критерия Фишера: Fф = 452,54.
По таблице находим значение F-критерия с (n-2) степенями свободы F0,05 (1,9) = 5,12 и сравниваем фактическое значение с табличным. В результате, отклоняем ноль-гипотезу и принимаем альтернативную гипотезу о статистической значимости уравнения регрессии.
Коэффициент эластичности потребления показывает, на сколько процентов изменяется потребление данного товара при изменении на один процент значения влияющего на него фактора.
Коэффициент эластичности потребления по доходу характеризует количественную степень влияния изменения дохода на величину потребления и рассчитывается по формуле:
, (11)где у- потребление;
х - доход;
Dу - абсолютное изменение потребления;
Dх - абсолютное изменение дохода.
Эмпирические коэффициенты эластичности рассчитываются по рядам статистических данных по формуле:
, (12)i =1, 2, … n.
Рассчитаем эмпирические коэффициенты эластичности потребления по доходу по данным таблицы 1:
Э2 = 0,37 Э7 = 0,47
Э3 = 0,41Э8 = 0,13
Э4 = 0,54Э9 = 0,47
Э5 = 0,47Э10 = 0,29
Э6 = 0,50Э11 = 0,66
эмпир. =0,43Для целей анализа и прогнозирования лучше использовать теоретический коэффициент эластичности, полученный путем выравнивания и экстраполяции данных.
Формулы Э, вычисленные для разных функций, не одинаковы.
Для линейной зависимости (ŷ = а + bx) y'=b, следовательно
(13)Таблица 6
№ группы | х | у | |
1 | 200,00 | 118,00 | 0,256441 |
2 | 250,00 | 126,00 | 0,300198 |
3 | 300,00 | 133,00 | 0,341278 |
4 | 350,00 | 141,00 | 0,375567 |
5 | 400,00 | 148,00 | 0,408919 |
6 | 450,00 | 156,00 | 0,436442 |
7 | 500,00 | 164,00 | 0,46128 |
8 | 550,00 | 171,00 | 0,486637 |
9 | 600,00 | 179,00 | 0,507151 |
10 | 650,00 | 186,00 | 0,528737 |
11 | 700,00 | 194,00 | 0,545928 |
Всего | 0,422598 |
Для степенной зависимости (у = а xb) y'=abxb-1
(14)Для линейной зависимости потребления от дохода Э различен для разных доходных групп. При степенной зависимости Э постоянен (одинаков для всех групп) и равен b, т.е. показателю степени.
Теоретические и эмпирические коэффициенты эластичности могут существенно различаться в различных группах. Средние же их величины более или менее близки (в нашем случае это 0,4225 и 0,4092) что может служить свидетельством адекватности проверяемой формы связи исходным статистическим данным.
Если на потребление влияет не один, а несколько факторов, то взаимосвязь их выражают уравнением множественной регрессии, процедура построения которого аналогична построению уравнения простой регрессии.
В качестве второго фактора х2, влияющего на потребление, будем рассматривать размер семьи (данные приведены в таблице 6).
Таблица 7 Исходные данные по фактору Х2 - размер семьи
№ группы | Размер семьи х2 |
1 | 1,5 |
2 | 2,1 |
3 | 2,7 |
4 | 3,0 |
5 | 3,2 |
6 | 3,4 |
7 | 3,6 |
8 | 3,7 |
9 | 4,0 |
10 | 3,8 |
11 | 3,7 |
Как и в случае парной регрессии, мы выбираем значения коэффициентов регрессии так, чтобы обеспечить наилучшее соответствие наблюдениям. Получим систему из трех нормальных уравнений с тремя переменными: