Содержание
Задача 1
Решение
Задача 2
Решение
Задача 3
Решение
Задача 4
Решение
Задача 5
Решение
Список используемой литературы
Приложение
Задача 1
По регионам страны изучается зависимость ВРП на душу населения (y тыс. руб.) от инвестиций в основной капитал (x - тыс. руб.):
№ региона | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
x, тыс. руб. | 9,4 | 2,5 | 3,9 | 4,3 | 2,1 | 6,0 | 6,3 | 5,2 | 6,8 | 8,2 |
y, тыс. руб. | 35,8 | 22,5 | 28,3 | 26,0 | 18,4 | 31,8 | 30,5 | 29,5 | 41,5 | 41,3 |
Задание
1. Постройте поле корреляции, характеризующее зависимость ВРП на душу населения от размера инвестиций в основной капитал.
2. Определите параметры уравнения парной линейной регрессии. Дайте интерпретацию коэффициента регрессии и знака при свободном члене уравнения.
3. Рассчитайте линейный коэффициент корреляции и поясните его смысл. Определите коэффициент детерминации и дайте его интерпретацию.
4. Найдите среднюю ошибку аппроксимации.
5. Рассчитайте стандартную ошибку регрессии.
6. С вероятностью 0,95 оцените статистическую значимость уравнения регрессии в целом, а также его параметров. Сделайте вывод.
7. С вероятностью 0,95 постройте доверительный интервал ожидаемого значения ВРП на душу населения в предложении, что инвестиции в основной капитал составят 80% от максимального значения. Сделайте вывод.
Решение
1. Построение поля корреляции производится по исходным данным о парах значений ВРП на душу населения и инвестиций в основной капитал.
2. Оценка параметров уравнения парной линейной регрессии производится обычным методом наименьших квадратов (МНК).
Для расчета параметров a и b линейной регрессии y = a + b*x решаем систему нормальных уравнений относительно a и b:
По исходным данным (табл. 1.1) рассчитываем Σy, Σx, Σyx, Σx2, Σy2.
Таблица 1.1 Расчетная таблица
y | x | yx | x2 | y2 | Аi | |||
1 | 35,8 | 9,4 | 336,520 | 88,360 | 1281,640 | 41,559 | -5,759 | 16,087 |
2 | 22,5 | 2,5 | 56,250 | 6,250 | 506,250 | 22,248 | 0,252 | 1,122 |
3 | 28,3 | 3,9 | 110,370 | 15,210 | 800,890 | 26,166 | 2,134 | 7,541 |
4 | 26,0 | 4,3 | 111,800 | 18,490 | 676,000 | 27,285 | -1,285 | 4,944 |
5 | 18,4 | 2,1 | 38,640 | 4,410 | 338,560 | 21,128 | -2,728 | 14,827 |
6 | 31,8 | 6,0 | 190,800 | 36,000 | 1011,240 | 32,043 | -0,243 | 0,765 |
7 | 30,5 | 6,3 | 192,150 | 39,690 | 930,250 | 32,883 | -2,383 | 7,813 |
8 | 29,5 | 5,2 | 153,400 | 27,040 | 870,250 | 29,804 | -0,304 | 1,032 |
9 | 41,5 | 6,8 | 282,200 | 46,240 | 1722,250 | 34,282 | 7,218 | 17,392 |
10 | 41,3 | 8,2 | 338,660 | 67,240 | 1705,690 | 38,201 | 3,099 | 7,504 |
Итого | 305,6 | 54,7 | 1810,790 | 348,930 | 9843,020 | 305,600 | 0 | 79,027 |
Среднее значение | 30,56 | 5,47 | 181,079 | 34,893 | 984,302 | - | - | - |
7,098 | 2,23 | - | - | - | - | - | - | |
50,381 | 4,973 | - | - | - | - | - | - |
Система нормальных уравнений составит
Используем следующие формулы для нахождения параметров:
= 2,799 305,6 - 2,799*5,47 = 15,251Уравнение парной линейной регрессии:
= 15,251 + 2,799* xВеличина коэффициента регрессии b = 2,799 означает, что с ростом инвестиций в основной капитал на 1 тыс. руб. доля ВРП на душу населения растет в среднем на 2,80 %-ных пункта.
Знак при свободном члене уравнения положительный, следовательно связь прямая.
3. Рассчитаем линейный коэффициент корреляции:
илигде
, - средние квадратические отклонения признаков x и y, соответственноТак как
= 2,23, = 7,098, то = 0,879, что означает тесную прямую связь рассматриваемых признаковКоэффициент детерминации составит
= 0,773Вариация результата (y) на 77,3% объясняется вариацией фактора (x). На долю прочих факторов, не учитываемых в регрессии, приходится 22,7%.
4. Средняя ошибка аппроксимации (
) находится как средняя арифметическая простая из индивидуальных ошибок = =7,9%,(см. последнюю графу расчетной табл. 1.1.).
Ошибка аппроксимации показывает хорошее соответствие расчетных (
) и фактических (y) данных: среднее отклонение составляет 7,9%.5. Стандартная ошибка регрессии рассчитывается по следующей формуле:
,где m – число параметров при переменных x.
В нашем примере стандартная ошибка регрессии
= 3,7826. Оценку статистической значимости построенное модели регрессии в целом производится с помощью F-критерия Фишера. Фактическое значение F-критерия для парного линейного уравнения регрессии определяется как
F =
где Сфакт =
- факторная, или объясненная регрессия, сумма квадратов; Сост = - остаточная сумма квадратов; - коэффициент детерминации.В нашем примере F-критерий Фишера будет равен (см. приложение №1):
F =
= 27,233Табличное значение F-критерия при числе степеней свободы 1 и 8 и уровне значимости 0,05 составит: 0,05 F1,8 = 5,32, т. е. фактическое значение F(Fфакт = 27,233) превышает табличное (Fтабл = 5,32), и можно сделать вывод, что уравнение регрессии статистически значимо. Следовательно гипотеза Н0 отклоняется.
Чтобы оценить значимость отдельных параметров уравнения, надо по каждому из параметров определить его стандартные ошибки: mb и ma.
Стандартная ошибка коэффициента регрессии определяется по формуле:
mb =
=где S2 – остаточная дисперсия на одну степень свободы.
Стандартная ошибка параметра a определяется по формуле:
ma =
.Для нахождения стандартных ошибок строим расчетную таблицу (см. приложение №1).
Для нашего примера величина стандартной ошибки коэффициента регрессии составила:
mb =
= 0,536.Величина стандартной ошибки параметра a составила:
ma =
= 3,168Для оценки существенности коэффициента регрессии и параметра a их величины сравниваются с их стандартными ошибками, т. е. определяются фактические значения t-критерия Стьюдента:
tb=
, ta = .Для нашего примера
tb=
= 5,222, ta = = 4,814Фактические значения t-критерии превосходят табличные значения:
tb=5,222 > tтабл = 2,306; ta = 4,814 > tтабл = 2,306
Поэтому гипотеза Н0отклоняется, т. е. a и b не случайно отличаются от нуля, а статистически значимы.
7. Полученные оценки уравнения регрессии позволяют использовать его для прогноза. Для расчета точечного прогноза
подставим в уравнение регрессии заданное значение факторного признака . Если прогнозное значение инвестиций в основной капитал составит: