Задание 1. Величина прожиточного минимума (в среднем на душу населения, рублей в месяц, по данным Федеральной службы государственной статистики «Россия в цифрах - 2005 году указана в таблице)
Величина прожиточного минимума | |
2000 (среднее за год) | 1235,5 |
1 квартал | 1238 |
2 квартал | 1185 |
3 квартал | 1234 |
4 квартал | 1285 |
2001 (среднее за год) | 1500,3 |
1 квартал | 1396 |
2 квартал | 1507 |
3 квартал | 1524 |
4 квартал | 1574 |
2002 (среднее за год) | 1808,3 |
1 квартал | 1719 |
2 квартал | 1804 |
3 квартал | 1817 |
4 квартал | 1893 |
2003 (среднее за год) | 2112 |
1 квартал | 2047 |
2 квартал | 2137 |
3 квартал | 2121 |
4 квартал | 2143 |
2004 (среднее за год) | 2375,8 |
1 квартал | 2293 |
2 квартал | 2363 |
3 квартал | 2396 |
4 квартал | 2451 |
1. Постройте диаграмму рассеяния и сформулируйте гипотезу о виде связи.
2. Рассчитайте параметры уравнения линейной парной регрессии.
3. Оцените тесноту связи с помощью коэффициента корреляции.
4. С помощью F-критерия Фишера оцените статистическую надежность результатов регрессионного моделирования.
5. Рассчитайте, чему должно быть равно прогнозное значение величины прожиточного минимума в 1 квартале 2005 года, во 2 квартале 2007 года.
6. Определите доверительный интервал 2-ого прогноза для уровня значимости, равного 0,05.
7. Сравните полученный результат с реальной ситуацией.
Решение:
Пронумеруем кварталы сквозной нумерацией (табл. 1).
Таблица 1 Исходные данные
Номер квартала, х | Величина прожиточного минимума, у |
1 | 1238 |
2 | 1185 |
3 | 1234 |
4 | 1285 |
5 | 1396 |
6 | 1507 |
7 | 1524 |
8 | 1574 |
9 | 1719 |
10 | 1804 |
11 | 1817 |
12 | 1893 |
13 | 2047 |
14 | 2137 |
15 | 2121 |
16 | 2143 |
17 | 2293 |
18 | 2363 |
19 | 2396 |
20 | 2451 |
1. Корреляционный анализ наряду с выборочным методом представляет собой важнейшее прикладное направление математической статистики. Предметом его исследования является связь (зависимость) между различными варьирующими признаками (переменными величинами), при которой каждому значению одной переменной соответствует не определенное значение другой (как это имеет место при функциональной зависимости), а ряд распределения с определенной групповой средней.
Конечная цель корреляционного анализа - получение уравнений прямых регрессии, характеризующих форму зависимости и вычисление коэффициента корреляции, определяющего тесноту (силу) связи, если она линейная.
Диаграмма рассеяния применяется для исследования зависимости между двумя видами данных, например для анализа зависимости номера квартала и величины прожиточного минимума.
Диаграмма рассеяния, так же как и метод расслоения (стратификации), используется для выявления причинно-следственных связей показателей качества и влияющих факторов при анализе причинно-следственной диаграммы.
Диаграмма рассеяния строится как график зависимости между двумя параметрами. Если на этом графике провести линию медианы, он позволяет легко определить, имеется ли между этими двумя параметрами корреляционная зависимость.
Диаграмма рассеяния строится в таком порядке: по горизонтальной линии откладываются измерения величин измерения величин одной переменной, а по вертикальной оси - другой переменной.
Как следует из визуального анализа диаграммы рассеяния (рис. 1) между величиной прожиточного минимума и номером квартала существует прямая линейная связь, и она описывается уравнением прямой:
ух = а0 + а1 ∙ х. (1)
Рисунок 1. Диаграмма рассеяния
2. Определим параметры уравнения прямой на основе метода наименьших квадратов, решив систем нормальных уравнений.
(2)Откуда:
(3) (4)По формулам (3), (4) вычислим а0, а1, используя расчетные данные таблицы 2.
Таблица 2 Расчетные данные для линейной парной регрессии
№ п/п | х | у | х2 | ух | у- | (у- )2 | у2 | у- | (у- )2 | |
1 | 1 | 1238 | 1 | 1238 | 1131 | 107,4 | 11537,8 | 1532644 | -568,4 | 323021,7 |
2 | 2 | 1185 | 4 | 2370 | 1202 | -16,7 | 279,5 | 1404225 | -621,4 | 386075,8 |
3 | 3 | 1234 | 9 | 3702 | 1273 | -38,9 | 1509,5 | 1522756 | -572,4 | 327584,5 |
4 | 4 | 1285 | 16 | 5140 | 1344 | -59,0 | 3479,2 | 1651225 | -521,4 | 271805,8 |
5 | 5 | 1396 | 25 | 6980 | 1415 | -19,1 | 365,5 | 1948816 | -410,4 | 168387,1 |
6 | 6 | 1507 | 36 | 9042 | 1486 | 20,7 | 430,5 | 2271049 | -299,4 | 89610,4 |
7 | 7 | 1524 | 49 | 10668 | 1557 | -33,4 | 1114,5 | 2322576 | -282,4 | 79721,5 |
8 | 8 | 1574 | 64 | 12592 | 1629 | -54,5 | 2972,1 | 2477476 | -232,4 | 53986,5 |
9 | 9 | 1719 | 81 | 15471 | 1700 | 19,3 | 374,4 | 2954961 | -87,3 | 7630,0 |
10 | 10 | 1804 | 100 | 18040 | 1771 | 33,2 | 1103,3 | 3254416 | -2,3 | 5,5 |
11 | 11 | 1817 | 121 | 19987 | 1842 | -24,9 | 620,8 | 3301489 | 10,7 | 113,4 |
12 | 12 | 1893 | 144 | 22716 | 1913 | -20,0 | 402,0 | 3583449 | 86,7 | 7508,2 |
13 | 13 | 2047 | 169 | 26611 | 1984 | 62,8 | 3946,0 | 4190209 | 240,7 | 57912,4 |
14 | 14 | 2137 | 196 | 29918 | 2055 | 81,7 | 6672,3 | 4566769 | 330,7 | 109329,4 |
15 | 15 | 2121 | 225 | 31815 | 2126 | -5,4 | 29,7 | 4498641 | 314,7 | 99004,6 |
16 | 16 | 2143 | 256 | 34288 | 2198 | -54,6 | 2979,2 | 4592449 | 336,7 | 113333,2 |
17 | 17 | 2293 | 289 | 38981 | 2269 | 24,3 | 589,8 | 5257849 | 486,7 | 236828,2 |
18 | 18 | 2363 | 324 | 42534 | 2340 | 23,2 | 536,0 | 5583769 | 556,7 | 309859,2 |
19 | 19 | 2396 | 361 | 45524 | 2411 | -15,0 | 224,4 | 5740816 | 589,7 | 347687,1 |
20 | 20 | 2451 | 400 | 49020 | 2482 | -31,1 | 968,1 | 6007401 | 644,7 | 415573,6 |
Итого | 210 | 36127 | 2870 | 426637 | 36127,00 | 0,0 | 40134,8 | 68662985,0 | 0,0 | 3404978,6 |
В среднем | 10,5 | 1806,4 | 143,5 | 21331,9 | 1806,4 | 0,0 | 2006,7 | 3433149,3 | 0,0 | 170248,9 |
Вычислив параметры, получим следующее уравнение:
ух = 1059,5 + 71,1 ∙ х.
Следовательно, с увеличением номера квартала на 1%, величина прожиточного минимума увеличится на 71,1%.
3. Значимость коэффициентов регрессии проверим по t-критерию Стьюдента. Вычислим расчетные значения t-критерия по формулам:
для параметра а0:
, (5)для параметра а1:
, (6)где n= 20 - объем выборки,
среднее квадратическое отклонение результативного признака у от выровненных значений ух:
, (7)среднее квадратическое отклонение факторного признака х от общей средней
: . (8)Находим:
, , , .Вычисленные значения ta0 и ta1 сравнивают с критическими (табличными) t, которые определяют по таблице Стьюдента с учетом принятого уровня значимости а и числом степеней свободы вариации v = n -2 = 20-2 =18. В социально-экономических исследованиях уровень значимости а обычно принимают равным 0,05. Параметр признается значимым при условии, если tрасч> tтабл.
Так как tрасча0 = 100,340 и tрасча1 = 38,847 больше tтабл = 2,101, то параметры а0 и а1 признаются значимыми, т.е. в этом случае маловероятно, что найденное значение параметра обусловлено только случайными совпадениями.
Выявим тесноту корреляционной связи между х и у с помощью линейного коэффициента корреляции, используя формулу:
.(9) .Т.к. r =0,994, то связь прямая сильная, полная.
Значимость линейного коэффициента корреляции определяется помощью t-критерия Стьюдента (число степеней свободы равно 18, уровень значимости а=0,05) по формуле: