Проанализировать зависимость признака у от х по данным табл. 1, для чего:
1. Построить корреляционную таблицу, выполнив интервальную группировку по признакам у и х;
2. Рассчитать коэффициент корреляции Фехнера, линейный коэффициент корреляции и коэффициент корреляции рангов (Спирмена), определить коэффициент конкордации;
3. Произвести регрессионный анализ, рассчитав параметры уравненияy = аx +b, и построить на корреляционном поле графики, соответствующие эмпирическому ряду исходных данных и уравнению регрессии;
4. Сопоставить результаты и сделать выводы.
Решение:
Исходные данные, выданные руководителем, приведены в Таблице 1:
Таблица 1.
№ по порядку | Фонд оплаты труда, млн. руб. (X) | Товарная продукция (в действующих ценах), млн. руб. (Y) |
1 | 371,5 | 2629 |
2 | 389,3 | 3860 |
3 | 228,3 | 1035 |
4 | 447,7 | 2136 |
5 | 248,6 | 1116 |
6 | 458,8 | 2206 |
7 | 399,6 | 1392 |
8 | 282,7 | 1674 |
9 | 284,9 | 2013 |
10 | 330,5 | 2223 |
11 | 398,2 | 1691 |
12 | 330 | 1298 |
13 | 370,4 | 1663 |
14 | 378,6 | 1887 |
15 | 279 | 1984 |
16 | 334,9 | 1531 |
17 | 345,6 | 1795 |
18 | 381,8 | 1906 |
19 | 223,1 | 1772 |
20 | 402,2 | 1340 |
Для определения количества групп воспользуемся формулой Стерджесса:
;Где: n – число групп, которые мы будем создавать;
m – число единиц совокупности.
5,32 , следовательно должно быть 5 групп.Сейчас выполним интервальную группировку по признакам у и х.
У изменяется от уmin=1035 до уmax=3860. Делим этот интервал на 5 равных интервалов длиной равной:
.Х изменяется от хmin= 223,1 до хmax= 458,8. Делим этот интервал на 5 равных интервалов длиной равной
Построим корреляционную таблицу. Она имеет следующий вид:
Таблица 2.
Товарная продукция (в действующих ценах), млн. руб.(Y) | ||||||
Фонд оплаты труда, млн. руб.(X) | 1035-1600 | 1600-2165 | 2165-2730 | 2730-3295 | 3295-3860 | Всего |
223,10-270,24 | 1 1 | 1 | 3 | |||
270,24-317,38 | 1 1 1 | 3 | ||||
317,38-364,52 | 1 1 | 1 | 1 | 4 | ||
364,52-411,66 | 1 1 | 1 1 1 1 | 1 | 1 | 8 | |
411,66-458,80 | 1 | 1 | 2 | |||
Всего | 6 | 10 | 3 | 0 | 1 | 20 |
Рассмотрев корреляционную таблицу, можно сделать вывод о том, что между факторным и результативным признаками существует прямая, хотя и достаточно слабая связь. Следовательно, можно сделать вывод о том, что между ними прослеживается прямая зависимость.
Для более точного определения направления и тесноты связи необходимо рассчитать ряд коэффициентов: коэффициент корреляции Фехнера, коэффициент корреляции рангов, линейный коэффициент корреляции, коэффициент конкордации.
Коэффициент корреляции Фехнера рассчитывается по формуле:
гдеС – согласованная вариация;
Н – несогласованная вариация.
Для его расчета воспользуемся данными из следующей таблицы:
Таблица 3.
3 | Товарная продукция (в действующих ценах), млн. руб. | X-Xср | Y-Yср | Знак Δy | Знак Δx | Совпадение знаков | |
371,5 | 2629 | 27,215 | 771,45 | + | + | С | |
389,3 | 3860 | 45,015 | 2002,45 | + | + | С | |
228,3 | 1035 | -115,985 | -822,55 | - | - | С | |
447,7 | 2136 | 103,415 | 278,45 | + | + | С | |
248,6 | 1116 | -95,685 | -741,55 | - | - | С | |
458,8 | 2206 | 114,515 | 348,45 | + | + | С | |
399,6 | 1392 | 55,315 | -465,55 | + | - | Н | |
282,7 | 1674 | -61,585 | -183,55 | - | - | С | |
284,9 | 2013 | -59,385 | 155,45 | - | + | Н | |
330,5 | 2223 | -13,785 | 365,45 | - | + | Н | |
398,2 | 1691 | 53,915 | -166,55 | + | - | Н | |
330 | 1298 | -14,285 | -559,55 | - | - | С | |
370,4 | 1663 | 26,115 | -194,55 | + | - | Н | |
378,6 | 1887 | 34,315 | 29,45 | + | + | С | |
279 | 1984 | -65,285 | 126,45 | - | + | Н | |
334,9 | 1531 | -9,385 | -326,55 | - | - | С | |
345,6 | 1795 | 1,315 | -62,55 | + | - | Н | |
381,8 | 1906 | 37,515 | 48,45 | + | + | С | |
223,1 | 1772 | -121,185 | -85,55 | - | - | C | |
402,2 | 1340 | 57,915 | -517,55 | + | - | Н | |
Всего | 12 | 8 |
Получаем:
Так как значение коэффициента число положительное и достаточно мало (близко к нулю), то можно говорить о наличии прямой достаточно слабой связи.
Коэффициент корреляции рангов (Спирмена) определяется по формуле:
гдеn – число размеров признака (число пар) (20)
d– разность между рангами в двух рядах.
Для его расчета используем данные из следующей таблицы:
Таблица 4.
Y | X | ||||
Значение | rang y | Значение | rang x | d | d2 |
2629 | 19 | 371,5 | 12 | 7 | 49 |
3860 | 20 | 389,3 | 15 | 5 | 25 |
1035 | 1 | 228,3 | 2 | -1 | 1 |
2136 | 16 | 447,7 | 19 | -3 | 9 |
1116 | 2 | 248,6 | 3 | -1 | 1 |
2206 | 17 | 458,8 | 20 | -3 | 9 |
1392 | 5 | 399,6 | 17 | -12 | 144 |
1674 | 8 | 282,7 | 5 | 3 | 9 |
2013 | 15 | 284,9 | 6 | 9 | 81 |
2223 | 18 | 330,5 | 8 | 10 | 100 |
1691 | 9 | 398,2 | 16 | -7 | 49 |
1298 | 3 | 330 | 7 | -4 | 16 |
1663 | 7 | 370,4 | 11 | -4 | 16 |
1887 | 12 | 378,6 | 13 | -1 | 1 |
1984 | 14 | 279 | 4 | 10 | 100 |
1531 | 6 | 334,9 | 9 | -3 | 9 |
1795 | 11 | 345,6 | 10 | 1 | 1 |
1906 | 13 | 381,8 | 14 | -1 | 1 |
1772 | 10 | 223,1 | 1 | 9 | 81 |
1340 | 4 | 402,2 | 18 | -14 | 196 |
Σd2 | 898 |
Так как этот коэффициент положителен и близок к нулю, то можно сказать, что он свидетельствует о наличии прямой слабой связи.
Линейный коэффициент корреляции определяется по формуле:
Для его расчета воспользуемся данными из следующей таблицы:Таблица 5.
27,215 | 771,45 | 740,6562 | 595135,1025 |
45,015 | 2002,45 | 2026,35 | 4009806,003 |
-115,985 | -822,55 | 13452,52 | 676588,5025 |
103,415 | 278,45 | 10694,66 | 77534,4025 |
-95,685 | -741,55 | 9155,619 | 549896,4025 |
114,515 | 348,45 | 13113,69 | 121417,4025 |
55,315 | -465,55 | 3059,749 | 216736,8025 |
-61,585 | -183,55 | 3792,712 | 33690,6025 |
-59,385 | 155,45 | 3526,578 | 24164,7025 |
-13,785 | 365,45 | 190,0262 | 133553,7025 |
53,915 | -166,55 | 2906,827 | 27738,9025 |
-14,285 | -559,55 | 204,0612 | 313096,2025 |
26,115 | -194,55 | 681,9932 | 37849,7025 |
34,315 | 29,45 | 1177,519 | 867,3025 |
-65,285 | 126,45 | 4262,131 | 15989,6025 |
-9,385 | -326,55 | 88,07822 | 106634,9025 |
1,315 | -62,55 | 1,729225 | 3912,5025 |
37,515 | 48,45 | 1407,375 | 2347,4025 |
-121,185 | -85,55 | 14685,8 | 7318,8025 |
57,915 | -517,55 | 3354,147 | 267858,0025 |
=88522,23 | =7222136,95 |
Полученный результат также свидетельствует о наличии прямой слабой связи.
Коэффициент конкордации определяется с использованием коэффициента корреляции рангов по формуле:
гдеm – число факторов;
n– число наблюдений;
S – отклонение суммы квадратов рангов от средней квадратов рангов,
где S=
, ∑(rang x+rang y)^2 и b= ∑(rang x+rang y).