Корреляционная зависимость устанавливается и на основе факторных (аналитических) группировок. Для этого необходимо изучаемую совокупность расчленить на группы по величине факторного признака и по каждой группе вычислить групповые средние значения результативного признака. Эти средние величины, исчисленные на единицу совокупности по каждой группе, являются сопоставимыми, и в зависимости от направления их изменения можно установить наличие и направление связи между исследуемыми признаками.
Важную роль в статистических исследованиях взаимосвязей явлений играет индексный метод. Как известно, в любой системе индексов отображается связь между результативным и факторным признаками явлений, посредством индексов устанавливается влияние отдельных причин (факторов) на изменение результативного признака.
В статистике широко применяются балансовые построения как метод анализа связей и пропорций, особенно на макроэкономическом уровне. Путем составления балансов связывают в единую систему абсолютные уровни, характеризующие движение ресурсов. Балансовая формула (в схематическом выражении «приход – расход») характеризует единый процесс движения материальных ресурсов и показывает взаимосвязь и пропорции элементов этого процесса.
На исследовании вариации (количественных различий) факторных и результативных признаков основан регрессионно-корреляционный метод. При анализе корреляционных зависимостей решаются две практические задачи: во-первых, необходимо обнаружить саму зависимость в фактическом материале, а во-вторых, измерить силу, или тесноту, связи, то есть степень ее приближения к связи функциональной. Первая задача решается соответствующей обработкой фактического материала и составлением уравнения корреляционной связи – чего вполне достаточно для выявления наличия связи. Тип уравнения выбирается на основе теоретического анализа и исследования исходных фактических данных.
В большинстве случаев связи изучаются по уравнению прямой вида: , где – результативный признак, – факторный, и – параметры уравнения прямой. Уравнение прямой, описывающей корреляционную связь является уравнением связи, или регрессии, а сама прямая – линией регрессии. Параметры уравнения прямой находятся выравниванием по способу наименьших квадратов, которое приводит к системе двух уравнений.
Более наглядным является рассмотрение изученных методов на примере конкретных данных. Примерим на практике следующие методы:
Рассмотрим метод параллельных рядов на примере данных по 24 хозяйствам района о массе внесенных органических удобрений и уровнях урожайности зерновых . Данные представим в виде таблицы.
Таблица 1. Масса внесенных органических удобрений и уровни урожайности зерновых в хозяйствах района | ||||||||||
№ пп | Масса внесенных органических удобрений на 1 га посевов, т (x) | Урожайность ц/га (у) | № пп | Масса внесенных органических удобрений на 1 га посевов, т (x) | Урожайность ц/га (у) | |||||
1 | 1 | 16 | 13 | 9 | 27 | |||||
2 | 2 | 16 | 14 | 10 | 26 | |||||
3 | 2 | 15 | 15 | 10 | 29 | |||||
4 | 3 | 18 | 16 | 10 | 32 | |||||
5 | 4 | 21 | 17 | 11 | 30 | |||||
6 | 4 | 22 | 18 | 12 | 30 | |||||
7 | 5 | 21 | 19 | 12 | 33 | |||||
8 | 6 | 23 | 20 | 13 | 30 | |||||
9 | 7 | 25 | 21 | 14 | 32 | |||||
10 | 7 | 24 | 22 | 15 | 33 | |||||
11 | 8 | 26 | 23 | 15 | 35 | |||||
12 | 8 | 25 | 24 | 16 | 35 |
Данные о массе внесенных органических удобрений в тоннах на 1 га посевов зерновых (факторные признаки) расположим в порядке их возрастания (табл. 1).
Сравнивая данные таблицы, можно заметить, что чем больше масса внесенных органических удобрений, тем выше уровень урожайности зерновых, хотя и не во всех хозяйствах. Следовательно, можно говорить о наличии прямой связи между значениями факторного и результативного признаков.
При помощи метода факторных (аналитических) группировок построим на основе исходных данных, приведенных в табл. 1 факторную группировку зависимости уровня урожайности зерновых от массы внесенных органических удобрений (табл. 2).
Таблица 2. Зависимость уровня урожайности зерновых от массы внесенных органических удобрений в хозяйствах района | |||
Группы хозяйств по массе внесенных органических удобрений, т/га | Число хозяйств | Общая сумма урожайности по группам хозяйств, ц | Уровень урожайности в среднем по группам хозяйств, ц/га |
1 -- 4 | 6 | 108 | 18,0 |
5 – 8 | 6 | 144 | 24,0 |
9 – 12 | 7 | 207 | 29,6 |
13 – 16 | 5 | 165 | 33,0 |
Итого | 24 | 624 | 26,0 |
Сравнивая групповые средние, можно заметить, что по мере увеличения массы внесенных удобрений на 1 га посевов урожайность от группы к группе закономерно возрастает. Это свидетельствует о положительной корреляционной связи между изучаемыми признаками.
Для выявления наличия корреляционной связи можно так же использовать регрессионно-корреляционный метод. Связь между уровнем урожайности зерновых и массой внесенных удобрений на 1 га посевов можно представить в виде прямой: ,
где – уровень урожайности зерновых; – масса внесенных органических удобрений, т/га; – свободный член уравнения, который в данном случае представляет собой средний уровень урожайности при x=0, то есть когда удобрения не вносятся; – коэффициент регрессии, показывающий насколько в среднем увеличится уровень урожайности с увеличением количества удобрений на 1 т.
Вычислим параметры и и тем самым уравнение прямой, или уравнение связи, для нашего примера (из табл.1). Как видно из формул для нахождения и следует подсчитать , , и . Сделаем это в табл. 3.
Таблица 3. Выравнивание по уравнению прямой | |||||||
№ пп | Масса внесенных органических удобрений на 1 га посевов, т (x) | Урожайность зерновых, ц/га (y) | xy | Выровненные значения уровней урожайности зерновых, ц/га () | |||
1 | 1 | 16 | 16 | 1 | 16,1 | ||
2 | 2 | 16 | 32 | 4 | 17,4 | ||
3 | 2 | 15 | 30 | 4 | 17,4 | ||
4 | 3 | 18 | 54 | 9 | 18,8 | ||
5 | 4 | 21 | 84 | 16 | 20,1 | ||
6 | 4 | 22 | 88 | 16 | 20,1 | ||
7 | 5 | 21 | 105 | 25 | 21,4 | ||
8 | 6 | 23 | 138 | 36 | 22,7 | ||
9 | 7 | 25 | 175 | 49 | 24,0 | ||
10 | 7 | 24 | 168 | 49 | 24,0 | ||
11 | 8 | 26 | 208 | 64 | 25,3 | ||
12 | 8 | 25 | 200 | 64 | 25,3 | ||
13 | 9 | 27 | 243 | 81 | 26,3 | ||
14 | 10 | 26 | 260 | 100 | 28,0 | ||
15 | 10 | 29 | 290 | 100 | 28,0 | ||
16 | 10 | 32 | 320 | 100 | 28,0 | ||
17 | 11 | 30 | 330 | 121 | 29,3 | ||
18 | 12 | 30 | 360 | 144 | 30,6 | ||
19 | 12 | 33 | 396 | 144 | 30,6 | ||
20 | 13 | 30 | 390 | 169 | 32,0 | ||
21 | 14 | 32 | 448 | 196 | 33,3 | ||
22 | 15 | 33 | 495 | 225 | 34,6 | ||
23 | 15 | 35 | 525 | 225 | 34,6 | ||
24 | 16 | 35 | 560 | 256 | 36,0 | ||
Итого | 204 | 624 | 5915 | 2198 | 623,9 |
Следовательно, уравнение связи между уровнем урожайности зерновых и массой внесенных органических удобрений будет: .
Оно означает, что с увеличением на 1 т массы внесенных удобрений в расчете на 1 га посевов урожайность будет увеличиваться в среднем на 1,32 ц/га. Величина 14,8 показывает уровень урожайности зерновых при , то есть когда удобрения не вносятся.
Подставив в это уравнение регрессии конкретные значения , находим для всех 24 хозяйств выровненные (их еще называют теоретическими) значения уровней урожайности зерновых (см. последний столбец табл.3). Суммы фактических (эмпирических) уровней урожайности и теоретических значений практически совпадают: 624 и 623,9, расхождение значений произошло из-за округлений. Незначительность отклонений фактических и выровненных значений по каждому хозяйству может служить подтверждением прямолинейности связи между уровнем урожайности и массой внесенных удобрений.