Группировка – это разбиение совокупности на группы, однородные по какому-либо признаку или объединение отдельных единиц совокупности в группы, однородные по каким-либо признакам.
В зависимости от решаемых задач выделяют виды группировок:
а) типологические – служат для выявления и характеристики социально-экономических явлений путем разделения качественно разнородной совокупности на классы, типы, однородные группы единиц в соответствии с правилами научной группировки;
б) структурные – группировка, в которой происходит разделение однородной совокупности на группы, характеризующие ее структуру по какому-либо варьирующему признаку;
в) аналитические (факторные)– основной задачей которых является исследование связей и зависимостей между изучаемыми явлениями и их признаками.
Для решения поставленной нами задачи необходимо использовать аналитическую группировку. Для этого необходимо пройти несколько этапов:
1. Правильно выбрать группировочный признак, то есть признак, по которому производится распределение единиц изучаемой совокупности на группы. Он выбирается в зависимости от решаемой задачи. В нашем случае группировочный признак – нагрузка пашни на 1 трактор.
Всю совокупность признаков можно разделить на две группы: факторные и результативные. Факторными называются признаки, под воздействием которых изменяются другие признаки, называемые результативными. В основе аналитической группировки лежит факторный признак, и каждая выделенная группа характеризуется средними значениями результативного признака.
2. Построить интервальный ряд распределения – распределение единиц совокупности по величине группировочного признака.
3. Определить сводные и обобщающие показатели по каждой группе и по всей совокупности.
4. На основании сводных и обобщающих показателей рассчитать средние и аналитические показатели по каждой группе и совокупности в целом.
5. Проанализировать полученные показатели и сделать вывод о связи между факторными и результативными признаками.
Определим методом аналитической группировки влияние нагрузки пашни на 1 трактор на урожайность сахарной свеклы.
1. Построим ранжированный ряд распределения хозяйств Семилукского, Аннинского, Хохольского и Бутурлиновского районов Воронежской области по нагрузке пашни на 1 трактор, га : 22; 39; 49; 61; 78; 83; 93; 101; 101; 107; 107; 112; 113; 116; 117; 117; 118; 122; 123; 126; 162; 163; 169; 184; 205.
2. Определим число групп, на которые необходимо разбить исходные данные: n = 1 + 3,322·lgN = 1 + 3,322·lg25 = 1 + 3,322·1,398 = 5,6. Исходные данные надо разбить на шесть групп.
3. Определим равный интервал
(ц/га).Построим интервальный ряд распределения (Таблица ) и рассчитаем его основные характеристики
.Таблица 6. Интервальный ряд распределения хозяйств Семилукского, Аннинского, Хохольского, Бутурлиновского районов по нагрузке пашни на 1 трактор.
Группы предприятий по нагрузке пашни на 1 трактор. | Число хозяйств (f) | Середины интервалов (x) | fx | x- | (x- )2 | (x- )2f | |
I | 22-53 | 3 | 37,5 | 112,5 | -74,5 | 5550,25 | 16650,75 |
II | 53-84 | 3 | 68,5 | 205,5 | -43,5 | 1892,25 | 5676,75 |
III | 84-115 | 7 | 99,5 | 696,5 | -12,5 | 156,25 | 1093,75 |
IV | 115-146 | 7 | 130,5 | 913,5 | 18,5 | 342,25 | 2395,75 |
V | 146-177 | 3 | 161,5 | 484,5 | 49,5 | 2450,25 | 7350,75 |
VI | 177-208 | 2 | 192,5 | 385 | 80,5 | 6480,25 | 12960,5 |
Итого | 25 | 690 | 2797,5 | - | - | 46128,25 |
Изобразим интервальный ряд распределения графически.
Рисунок 6. Гистограмма распределения хозяйств по нагрузке пашни на 1 трактор
Рассчитаем среднюю урожайность сахарной свеклы по формуле средней арифметической взвешенной:
(га).Рассчитаем дисперсию (взвешенную).
(га)Рассчитаем среднеквадратическое отклонение (взвешенное):
(га).Рассчитаем коэффициент вариации:
или 38,35%.Так как дисперсия и среднеквадратическое отклонение (СКО) значительны и коэффициент вариации превышает 33%, то рассчитанная нагрузка пашни на 1 трактор нетипична и недостоверна.
Если величина f распределена нормально, то все варианты отклонений от общей средней не больше, чем на величину трехкратного СКО, то есть
принадлежит интервалу . Пользуясь следствием из этого правила, можно образовать шесть групп для исходных данных (Таблица 9).Таблица 7. Интервальный ряд распределения хозяйств Семилукского, Аннинского, Хохольского и Бутурлиновского районов по нагрузке пашни на 1 трактор.
Группы | Нижняя граница | Верхняя граница | Число хозяйств (f) | ||||||||
формула | значение | формула | значение | ||||||||
I | -16,85 | 26,10 | 1 | ||||||||
II | 26,10 | 69,05 | 3 | ||||||||
III | 69,05 | 112,00 | 8 | ||||||||
IV | 112,00 | 154,95 | 8 | ||||||||
V | 154,95 | 197,90 | 4 | ||||||||
VI | 197,90 | 240,85 | 1 | ||||||||
Итого | 543,15 | 800,85 | 25 |
Построим интервальный ряд распределения хозяйств.
Таблица 8. Интервальный ряд распределения хозяйств Семилукского, Аннинского, Хохольского и Бутурлиновского районов по нагрузке пашни на 1 трактор.
Группы хозяйств по нагрузке пашни на 1 трактор | Число хозяйств, частота | Сумма накопленных частот | |
I | -16,85 - 26,1 | 1 | 1 |
II | 26,10 - 69,05 | 3 | 4 |
III | 69,05 - 112,00 | 8 | 12 |
IV | 112,00 - 154,95 | 8 | 20 |
V | 154,95 - 197,90 | 4 | 24 |
VI | 197,90 - 240,85 | 1 | 25 |
Итого | 25 | 86 |
Изобразим интервальный ряд распределения графически.
Рисунок 7. Гистограмма распределения хозяйств по нагрузке пашни на 1 трактор
Представим вПриложение 6 сводные данные по выделенным нами группам. Затем по полученным групповым сводным данным определим статико-аналитические показатели в среднем по совокупности и по каждой группе. Результат представим в Приложение 7.
Проведенная аналитическая группировка не выявила взаимосвязь между исследуемыми факторами. Проведем вторичную группировку, объединив I группу со II и V с VI (Приложение 8).
Повторная аналитическая группировка выявила взаимосвязи между факторами: с увеличение нагрузки пашни на 1 трактор урожайность сахарной свеклы снижается, себестоимость и трудоемкость повышаются, а урожайность соответственно снижается, что и подтверждается данными Приложение 9.
Так, например, в хозяйствах I группы при наименьшей нагрузке пашни 42 га, урожайность сахарной свеклы является самой высокой и составляет 403,5 ц/га., показатель трудоемкости является самым низким 0,03 чел./час, а себестоимость составила 72,6 руб., а уровень рентабельности самый высокий из всех имеющихся групп 32,3%.
Таким образом, мы выявили, что связь между нагрузкой пашни и урожайности обратная, между нагрузкой пашни себестоимостью и трудоемкостью прямая, между нагрузкой пашни и рентабельностью также обратная.
Однофакторный дисперсионный анализ.
Дисперсионный анализ представляет собой метод статистической оценки надежности проявления зависимости результативного признака от одного или нескольких факторов. Дисперсионный анализ является методом оценки выборочных характеристик связи.