Получение новых групп на основе имеющихся возможно двумя способами перегруппировки: объединением первоначальных интервалов (путём их укрупнения) и долевой перегруппировкой (на основе закрепления за каждой группой определенной доли единиц совокупности).
Статистические ряды распределения.
После определения группировочного признака и границ групп строится ряд распределения.
Статистический ряд распределения представляет собой упорядоченное распределение единиц изучаемой совокупности на группы по определенному варьирующему признаку. Он характеризует состав (структуру) изучаемого явления, позволяет, судить об однородности совокупности, закономерности распределения и границах варьирования единиц совокупности.
Ряды распределения, построенные по количественному признаку, называются вариационными. Например, распределение продукции по стоимости, по массе, по количеству затраченного времени на изготовление единицы продукции.
Вариационные ряды распределения состоят из двух элементов вариантов и частот.
Вариантами называются числовые значения количественного признака в вариационном ряду распределения. Они могут быть положительными и отрицательными, абсолютными и относительными. Так, при группировке предприятий по результатам хозяйственной деятельности варианты положительные (прибыль) и отрицательные, (убыток) числа. Частоты – это численности отдельных вариантов или каждой группы вариационного ряда, т.е. это числа, показывающие, как часто встречаются те или иные варианты в ряду распределения. Сумма всех частот называется объемом совокупности и определяет число элементов всей совокупности.
Частости – это частоты, выраженные в виде относительных величин, (долях единиц или процентах). Сумма частостей равна единице или 100%. Замена частот частостями позволяет сопоставлять вариационные ряды с разным числом наблюдений.
Вариационные ряды в зависимости от характера вариации подразделяются на дискретные и интервальные. Дискретные вариационные ряды основаны на дискретных (прерывных) признаках, имеющих только целые значения (например; количество готовой продукции на складе(шт.)), интервальные – на непрерывных признаках (имеющих любые значения, в том числе и дробные).
Первым шагом в упорядочении первичного ряда является его ранжирование; т.е. расположение всех вариантов в возрастающем (или убывающем) порядке.
Например, масса изделий 22 наименований характеризуется следующими данными:
2, 4, 5, 5, 6, б, 5, 6, 6, 7, 7, 8, 8, 9, 10, 11, 4, 3, 3, 4, 4 и 5 килограммов. Ранжированный ряд:
2, 3, 3, 4, 4, 4, 4, 5, 5, 5, 5, 6, 6, 6, 6, 7, 7, 8, 8, 9, 10, 11 килограммов. При рассмотрении Первичных данных можно видеть, что одинаковые варианты признака у отдельных единиц повторяются (здесь и далее f – частота повторений, n – объём изучаемой совокупности). Способы построения дискретных и интервальных рядов различны. Для построения дискретного ряда с небольшим числом вариантов выписываются все встречающиеся варианты значений признака, обозначаемые через Xi а затем подсчитывается частота повторения каждого варианта fi.. Ряд распределения принято оформлять в виде таблицы, состоящей из двух колонок (или строк), в одной из которых приводятся варианты, а в другой – частоты. Построение дискретного вариационного ряда не составляет труда.
Проиллюстрируем построение интервального вариационного ряда по данным приведенного выше примера распределения изделий по массе.
Для нашего примера, согласно формуле Стерджесса (4), при N=22 число групп п = 5. Зная число групп, определим величину интервала по формуле (5):
i = (Xmax – Xmin) / n = (11 – 2) / 5 = 1,8 ≈ 2
В результате получим следующий ряд распределения изделий по массе (Σf = 22):
X… 2 – 4 4 – 6 6 – 8 8 – 10 10 – 12
f… 3 8 6 3 2
Как видно из данного распределения, основная масса рабочих имеет стаж работы от 4 до 8 лет[3].
Глава 2. Расчётная часть
Задание 1
По исходным данным табл. 1:
1. Постройте статистический ряд распределения организаций по признаку уровень выпуска продукции, образовав пять групп с равными интервалами.
2. Постройте графики полученного ряда распределения. Графически определите значения моды и медианы.
3. Рассчитайте характеристики ряда распределения: среднюю арифметическую, среднее квадратическое отклонение, коэффициент вариации.
4. Вычислите среднюю арифметическую по исходным данным (табл. 1), сравните её с аналогичным показателем, рассчитанным в п. 3 настоящего задания. Объясните причину их расхождения.
Сделайте выводы по результатам выполнения задания.
Таблица 1 Исходные данные
№ организации | Выпуск продукции, млн. руб. | Среднесписочная численность работников, чел. | Затраты на Фонд производство заработной продукции платы, млн. руб. млн. руб. |
1 | 36,450 | 162 | 11,340 30,255 |
2 | 23,400 | 156 | 8,112 20,124 |
3 | 46,540 | 179 | 15,036 38,163 |
4 | 59,752 | 194 | 19,012 47,204 |
5 | 41,415 | 165 | 13,035 33,546 |
6 | 26,860 | 158 | 8,532 22,831 |
7 | 79,200 | 220 | 26,400 60,984 |
8 | 54,720 | 190 | 17,100 43,776 |
9 | 40,424 | 163 | 12,062 33,148 |
10 | 30,210 | 159 | 9,540 25,376 |
11 | 42,418 | 167 | 13,694 34,359 |
12 | 64,575 | 205 | 21,320 51,014 |
13 | 51,612 | 187 | 16,082 41,806 |
14 | 35,420 | 161 | 10,465 29,753 |
15 | 14,400 | 120 | 4,320 12,528 |
16 | 36,936 | 162 | 11,502 31,026 |
17 | 53,392 | 188 | 16,356 42,714 |
18 | 41,000 | 164 | 12,792 33,62 |
19 | 55,680 | 192 | 17,472 43,967 |
20 | 18,200 | 130 | 5,850 15,652 |
21 | 31,800 | 159 | 9,858 26,394 |
22 | 39,204 | 162 | 11,826 32,539 |
23 | 57,128 | 193 | 18, 142 45,702 |
24 | 28,440 | 158 | 8,848 23,89 |
25 | 43,344 | 168 | 13,944 35,542 |
26 | 70,820 | 208 | 23,920 54,454 |
27 | 41,832 | 166 | 13,280 34,302 |
28 | 69,345 | 207 | 22,356 54,089 |
29 | 35,903 | 161 | 10,948 30,159 |
30 | 50,220 | 186 | 15,810 40,678 |
Решение:
1. Построим интервальный вариационный ряд с 5 равными интервалами, для этого построим ранжированный ряд предприятий по производительности труда в порядке возрастания. Результаты представлены в таблице 2.
Таблица 2 Ранжированный ряд по признаку выпуск продукции
№ организации | Выпуск продукции, млн. руб. | Среднесписочная численность работников, чел. | Фонд заработ- Затраты на ной платы, производство млн.руб. продукции, млн. руб. |
15 | 14,4 | 120 | 4,320 12,528 |
20 | 18,2 | 130 | 5,850 15,652 |
2 | 23,4 | 156 | 8,112 20,124 |
6 | 26,86 | 158 | 8,532 22,831 |
24 | 28,44 | 158 | 8,848 23,89 |
10 | 30,21 | 159 | 9,540 25,376 |
21 | 31,8 | 159 | 9,858 26,394 |
14 | 35,42 | 161 | 10,465 29,753 |
29 | 35,903 | 161 | 10,948 30,159 |
1 | 36,45 | 162 | 11,340 30,255 |
16 | 36,936 | 162 | 11,502 31,026 |
22 | 39,204 | 162 | 11,826 32,539 |
9 | 40,424 | 163 | 12,062 33,148 |
18 | 41 | 164 | 12,792 33,62 |
5 | 41,415 | 165 | 13,035 33,546 |
27 | 41,832 | 166 | 13,280 34,302 |
11 | 42,418 | 167 | 13,694 34,359 |
25 | 43,344 | 168 | 13,944 35,542 |
3 | 46,54 | 179 | 15,036 38,163 |
30 | 50,22 | 186 | 15,810 40,678 |
13 | 51,612 | 187 | 16,082 41,806 |
17 | 53,392 | 188 | 16,356 42,714 |
8 | 54,72 | 190 | 17,100 43,776 |
19 | 55,68 | 192 | 17,472 43,967 |
23 | 57,128 | 193 | 18,142 45,702 |
4 | 59,752 | 194 | 19,012 47,204 |
12 | 64,575 | 205 | 21,320 51,014 |
28 | 69,345 | 207 | 22,356 54,089 |
26 | 70,82 | 208 | 23,920 54,454 |
7 | 79,2 | 220 | 26,400 60,984 |
Итого | 1320,64 |
В случае если интервалы равные, то их величина определяется по формуле (5):
I = (Xmax - Х min) / n = (79,2 – 14,4) / 5 = 12,96 млн. руб.
Xmax и Х min - соответственно максимальная и минимальная величина выпуска продукции.
Получаем следующие интервалы выпуска продукции, млн. руб.:
Таблица 3 Интервалы выпуска продукции
Нижняя граница | Верхняя граница |
14,4 | 27,36 |
27,36 | 40,32 |
40,32 | 53,28 |
53,28 | 66,24 |
66,24 | 79,2 |
На основе полученных данных составим ряд распределения табл. 4:
Таблица 4 Распределение предприятий по уровню выпуска продукции
Группы предприятий по выпуску продукции, млн. руб. | Число предприятий | ||
В группе | В % к итогу | ||
14,4 | 27,36 | 4 | 13,33% |
27,36 | 40,32 | 8 | 26,66% |
40,32 | 53,28 | 9 | 30% |
53,28 | 66,24 | 6 | 20% |
66,24 | 79,2 | 3 | 10% |
Итого: | 30 | 100,00% |
Из таблицы видно, что распределение предприятий по уровню выпуска продукции отличается от нормального. Для нормального распределения характерно равенство числа единиц попавших в первую и последнюю, вторую и предпоследнюю группы, чего не наблюдается в данном случае.