Для группировок с равными интервалами величина интервала
i = (xmax – xmin) / n, где xmax, xmin – наибольшее и наименьшее значение признака, n – число групп.
Для выполнения задания расчетной части работы представлены исходные выборочные данные по организациям одной из отраслей хозяйствования в отчетном году (выборка 20%-ная, бесповторная).
Таблица 1.
Статистическая информация о результатах производственной деятельности организации.
№ Организация | Среднеспсочная численность работникво, чел. | Выпуск продукции, млн. руб. | Фонд заработной платы, млн.руб. | Затраты на производство проудкции, млн.руб. |
1 | 162 | 36,45 | 11,34 | 30,255 |
2 | 156 | 23,4 | 8,119 | 20,124 |
3 | 179 | 46,54 | 15,036 | 38,163 |
4 | 194 | 59,752 | 19,012 | 47,204 |
5 | 165 | 41,415 | 13,035 | 33,546 |
6 | 158 | 26,86 | 8,532 | 22,831 |
7 | 220 | 79,2 | 26,4 | 60,984 |
8 | 190 | 54,72 | 17,1 | 43,776 |
9 | 163 | 40,424 | 12,062 | 33,148 |
10 | 159 | 30,21 | 9,54 | 25,376 |
11 | 167 | 42,418 | 13,694 | 34,359 |
12 | 205 | 64,575 | 21,32 | 51,014 |
13 | 187 | 51,612 | 16,082 | 41,806 |
14 | 161 | 35,42 | 10,465 | 29,753 |
15 | 120 | 14,4 | 4,32 | 12,528 |
16 | 162 | 36,936 | 11,502 | 31,026 |
17 | 188 | 53,392 | 16,356 | 42,714 |
18 | 164 | 41 | 12,792 | 33,62 |
19 | 192 | 55,68 | 17,472 | 43,987 |
20 | 130 | 18,2 | 5,85 | 15,652 |
21 | 159 | 31,8 | 9,858 | 26,394 |
22 | 162 | 39,204 | 11,826 | 32,539 |
23 | 193 | 57,128 | 18,142 | 45,702 |
24 | 158 | 28,44 | 8,848 | 23,89 |
25 | 168 | 43,344 | 13,944 | 35,542 |
26 | 208 | 70,72 | 23,92 | 54,454 |
27 | 166 | 41,832 | 13,28 | 34,302 |
28 | 207 | 69,345 | 22,356 | 54,089 |
29 | 161 | 35,903 | 10,948 | 30,159 |
30 | 186 | 50,22 | 15,81 | 40,678 |
Таким образом, если необходимо произвести группировку с равными интервалами по признаку выпуска продукции при этом выделив пять групп, то по имеющимся данным
xmax= 79,2
xmin= 14,4
n= 5
i = (79,2-14,4) / 5 = 12,96
Т.е. значение интервала составило 12,96 млн. рублей. Далее прибавляя к минимальному значению признака (в данном случае 14,4 млн. рублей) найденного значение интервала получаем верхнюю границу первой группы – 21,36. Прибавляя далее значение интервала к значению верхней границы первой группы, получаем верхнюю границу второй группы и т.д. В результате получим такие группы организации по размеру выпуска продукции (млн. рублей).
Таблица 2.
Распределение организаций по объему выпуска продукции (млн. рублей)
№ группы | Организация по объему выпуска продукции (млн. рублей) | Число организаций |
1 | 14,4-27,36 | 4 |
2 | 27,36-40,32 | 8 |
3 | 49,32-53,28 | 9 |
4 | 53,28-66,24 | 6 |
5 | 66,24-79,2 | 3 |
итого | 30 |
Структурное среднее являются особым видом средних величин. Они применяются для изучения внутреннего строения и структуру рядов распределения значений признаков. К таким показателям относятся мода и медиана.
Мода – значение признака, наиболее часто встречающееся в изучаемой совокупности. Для дискретных рядов распределения модой является вариант с наибольшей частотой.
Для интервальных вариационных рядов распределения мода рассчитывается по формуле
Mo = xMo + iMo * (fMo – fMo– 1) / (fMo–fMo– 1) + (fMo–fMo+1),
Где Mo– мода;
xMo– нижняя граница модального интервала;
iMo– величина модального интервала;
fMo– частота модального интервала;
fMo– 1 – частота интервала, предшествующего модальному;
fMo+ 1 – частота интервала, следующего за модальным.
В полученном ряду распределения первоначально по наибольшей частоте признака определим модальный интервал. Наибольшее число организаций – 9 имеют объем выпуска продукции в интервале 49,32-53,28 млн. рублей, который и является модальным. Тогда в формуле моды примет вид:
Mo= 40,32+12,96*((9-8)/((9-8)+(9-6))) = 43,56
Таким образом, мода для полученного ряда распределения равна 43,56 млн. рублей.
Медианой называется вариант, расположенный в середине упорядоченного вариационного ряда, делящий его на две равные части.
Для интервальных вариационных рядов медиана рассчитывается по формуле
Ме = хМе + i Me ( 0,5 ∑ f – SMe – 1 / f Me)
Где Ме – медиана;
х Ме - нижняя граница медианного интервала;
iMe– величина медианного интервала;
∑ f – сумма частот ряда;
SMe – 1 – сумма накопленных частот ряда, предшествующих медианному интервалу;
fMe - частота медианного интервала.
В имеющемся ряду распределения определяем модальный интервал, в котором находится порядковый номер медианы. Для этого подсчитаем сумму частот накопленного итогом до числа, превышающего половину объема совокупности (30/2 = 15).
Медианным интервалом будет являться третий интервал. Сумма накопленных частот в нем равна 21 (сумма накопленных частот второго интервала 12, т.е. меньше 15).
Тогда формула медианов примет вид:
Ме = 40,32+12,96 * ((0,5*30-12) / (9)) = 44,64
Таким образом, медиана для полученного ряда распределения равна 44,64 млн. рублей.
Средняя является обобщающей характеристикой совокупности единиц по качественно однородному признаку.
В статистике применяются различные виды средних: арифметическая, гармоническая, квадратическая, геометрическая и структурные средние – мода, медиана. Средние, кроме моды и медианы, исчисляются в двух формах: простой и взвешенной. Выбор формы средней зависит от исходных данных и содержания определяемого показателя. Наибольшее распространение получила средняя арифметическая, как простая, так и взвешенная. Она применяется в тех случаях, когда объем варьирующего признака для всей совокупности является суммой значений признаков отдельных ее единиц. Для общественных явлений характерна аддитивность (суммарность) объемов варьирующего признака, этим определяется область применения средней арифметической и объясняется ее распространенность как обобщающего показателя.
Если данные представлены в виде дискретных или интервальных рядов распределения, в которых одинаковое значение признаков объеденены в группу, имеющие различные число единиц называемые частотой или весом применяется среднее арифметическое взвешивание, имеющее следующую формулу:
x = ∑xf / ∑f
где, х – значение признака,
f – его частота.
Для расчета средней из интервального ряда распределения необходимо выразить варианты одним (дискретным) числом, т.е. от интервального перейти к дискретному ряду распределения. В качестве значений признаков в группах принимаются простые средние арифметические из верхнего и нижнего значения интервала.
Тогда, х1 = (14,4+27,36)/2 = 20,88
х2 = (27,36+40,32)/2 = 33,84
х3 = (49,32+53,28)/2=46,80
х4 = (53,28-66,24)/2=59,76
х5 = (66,24-79,2)/2=72,72
В результате образуется следующий дискретный ряд:
Таблица 3
№ группы | Организация по объему выпуска продукции (млн. рублей) | Число организаций |
1 | 20,88 | 4 |
2 | 33,84 | 8 |
3 | 46,8 | 9 |
4 | 59,76 | 6 |
5 | 72,72 | 3 |
итого | 30 |
Средний объем выпуска продукции на одну организацию будет определяться по формуле средней арифметической взвешиваемой.
х = (20,88*4+33,84*8+46,8*9+59,76*6+72,72*3) / 30 = 45,072
Таким образом, средняя арифметическая для имеющегося ряда распределения равна 45,072 млн. рублей.
Средняя величина дает обобщающую характеристику признака изучаемой совокупности, но она не раскрывает строения совокупности, которое весьма существенно для ее познания. Средняя не показывает, как располагаются около нее варианты усредняемого признака, сосредоточены ли они вблизи средней или значительно отклоняются от нее. Средняя величина признака в дух совокупностях может быть одинаково, но в одном случае все индивидуальные значения отличаются от нее мало, а в другом – эти отличия велики, т.е. в одном случае вариация признака мала, а в другом – велика, это имеет весьма важное значение для характеристика надежности средней величины.
Чем больше варианты отдельных единиц совокупности различаются между собой, тем больше они отличаются от своей средней, и наоборот – тем меньше варианты отличаются друг от друга, тем меньше они отличаются от средней, которая в таком случае будет реально представлять всю совокупность. Вот почему ограничиваться вычислением одной средней в ряде случаев нельзя. Нужны и другие показатели, характеризующие отклонения отдельных значений от общей средней.
Для измерения степени колеблемости отдельных значений признака от средней исчисляются основные обобщающие показатели вариации: дисперсия, среднее квадратическое отклонение и коэффициент вариации.
Дисперсия (δ) – это средняя арифметическая квадратов отклонений отдельных значений признака от их средней арифметической.
В зависимости от исходных данных дисперсия вычисляется по формуле средней арифметической простой или взвешенной:
δ2 = (∑(х-х)2) / n – невзвешенная (простая);
δ2 = (∑(х-х)2) f/ ∑f – взвешенная.
Среднее квадратическое отклонение представляет собой корень квадратный из дисперсии и равно
δ2 = (∑(х-х)2) / n – невзвешенное;
δ2 = (∑(х-х)2) f/ ∑f - взвешенное.