n = 1 + 3,322 lg N
При 200 единицах совокупности число групп определяется следующим образом:
n = 1 + 3,322 lg 200 = 9
Зная размах колеблемости значений изучаемого признака во всей совокупности и намечаемое число групп, величина равного интервала i определяется по формуле:
,при этом n – число групп.
В экономической практике в большинстве своем применяются неравные интервалы прогрессивно возрастающие или убывающие. Такая необходимость возникает особенно в тех случаях, когда колеблемость признака осуществляется неравномерно и в больших пределах. Например, будет неправильным применять равновеликий интервал по товарообороту для мелких, средних и крупных магазинов, поскольку разница в обороте в несколько тысяч рублей для мелких магазинов, палаток имеет решающее значение, а для крупных – несущественное. Нужны интервалы более короткие для мелких и более длинные (широкие) для крупных предприятий.
В пределах одной группировки могут применяться несколько признаков и устанавливаться разной величины интервалы. Так, магазины по количественному признаку можно подразделить на подгруппы по товарообороту, численности работников, площади торгового зала, а палатки могут быть объединены в группы только по первым двум признакам, поскольку площади торгового зала они не имеют. При этом расчленение магазинов и палаток на подгруппы, например, по числу работников, следует производить с применением разных по величине интервалов, обусловленных разной колеблемостью этого признака у изучаемых единиц.
При определении величины интервала и распределении единиц объекта наблюдения по группам важное значение имеет точное установление границ, которые в большинстве своем обозначаются указанием значений признака "от" и "до" для единиц, включаемых в данную группу. Например, группы товарных секций по числу работников обозначаются так: от 1 до 3 человек, 4-7, 8-11, 12-15 человек. Этот прием позволяет четко обозначить границы и правильно распределить единицы совокупности по группам. Применение принципов зависит от формы написания интервалов, особенно первой и последней групп. В данном примере работника, производительность которого 180 тыс. руб., включают в предпоследнюю группу, поскольку ее интервал обозначает 150-180, в последний – свыше 180 тыс. руб. Соответственно работник, имеющий выработку 90 тыс. руб., относится к первой группе. Если бы запись была "180 и более", то по принципу "исключительно" работник, имеющий выработку 180 тыс. руб., включался бы в последнюю группу.
В практике применяются оба метода, но все же предпочтительнее принцип "исключительно".
Намечаемые при группировке интервалы бывают открытые (у них указана одна граница – верхняя или нижняя) и закрытая (имеющие верхнюю и нижнюю границы). Во втором примере – первый и последний интервал являются открытыми, а второй, третий и четвертый – закрытыми. Необходимость в открытых интервалах обусловлена большой колеблемостью изучаемого признака, разбросом его количественных значений, требующих образования множества групп, если отделить их обеими границами.
Серединное значение интервалов определяется несколькими приемами. Этот показатель можно рассчитать суммированием верхней и нижней границ интервала и делением суммы пополам. В нашем примере во втором интервале середина равна 105 тыс. руб.: (90 + 120) / 2; в третьем – 135 тыс. руб.:
(120 + 150) / 2. Эти значения также получают прибавлением к серединному значению второго интервала величины равного интервала (105 + 30). Вычитая величину равного интервала из серединного значения второго интервала, будем иметь середину первого (105 – 30), а середина последнего, открытого интервала определяется прибавлением длины интервала к середине интервала предпоследней группы (165 + 30 = 195).
5. Статистические ряды распределения
Результаты сводки и группировки материалов статистического наблюдения оформляются в виде статистических рядов распределения и таблиц.
Статистические ряды распределения представляют собой упорядоченное расположение единиц изучаемой совокупности на группы по группировочному признаку. Они характеризуют состав (структуру) изучаемого явления, позволяют судить об однородности совокупности, границах ее изменения, закономерностях развития наблюдаемого объекта.
Ряды распределения, образованные по качественным признакам, называют атрибутивными. Например, распределение работников торговли по занимаемой должности, профессии, образованию; распределение товарооборота – по формам торговли, товарным группам; распределение работников по возрасту, стажу работы, производительности труда, заработной плате и другим признакам. При группировке ряда по качественному признаку получаются вариационные ряды.
Вариационные ряды состоят из двух элементов: варианты и частоты. Варианта – это отдельное значение варьируемого признака, которое он принимает в ряду распределения. Частотами называются численности отдельных вариант или каждой группы вариационного ряда. Частоты, выраженные в долях единицы или процентах к итогу, называются частностями. Сумма частот составляет объем ряда распределения.
Рассмотрим на примерах способы построения рядов распределения, прежде всего статистический ряд распределения по атрибутивному признаку (табл. 4.).
Таблица 4.
Распределение продавцов магазина по категориям
Группы продавцов по категориям | Число продавцов, чел. | В % к итогу |
Первая | 50 | 25 |
Вторая | 100 | 50 |
Третья | 50 | 25 |
Итого: | 200 | 100 |
Половину продавцов изучаемой совокупности составляет вторая категория. Остальные распределяются поровну между первой и третьей группами по данному качественному признаку. Если такую группировку составить за два периода по данному магазину, то можно выявить происходящие структурные изменения, качественные сдвиги в составе основной категории работников.
Далее рассмотрим дискретный ряд распределения (табл. 5.):
Таблица 5.
Распределение магазинов района по числу товарных секций
Число товарных секций | На 1 января 1990 г. | На 1 января 1993 г. | ||
число магазинов | в % к итогу | число магазинов | в % к итогу | |
1 | 3 | 6 | 6 | 10 |
2 | 10 | 20 | 16 | 22 |
3 | 15 | 30 | 20 | 33 |
4 | 12 | 24 | 12 | 20 |
5 | 7 | 14 | 4 | 7 |
6 | 3 | 6 | 2 | 3 |
Итого: | 50 | 100 | 60 | 100 |
В приведенных рядах частоты выражают в процентах, что позволяет посредством их сравнения обнаружить процесс уменьшения количества товарных секций в магазинах на начало 1993 г. по сравнению с началом 1990 г. Это во многом связано со сложившейся конъюнктурой рынка вызвавшей дефицит по многим товарам и приведшей к укреплению или ликвидации ряда товарных секций. Улучшение рыночной ситуации может вызвать обратный процесс.
Характер распределения изображается графически в виде полного распределения, представленного на рис. 1.:
Рис. 1. Полигон распределения магазинов района по числу товарных секций.
Рисунок 1. подтверждает сделанные выше (по данным табл. 5.) выводы. Но на практике не всегда возникает необходимость в графическом изображении информации, содержащейся в таблице. В ряде случаев можно воспользоваться одним из этих методов иллюстрации данных наблюдения, чтобы получить достаточное суждение о характере распределения изучаемого явления.
Далее рассмотрим интервальный ряд распределения на данных табл. 6.:
Таблица 6.
Распределение продавцов магазина по выработке
Число продавцов, тыс. руб. | Число продавцов, чел. | В % к итогу | Кумулятивная (накопленная) численность продавцов |
А | 1 | 2 | 3 |
80-100 | 5 | 10 | 5 |
100-120 | 10 | 20 | 15 (5 + 10) |
120-140 | 20 | 40 | 35 (15 + 20) |
140-160 | 10 | 20 | 45 (35 + 10) |
160-180 | 5 | 10 | 50 (45 + 5) |
Итого: | 50 | 100 |
Интервальный ряд распределения так же, как и дискретный, помогает выявить структуру изучаемого явления. приведенные в табл. 6. данные свидетельствуют о составе продавцов по уровню производительности труда.
Рис. 2. Гистограмма распределения продавцов по выработке.
Рис. 3. Кумуляция распределения 50 продавцов магазина по выработке.
Интервальный ряд распределения изображается графически в виде гистограммы. При ее построении на оси абсцисс откладывают интервалы ряда, высота которых равна частотам, отложенным на оси ординат. Над осью абсцисс строятся прямоугольники, площадь которых соответствует величинам произведений интервалов на их частоты. Данные таблицы 6. представлены на рис. 2.
В практике экономической работы возникает потребность в преобразовании рядов распределения в кумулятивные ряды, строящиеся по накопленным частотам. С их помощью можно определить структурные средние, прослеживать за процессом концентрации изучаемого явления. Они облегчают анализ данных ряда распределения. Например, в табл. 6. накопленная частота третьей группы показывает число продавцов или их долю с размером выработки 120-140 тыс. руб. (35 продавцов).