Выбор группировочных признаков всегда должен быть основан на анализе качественной природы исследуемого явления. Всесторонний теоретико-экономический анализ сущности и закономерностей развития явления должен быть направлен на то, чтобы в соответствии с целью и задачами исследования положить в основание группировки существенные признаки. В зависимости от конкретных условий группировочные признаки должны видоизменяться, т.е. должны быть специализированы при выделении одного и того же типа в различных условиях. Так, в настоящее время в промышленности при группировке предприятий по размерам могут использоваться показатели производственной мощности предприятий, стоимости промышленно-производственных основных фондов, численности промышленно-производственного персонала, объем потребленной энергии. Если для трудоемких отраслей в качестве группировочного признака целесообразно использовать численность работников, то для фондоемких отраслей - стоимость промышленно-производственных фондов; для энергоемких отраслей - количество потребленной электроэнергии.
Вместе с тем следует учитывать, что полную характеристику каждому типу явлений можно дать при использовании системы признаков (системы показателей). Только совокупность признаков позволяет отобразить процессы развития, всесторонне выявить реальные связи, взаимоотношения отдельных сторон процесса.
Использование одного признака, характеризующего лишь одну сторону, одну черту в развитии явления, может привести к искажению действительности, поскольку в последней, как правило, переплетаются различные, подчас противоположные тенденции и направления. Множественность признаков, характеризующих объекты, является следствием их многосторонности и многообразия реальных связей между объектами [12].
В зависимости от вида группировочных признаков различают группировки по количественным и качественным признакам.
Качественный признак отражает определенные свойства, качества данного явления и записывается в виде текста. Если качественный признак имеет мало разновидностей, то количество групп определяется числом этих разновидностей. Таковы, например, группировки населения по полу, семейному положению, образованию, деление населения на городское и сельское и т.д.
Но нередки случаи, когда качественный признак имеет большое число разновидностей, и перечислить их все не представляется целесообразным. Например, профессии рабочих, номенклатура выпускаемой продукции, виды основных фондов и т.п[4]
Под классификацией обычно понимается устойчивая номенклатура классов и групп, образованных на основе сходства и различия единиц изучаемого объекта.
Используются классификации в течение длительного времени, хотя со временем, отразив происходящие изменения в объекте наблюдения, классификации могут подвергаться более или менее существенным изменениям. Утверждаются классификации, как правило, в качестве национального или международного стандарта. Широко используются классификации отраслей народного хозяйства, отраслей промышленности, основных фондов, промышленно-производственного персонала и т.д. Любая классификация может состоять из нескольких уровней, т.е. выделенная на первом этапе классификационная группа может в дальнейшем детализироваться и т.д.
Необходимость и степень детализации классификационных групп определяется целью и задачами статистического исследования.
Рассмотрим в качестве примера классификацию элементов затрат рабочего времени. В целях изучения структуры затрат внутрисменного рабочего времени можно ограничиться такими видами затрат:
· Время работы;
· Время, неиспользованное по уважительным причинам;
· Потери рабочего времени.
Однако если ставится задача разработки мероприятий, направленных на сокращение потерь рабочего времени, необходимо использовать более развернутую классификацию фонда рабочего времени и, в частности, третьего элемента вышеприведенной классификации. Так, могут быть выделены потери рабочего времени по организационно-техническим причинам и потери по вине рабочего. В свою очередь, в составе потерь по организационно-техническим причинам могут быть выделены простои из-за отсутствия материалов, заготовок, инструмента и технической документации; простои из-за текущего ремонта оборудования и т.д.
Всестороннее статистическое изучение социально-экономических процессов и явлений наиболее плодотворно в том случае, если в основе его лежит система группировок. Система группировок - это ряд взаимосвязанных статистических группировок по наиболее существенным признакам, всесторонне отражающим важнейшие стороны изучаемых явлений.
При составлении структурных группировок на основе варьирующих количественных признаков необходимо определить количество групп и интервалы группировки.
Интервал - количественное значение, отделяющее одну единицу (группу) от другой, т.е. он очерчивает количественные границы группы.
Как правило, величина интервала представляет собой разность между максимальным и минимальным значениями признака в каждой группе.
Вопрос о количестве групп и величине интервала следует решать с учетом множества обстоятельств, прежде всего, исходя из целей исследования, значения изучаемого признака и т.д.
Количество групп и величина интервала связаны между собой: чем больше образовано групп, тем меньше интервал, и наоборот. Количество групп зависит от числа единиц исследуемого объекта и степени колеблемости группировочного признака. При небольшом объеме совокупности нельзя образовывать большое число групп, так как группы будут малочисленными.
При определении количества групп необходимо стремиться к тому, чтобы были учтены особенности изучаемого явления. Поэтому количество групп должно быть оптимальным, в каждую группу должно входить достаточно большое число единиц совокупности, что отвечает требованию закона больших чисел. Однако, в отдельных случаях представляют интерес и малочисленные группы: новое, передовое, пока не оно станет массовым, проявляется в незначительном числе фактов; поэтому задача статистики - выделить эти факты, изучить их [14].
Таким образом, при решении вопроса о численности единиц в группах нужно руководствоваться не формальными признаками, а знанием сущности изучаемого явления.
На количество выделяемых групп существенное влияние оказывает степень колеблемости группировочного признака: чем она больше, тем больше следует образовывать групп.
Ориентировочно определить оптимальное количество групп с равными интервалами можно по формуле американского ученого Стерджесса:
n=1+3,322 lgN,
где N - число единиц совокупности.
Формула Стерджесса пригодна при условии, что распределение единиц совокупности по заданному признаку приближается к нормальному, и при этом применяются равные интервалы в группах. Чтобы получить группы, адекватные действительности, необходимо руководствоваться сущностью изучаемого явления. Интервалы могут быть равные и неравные. При исследовании экономических явлений могут применяться неравные[5] интервалы. Например, по численности работающих промышленные предприятия могут быть разбиты на группы: до 100 человек, 100 - 200, 200 - 300, 300 - 500, 500 - 1000, 1000 и более человек. Это объясняется тем, что количественные изменения размера признака имеют неодинаковые значения в низших и высших по размеру признака группах: изменение количества работающих на 50-100 человек имеет существенное значение для мелких предприятий, а для крупных - не имеет.
Группировки с равными интервалами целесообразны в тех случаях, когда вариация проявляется в сравнительно узких границах и распределение является практически равномерным (например, при группировке рабочих одной профессии по размеру заработной платы, посевов пшеницы - по урожайности) [13].
Для группировок с равными интервалами величина интервала составляет
i=(xmax-xmin)/n
где
· xmax, xmin - наибольшее и наименьшее значение признака соответственно;
· n - число групп.
Если в результате деления получится дробное число и возникнет необходимость в округлении, то округлять нужно, как правило, в большую сторону.
Интервалы групп могут быть открытыми и закрытыми.
· В закрытых интервалах указаны нижняя и верхняя границы интервала.
· В открытых интервалах указана лишь одна из границ (первый или последний интервалы). Величина открытых интервалов принимается равной величине смежных с ними интервалов.
При анализе разнородных данных, например, при анализе материала, собранного в различные периоды времени, относящегося к различным отраслям промышленности, возникает необходимость применения вторичной группировки.
Вторичная группировка - образование новых групп на основе ранее осуществленной группировки.
Получение новых групп на основе имеющихся возможно двумя способами перегруппировки: объединение первоначальных интервалов путем их укрупнения и долевой перегруппировкой на основе закрепления за каждой группой определенной доли единиц совокупности.
[1] Это, прежде всего, счетный (арифметический) и логический контроль.
[2] Они образуют адресную часть и содержат, например, фамилию, имя и отчество, адрес и т.п. В случае обнаружения ошибки эти признаки позволяют обратиться к источнику информации и исправить ошибку.
[3] а отсюда и название группировки - типологическая
[4] В таких случаях разрабатывают классификацию разновидностей, т.е. сходные по своим особенностям разновидности объединяются в группы (классы).
[5] прогрессивно возрастающие или прогрессивно убывающие