Использование в статистических исследованиях ЭВМ и статистической теории распознавания образов позволило разработать метод группировки совокупности единиц одновременно по множеству характеризующих признаков. Такие группировки получили название многомерных.
Многомерная группировка или многомерная классификация основана на измерении сходства или различия между объектами (единицами). Мерой близости между объектами могут служить различные критерии. Самой распространенной мерой близости является евклидово расстояние между объектами, представленными точками в n-мерном пространстве. Группы (кластеры) формируются на основании близости объектов одновременно по всему комплексу признаков, описывающих объект. Нахождение этих групп осуществляется методами кластерного анализа на ЭВМ.
Выполнение группировки по количественному признаку.
При составлении структурных группировок на основе варьирующих количественных признаков необходимо определить количество групп и интервалы группировки.
Интервал - количественное значение, отделяющее одну единицу(группу) от другой, т.е. интервал очерчивает количественные границы групп.
Величина интервала представляет собой разность между максимальным и минимальным значениями признака в каждой группе.
Количество групп и величина интервала связаны между собой: чем больше образованно групп, тем меньше интервал, и наоборот. Количество групп зависит от числа единиц исследуемого объекта и степени колебаемости группировочного признака.
При определении количества групп необходимо стремиться к тому, чтобы были учтены особенности изучаемого явления. Поэтому число групп должно быть оптимальным, в каждую группу должно входить достаточно большое число единиц совокупности, что отвечает требованию закона больших чисел.
На количество выделяемых групп существенное влияние оказывает степень вариации группировочного признака: чем она больше, тем больше следует образовать групп.
Ориентировочно определить оптимальное количество групп с равными интервалами можно по формуле американского ученого Стерджесса:
n=1+3,322 lgN,
где N-численность единиц совокупности.
Получаем следующее соотношение:
N | 15-24 | 25-44 | 45-89 | 90-179 | 180-359 | 360-719 |
n | 5 | 6 | 7 | 8 | 9 | 10 |
Формула Стерджесса пригодна при условии, что распределение единиц совокупности по данному признаку приближается к нормальному и при этом применяются равные интервалы в группах.
Интервалы могут быть равные и неравные. При исследовании экономических явлений могут применяться неравные интервалы. Это объясняется тем, что количественные изменения размера признака имеют неодинаковые значения в низших и низших по размеру признака группах.
Группировки с равными интервалами целесообразны в тех случаях, когда вариация проявляется в сравнительно узких границах и распределение является практически равномерным.
Для группировок с равными интервалами величина интервала:
i=(Xmax-Xmin)/n,
где Xmax, Xmin- наибольшее и наименьшее значения признака, n - число групп.
Если в результате деления получится не целое число и возникает необходимость в округлении, то округлять нужно ,как правило, в большую сторону, а не в меньшую.
Интервалы групп могут быть закрытыми, когда указана верхняя и нижняя границы, и открытыми, когда указана лишь одна из границ.
Статистические ряды распределения.
После определения группировочного признака и границ групп строится ряд распределения.
Статистический ряд распределения представляет собой упорядоченное распределение единиц изучаемой совокупности на группы по определенному варьирующему признаку. Он характеризует состав (структуру) изучаемого явления, позволяет судить об однородности совокупности, закономерности распределения и границах варьирования единиц совокупности.
Ряды распределения, построенные по атрибутивным признакам, называются атрибутивными. Примером атрибутивных рядов могут служить распределения населения по полу, занятости, национальности, профессии и т.д.
Ряды распределения, построенные по количественному признаку, называются вариационными. Например, распределение населения по возрасту, рабочих - по стажу работы, заработной плате и т.д.
Вариационные ряды распределения состоят из двух элементов: вариантов и частот.
Числовые значения количественного признака в вариационном ряду распределения называют вариантами. Они могут быть положительными и отрицательными, абсолютными и отрицательными.
Частоты - это численности отдельных вариантов или каждой группы вариационного ряда, т.е. это числа, показывающие, как часто встречаются те или иные варианты в ряду распределения. Сумма всех частот называется объемом совокупности и определяет число элементов всей совокупности.
Частоты - это частоты, выраженные в виде относительных величин. Сумма частностей равна единице или 100%.
Вариационные ряды в зависимости от характера вариации подразделяют на дискретные и интервальные.
Первым шагом в упорядочении первичного ряда является его ранжирование, т.е. расположение всех вариантов в возрастающем или убывающем порядке.
1.2 Метод рядов динамики: понятие, содержание, система показателей
Понятие о рядах динамики.
Ряд динамики представляет собой ряд расположенных в хронологической последовательности числовых значений статистического показателя, характеризующих изменение общественных явлений во времени.
В каждом ряду динамики имеются два основных элемента: время и конкретное значение показателя (уровень ряда).
Уровни ряда - это показатели, числовые значения которых составляют динамический ряд. Время - это моменты или периоды, к которым относятся уровни.
Построение и анализ рядов динамики позволяют выявить и измерить закономерности развития общественных явлений во времени. Выявление основной тенденции в изменении уровней, именуемой трендом, является одной из главных задач анализа рядов динамики.
По времени, отраженному в динамических рядах, они разделяются на моментальные и интервальные.
Моментальным рядом динамики называется такой ряд, уровни которого характеризуют состояние явления на определенные даты (моменты времени).
Интервальным (периодическим) рядом динамики называется такой ряд, уровни которого характеризуют размер явления за конкретный период времени (год, квартал, месяц).
Уровни в динамическом ряду могут быть представлены абсолютыми, средними или относительными величинами.
По расстоянию между уровнями ряды динамики подразделяются на ряды с равностоящими и неравностоящими уровнями по времени.
Если в рядах динамики прерывающиеся или неравномерные интервалы времени. То такие ряды являются неравностоящими.
Правила построения рядов динамики.
При построении рядов динамики статистические данные должны быть сопоставимы по территории, кругу охватываемых объектов, единицам измерения, времени, ценам и др.
Сопоставимость по территории предполагает одни и те же границы территории.
Сопоставимость по кругу охватываемых объектов означает сравнение совокупностей с равным числом элементов.
При этом нужно иметь в виду, что сопоставляемые показатели динамического ряда должны быть однородны по экономическому содержанию и границам объекта, который они характеризуют.
Сопоставимость по времени регистрации для интервальных рядов обеспечивается равенством периодов времени, за которые приводятся данные.
Сопоставимость по ценам. При проведении к сопоставимому виду продукции, измеренной в стоимостных показателях, трудность заключается в том, что, во-первых, с течением времени происходит непрерывное изменение цен, а во-вторых, существует несколько видов цен. Поэтому на практике количество продукции, произведенной в разные периоды, оценивают в ценах одного и того же базисного периода, которые называют неизменными или сопоставимыми ценами.
Сопоставимость по методологии расчета. При определении уровней динамического ряда необходимо использовать единую методологию их расчета.
Показатели анализа ряда динамики.
При изучении динамики общественных явлений возникает проблема описания интенсивности изменения и расчета средних показателей динамики.
Анализ интенсивности изменения во времени осуществляется с помощью показателей, получаемых в результате сравнения уровней, к ним относятся: абсолютный прирост, темп роста, темп прироста, абсолютное значение одного процента прироста.
Система средних показателей включает средний уровень ряда, средний абсолютный прирост, средний темп роста. Средний темп прироста.
Показатели анализа динамики могут вычисляться на постоянной и переменных базах сравнения. При этом принято называть сравниваемый уровень отчетным, а уровень, с которым производится сравнение,- базисным.
Для расчета показателей анализа ряда динамики на переменной базе каждый последующий уровень ряда сравнивается с предыдущим. Вычисленные таким образом показатели анализа динамики называются цепными.
Важнейшим статистическим показателем анализа динамики является абсолютный прирост (сокращение), т.е. абсолютное изменение, характеризующее увеличение или уменьшение уровня ряда за определенный промежуток времени. Абсолютный прирост с переменной базой называют скоростью роста.
Для оценки интенсивности, т.е. относительного изменения уровня динамического ряда за какой-либо период времени исчисляют темпы роста (снижения).
Показатель интенсивности изменения уровня ряда, выраженный в долях единицы, называется коэффициентом роста, а в процентах - темпом роста.
Одной из важнейших задач статистики является определение в рядах динамики общей тенденции развития явления.
Основной тенденцией развития (трендом) называется плавное и устойчивое изменение уровня явления во времени, свободное от случайных колебаний.