Таблица 2.3 Дискретный вариационный ряд субъектов РФ по уровню безработицы за 2010 г
Уровень безработицы, % | Количество субъектов РФ |
4,8 | 1 |
5,0 | 1 |
5,2 | 1 |
5,3 | 1 |
5,4 | 1 |
5,5 | 1 |
5,7 | 2 |
5,8 | 1 |
5,9 | 1 |
6,0 | 2 |
6,1 | 1 |
6,6 | 2 |
6,7 | 3 |
6,8 | 2 |
7,0 | 2 |
7,1 | 2 |
7,4 | 1 |
7,5 | 2 |
7,6 | 1 |
7,8 | 1 |
7,9 | 1 |
8,0 | 2 |
8,5 | 1 |
8,6 | 1 |
8,8 | 2 |
8,9 | 1 |
9,0 | 1 |
Всего: 38 |
Для того чтобы выполнить структурную равноинтервальную группировку данных (таблица 2.4), следует определить число групп и ширину интервала группировки. Число групп определяется по формуле Стерджеса. Т.к. общее число единиц исследуемой совокупности равно 38, то количество групп равно шести. Ширина интервала определятся по следующей формуле
, (2.1)где H– ширина интервала группировки субъектов РФ по уровню безработицы;
Xmax, Xmin–максимальный и минимальный уровень безработицы в 38 субъектах РФ;
S– число групп в группировке субъектов РФ по уровню безработицы.
Таблица 2.4 Структурная равноинтервальная группировка субъектов РФ по уровню безработицы
№ п/п | Уровень безработицы, % | Количество субъектов РФ (частота) | Частость, % | Накопленная частота | Накопленная частость, % |
1 | 4,8-5,5 | 5 | 13,2 | 5 | 13,2 |
2 | 5,5-6,2 | 8 | 21,0 | 13 | 24,2 |
3 | 6,2-6,9 | 7 | 18,4 | 20 | 52,6 |
4 | 6,9-7,6 | 7 | 18,4 | 27 | 71 |
5 | 7,6-8,3 | 5 | 13,2 | 32 | 84,2 |
6 | 8,3-9,0 | 6 | 15,8 | 38 | 100 |
Всего | 38 | 100 |
Следует рассчитать средние значения уровня безработицы по отдельности для дискретного вариационного ряда и для интервального ряда распределения. Средняя арифметическая в интервальном ряду распределения рассчитывается через середины интервалов по формуле средней арифметической взвешенной, которая имеет следующий вид
(2.2)где xj– срединное значение уровня безработицы в группе, %;
fj– количество субъектов РФ в данной группе.
Средняя арифметическая в дискретном ряду распределения рассчитывается как средняя арифметическая взвешенная по формуле:
, (2.3)где xj– уровень безработицы, %;
fj– количество субъектов РФ с данным уровнем безработицы;
При сравнении средних, рассчитанных по обоим рядам распределения, выясняется, что они практически равны и отличаются всего лишь на 0,03%. Таким образом, незначительное отклонение значений средних друг от друга дает основание полагать, что в расчетах не было сделано ошибки.
Далее будут определены структурные средние величины – моду и медиану – для дискретного вариационного и интервального рядов распределения и сравним их между собой. Мода – это варианта с наибольшей частотой. В дискретном вариационном ряду этот показатель определяется наглядно и в данном случае равен 6,7%. Что касается интервального ряда распределения, то сначала определяется группа с наибольшей частотой (группа №2, где частота равна 8), а затем непосредственно рассчитывается мода с помощью следующей формулы:
, (2.4)где Мо – модальное значение уровня безработицы, %;
xn– нижняя граница модального интервала;
hMo– ширина модального интервала;
fMo– частота модального интервала;
fMo-1 – частота интервала, предшествующего модальному;
fMo+1 – частота интервала, следующего за модальным;
Исходя из рассчитанной моды, следует, что среди 38 субъектов РФ наиболее часто уровень безработицы составляет 6,2%. Мода, рассчитанная по дискретному вариационному ряду, отличается от моды, рассчитанной по интервальному ряду на 0,5%. Исходя из этого, следует, что расчетное значение моды сильно зависит от способа группировки первичных данных и вычисляется примерно. Точное значение можно определить только по ДВР. Таким образом, модальное значение уровня безработицы равно 6,7%.
Медианой называется серединная варианта упорядоченного вариационного ряда, расположенного в возрастающем или убывающем порядке. Чтобы определить медиану в дискретном вариационном ряду нужно узнать ее местоположение в нем. В данном случае это делается следующим образом:
, (2.5)где n– число единиц совокупности;
Далее определим медианное значение уровня безработицы как тот уровень безработицы, при котором накопленная частота равна или впервые превышает 19. Таким образом, медиана равна 6,8%.
В интервальном вариационном ряду распределения расчет медианы на первом шаге аналогичен ее расчету в дискретном вариационном ряду. Однако после определения медианного интервала, для ее непосредственного расчета применяется следующая формула:
(2.6)где Me– медианное значение уровня безработицы, %;
xn– нижняя граница медианного интервала;
hMe– ширина медианного интервала;
FMe-1 – сумма накопленных частот в интервалах, предшествующих медианному;
fMe– частота медианного интервала.
Так как медианы, рассчитанные по дискретному и интервальному вариационным рядам распределения, совпадают, то можно сделать общий вывод: все субъекты РФ, стоящие в ряду до 19 включительно имеют уровень безработицы меньший, либо равный 6,8%, стоящие после – больший, либо равный 6,8%.
Чтобы сделать вывод о характере распределения единиц совокупности, необходимо произвести расчет показателей анализа форм распределения, которыми являются коэффициент асимметрии и коэффициент эксцесса, а также расчет коэффициентов вариации форм распределения (децильный и квартильный коэффициенты дифференциации).
Коэффициент асимметрии для данной совокупности рассчитывается по следующей формуле:
, (2.7)где as– коэффициент асимметрии;
m3 – момент 3 порядка;
σ3 – дисперсия в кубе.
В свою очередь момент 3 порядка можно рассчитать следующим образом:
. (2.8)Дисперсия в кубе определяется как корень квадратный из дисперсии, возведенный в 3 степень. Пользуясь данными формулами, рассчитаем вышеназванные показатели
, .Следует заметить, что подробный расчет дисперсии произведен в главе 3.
.Так как коэффициент асимметрии положительный, то распределение правостороннее.
Теперь рассчитаем следующий коэффициент – коэффициент эксцесса:
, (2.9)где ke– коэффициент эксцесса;
m4 – момент 4 порядка;
σ4– дисперсия в квадрате.
, (2.10) , ,Так как коэффициент эксцесса меньше нуля, то распределение низковершинное.
Децильный коэффициент дифференциации рассчитывается так: