Для удобства описания данных рассчитывают среднеквадратическое отклонение:
чел.То есть по Российской Федерации численность занятого населения по регионам варьирует в среднем на ± 507323 человека от среднего уровня (708007 чел.). Тогда коэффициент вариации составит:
или 71,66 %, что говорит о сильном варьировании численности занятого населения по регионам страны.Проверим гипотезу о законе распределения регионов России по среднегодовой численности занятого населения. Для этого на основании построенной гистограммы локальных частот (рис. 1) выдвинем основную (нулевую) гипотезу: Н0: Х в генеральной совокупности (т.е. по всей России) имеет показательное распределение.
Соответственно, альтернативная ей гипотеза:
Н1: Х в генеральной совокупности не имеет показательного закона распределения.
Х - распределение регионов по среднегодовой численности занятого населения, чел.
Для удобства расчетов теоретических частот и наблюдаемого значения статистического критерия χ² вычисления будем проводить в таблице 2.3.2.
Таблица 2.3.2
Исходные данные для проверки гипотезы о законе распределения регионов России по среднегодовой численности занятого населения
Интервалхi – xi+1 | Число регионов в группе, | pi | ni' = f·pi | |||
65510-499874 | 11 | 282692 | 0,4179 | 10,0296 | 0,9417 | 0,0939 |
499874-934238 | 7 | 717056 | 0,2263 | 5,4312 | 2,4611 | 0,4531 |
934238-1368602 | 3 | 1151420 | 0,1226 | 2,9424 | 0,0033 | 0,0011 |
1368602-2237330 | 3 | 1802966 | 0,1023 | 2,4552 | 0,2968 | 0,1209 |
Итого | 24 | 708006,75 | - | - | - | 0,6690 |
Найдем оценку параметра предполагаемого показательного распределения:
Вычислим вероятности попадания в каждый из интервалов:
Найдем теоретические частоты: ni' = f·pi=24·pi
n1' =24·0,4179 = 10,0296n3' =24·0,1226 = 2,9424
n2' =24·0,2263 = 5,4312n4' =24·0,1023 = 2,4552
После проведения сравнения теоретических и локальных частот вычисляем:
(α=0,05; k=S-r-1=3-1-1=1) = 3,8 (по таблице критических точек распределения χ², которая приведена в приложении 8), где r = 1, т.к. показательный закон распределения имеет 1 параметр (λ).
S= 3 (число групп выборки), т.к. малочисленные частоты (f< 5) объединили.
Ищут всегда правостороннюю критическую область (рис. 2).
Рис. 2. Нахождение критического значения статистики
критической области Þ нет оснований отвергать гипотезу Н0. Т.е. регионы по среднегодовой численности занятого населения в России имеют показательное распределение:
2.4 Дисперсионный анализ.
Для оценки достоверности различий между тремя и более средними величинами целесообразно применить дисперсионный анализ. Модель дисперсионного анализа, используемая в работе - двухфакторный дисперсионный анализ со смешанным эффектом факторов и случайным распределением единиц неравной численности в группах. Данный метод позволяет оценить влияние группировочного признака (фактора) на изменение результативного признака.
Дисперсионный анализ, проводимый по критерию F Фишера, основан на законе сложения (разложения) дисперсий. Согласно этому закону общая дисперсия по всей совокупности единиц наблюдения при их группировке раскладывается на систематическую (межгрупповую) и остаточную (случайную) дисперсии. [17, c.130]
В разделе 2.2 построена комбинационная группировка по численности экономически активного населения, численности мужчин в трудоспособном возрасте и ВРП на душу населения по регионам России. На основе полученной группировки построим двухфакторную комбинационную группировку с целью оценки влияния факторов на занятость населения. Результаты группировки представлены в таблице 2.4.1.
Особенностями данной задачи являются: разный эффект факторов, положенных в основание группировки, разная численность групп. Первый фактор относится к факторам постоянного эффекта, поэтому фактическое значение критерия F определяется как отношение вариации по фактору к остаточной дисперсии, в то время как по второму фактору со случайным эффектом расчет фактического значения критерия проводим как отношение дисперсии по этому фактору к дисперсии взаимодействия факторов. Разная численность единиц в группах и подгруппах нарушает равенство между общей суммой квадратов отклонений и составляющими ее компонентами, поэтому расчет объемов вариаций имеет специфику. Рассмотрим последовательность работ поэтапно. В соответствии с общей схемой проверки статистических гипотез сначала следует выдвинуть нулевую и альтернативную гипотезы.
Нулевая гипотеза: между средними величинами в генеральных совокупностях нет достоверных различий, следовательно, факторы не оказывают существенного влияния на занятость населения:
.Альтернативная гипотеза: между средними величинами в генеральных совокупностях есть достоверные различия, следовательно, факторы оказывают существенное влияние на занятость населения:
.Таким образом, проверка гипотезы о равенстве групповых средних сводится к проверке различий найденных дисперсий. Поэтому этот метод называют дисперсионным анализом.
Определим фактическое значение критерия F- распределения.
Факторы и способы формирования выборок определили тип модели. В соответствии со схемой при этом типе модели общий объем вариации может быть представлен как сумма:
Wобщ = Wфакт А + Wфакт В + Wфакт АВ + Wост.
Расчет объемов вариаций проводим в два этапа:
- на первом этапе обеспечим разложение W0 = Wфакт + Wост,
- на втором этапе – разложение Wфакт = WВРП + Wэк.акт. + Wвзаим.
Рассчитаем объемы вариаций, предусмотренные первым этапом разложения:
Wост = Wобщ - Wфакт = 0,1614 – 0,1179 = 0,0435.
Рассчитаем объем вариаций, предусмотренные вторым этапом разложения, предварительно представив данные по отдельным факторам в таблице шахматной формы (табл. 2.4.2).
Таблица 2.4.2
Зависимость среднегодовой численности занятого населения от численности экономически активного населения и ВРП на душу населения
Группы регионов по уровню численности экономически активного населения в общей численности постоянного населения | Подгруппы регионов по ВРП на душу населения, руб. | Средняя | ||
29903,7-203345,07 | 203345,07-376786,44 | 376786,44-550227,81 | ||
1 | 0,2136 | 0,0000 | 0,0000 | 0,2136 |
2 | 0,4498 | 0,0000 | 0,0000 | 0,4498 |
3 | 0,4700 | 0,4981 | 0,5623 | 0,4795 |
В среднем | 0,4515 | 0,4981 | 0,5623 | 0,4579 |
Средние величины, отражая зависимость от внесения минеральных удобрений и качества почвы, испытывают также влияние неравномерности распределения единиц в группах. На средние по группам (подгруппам) оказывает влияние распределение единиц по этому фактору. Чтобы устранить это влияние, представим данные по группам (подгруппам) как единичные наблюдения и рассчитаем по ним средние простые (табл. 2.4.3).
Таблица 2.4.3
Зависимость среднегодовой численности занятого населения от численности экономически активного населения и ВРП на душу населения