Смекни!
smekni.com

Анализ эмпирического распределения (стр. 2 из 3)

3. Оценка вариации изучаемого признака

Вариация – различия у индивидуального значения признака изучаемой совокупности. Расчёт показателей центра сопровождается расчётом показателей вариации. Показатели вариации бывают:

- Абсолютные (размах вариации, среднее линейное отклонение, дисперсия, среднее квадратическое отклонение);

- Относительные (коэффициент осцилляции, относительное линейное отклонение, коэффициент вариации) [1].

Формулы расчёта. Размах вариации:

,

где

и
– максимальное и минимальное значение признака совокупности.

Дисперсия:

,

где

– значение признака у i‑ой единицы совокупности,
– средняя арифметическая,
– частота у i‑ой единицы совокупности,
– сумма частот (
).

Среднее квадратическое (стандартное) отклонение:

.

Коэффициент вариации:

Таблица 3.1. Показатели вариации

Показатель вариации Значение
Размах вариации R 73
Дисперсия s2 227,8647
Среднее квадратическое отклонениеs 15,0952
Коэффициент вариации V 27,0980%

Размах вариации, разность между максимальным и минимальным значениями совокупности, составляет 73 единицы. Дисперсия содержательно не интерпретируется, однако является важнейшим показателем вариации, на основе которого рассчитывается ряд статистических показателей, в том числе и коэффициент вариации, в данном случае равный 27,0980%. Коэффициент вариации оценивает степень количественной однородности изучаемой совокупности. В данном случае совокупность можно признать однородной, т.к. коэффициент вариации меньше 33%.

В 1990 году в регионах России число автомобилей на 1000 человек населения отличалось от среднего по стране на 15,0952 штук.

4. Характеристика структуры распределения

К показателям структуры, кроме медианы, также относят квартили, которые делят совокупность на четыре части, децили (10 частей) и прочие показатели. Использование тех или иных характеристик зависит от цели исследования и от объёма изучаемой совокупности (с увеличением объёма растёт число групп). В данной работе необходимо подсчитать только медиану и квартили [1].

Формулы расчёта. Нижний квартиль:

.

Верхний квартиль:

.

Таблица 4.1. Показатели структуры

Показатель структуры Значение
Нижний квартиль 44,80
Медиана 56,15
Верхний квартиль 65,80

В 50% регионов России количество автомобилей на 1000 человек населения в 1990 году составляло от 44,80 до 65,80 штук.

5. Характеристика формы распределения

Форма распределения имеет следующие характеристики:

- Асимметрия;

- Эксцесс (куртозис).

Соответственно существуют коэффициенты асимметрии и эксцесса и стандартные ошибки для этих коэффициентов. Коэффициент асимметрии оценивает, насколько распределение симметрично относительно центра. Коэффициент эксцесса оценивает крутизну распределения, т.е. степень выпада вершины распределения относительно кривой нормального распределения. Эксцесс имеет смысл оценивать только тогда, когда в эмпирическом распределении присутствует несущественная асимметрия.

Формулы расчёта. Коэффициент асимметрии:

.

Стандартная ошибка:

.

Коэффициент эксцесса:

.

Стандартная ошибка:

.

Таблица 5.1. Показатели формы

Показатель формы Значение
Коэффициент асимметрии As 0,032687
Стандартная ошибка sAs 0,262651
Коэффициент эксцесса Es -0,377168
Стандартная ошибкаsEs 0,519660

По результатам подсчётов делаются следующие выводы: распределение имеет очень незначительную правостороннюю асимметрию, кроме того есть незначительный отрицательный эксцесс, это значит, что в совокупности не сформировалось «ядро» распределения.

6. Сглаживание эмпирического распределения. Проверка гипотезы о законе распределения

Процедура выравнивания, сглаживания анализируемого распределения заключается в замене эмпирических частот теоретическими, определяемыми по формуле теоретического распределения, но с учетом фактических значений переменной. На основе сопоставления эмпирических и теоретических частот рассчитываются критерии согласия, которые используются для проверки гипотезы о соответствии исследуемого распределения тому или иному типу теоретических распределении.

Выбор конкретного типа модельного распределения осуществляется исходя из самых общих соображений, опирающихся на визуальный анализ построенных графиков распределения. В практическом анализе обязательной является проверка соответствия изучаемого распределения нормальному закону распределения. Необходимость этого связана с тем, что условием применения значительного числа статистических характеристик и оценок является наличие нормального распределения.

Проверка гипотезы о нормальном распределении регионов России по числу автомобилей на душу населения в 1990 году основывается на расчёте критерия

,

где

– эмпирические абсолютные частоты,
– абсолютные частоты теоретического распределения, k – число интервалов.

Таблица 6.1. Проверка гипотезы о нормальном распределении регионов России по числу автомобилей на душу населения в 1990 году

Формулы, по которым рассчитывается плотность модельного распределения, а также формулы для расчета теоретических частот распределения могут быть легко найдены в общедоступной справочной и учебной литературе. В данной лабораторной работе используются формулы для нормального распределения.

Функция нормального распределения:

, плотность нормального распределения:

,

где

– значение изучаемого признака,
- средняя арифметическая величина,
- среднее квадратическое отклонение изучаемого признака, e, π – математические константы,
– нормированное отклонение.

Теоретические частоты нормального отклонения рассчитываются по следующей формуле:

,

где N – объём совокупности, hk – величина интервала. В моём случае вариационный ряд построен с использованием равных интервалов, следовательно:

.

Рис. 6.1. Гистограмма и расчётная кривая распределения регионов России по числу собственных легковых автомобилей на 1000 человек населения в 1990 г.


В шапке таблицы находятся следующие показатели:

,
(уточнённое значение числа степеней свободы,

,

где k – число интервалов вариационного ряда, n – число параметров теоретического распределения, определяемых по опытным данным, для нормального закона n=2, p – расчётный уровень значимости).

Принятие решения о справедливости гипотезы о законе распределения можно осуществить, ориентируясь на эмпирическое значение критерия

, который сравнивается с табличным значением
. Окончательные выводы по проверке гипотезы о законе распределения: так как
, то гипотеза о нормальном распределении регионов России по числу собственных легковых автомобилей на 1000 человек населения в 1990 г. не противоречит истине.