4. Построить вариационный ряд, характеризующий распределение регионов(стран) по величине признака, указанного в варианте (Уровень заболеваемости (на 1000 человек населения) болезни органов дыхания)
Группа регионов по уровню заболеваемости (на 1000 человек населения): болезни органов дыхания% | Число регионов в группе | Среднее значение исследуемого признака | ||
1 | 180,6 | 230,4 | 12 | 210,125 |
2 | 230,4 | 266,6 | 12 | 249,208 |
3 | 266,6 | 277,4 | 11 | 273,155 |
4 | 277,4 | 317,2 | 14 | 303,692 |
5 | 317,2 | 348,2 | 14 | 328,179 |
6 | 348,2 | 439,8 | 14 | 383,750 |
Итого: | 77 |
Анализ однородности данных в группах
№ группы | V | Выводы об однородности данных в группах | |||
1 | 210,13 | 15,10 | 227,97 | 7,19% | Коэффициент вариации V=σ/x * 100% < 17% следовательно данные абсолютно однородны |
2 | 249,21 | 11,83 | 139,88 | 4,75% | |
3 | 273,16 | 3,01 | 9,09 | 1,10% | |
4 | 303,69 | 8,32 | 69,27 | 2,74% | |
5 | 328,18 | 3,02 | 9,12 | 0,92% | |
6 | 383,75 | 27,67 | 765,85 | 7,21% |
Для построенного ряда определим:
· показатели центра распределения
· показатели вариации
· показатели дифференциации и концентрации
· показатели формы распределения
По результатам расчетов сделаем вывод о характере распределения регионов по величине признака.
Показатели центра распределения:
К показателям центра распределения относятся: средняя арифметическая, мода и медиана.
Номер группы | 1 | 2 | 3 | 4 | 5 | 6 |
Центр интервала, x’ | 205,5 | 248,5 | 272 | 297,3 | 332,7 | 394 |
Число регионов в группе, f | 12 | 12 | 11 | 14 | 14 | 14 |
Средняя арифметическая –
%Мода – наиболее часто встречающееся значение признака. Так как данный ряд имеет неравные интервалы, то модальным будет интервал с максимальной плотностью распределения.
Номер интервала (группы) | 1 | 2 | 3 | 4 | 5 | 6 |
Плотность распределения, p | 0,24 | 0,33 | 1,02 | 0,35 | 0,45 | 0,15 |
Длина интервала, i | 49,8 | 36,2 | 10,8 | 39,8 | 31 | 91,6 |
Накопленная частота, F | 12 | 24 | 34 | 38 | 52 | 66 |
Мода находится в 3 интервале (наибольшая плотность распределения, равная 1,02, соответствует именно ему). Конкретное значение моды определяется по формуле:
Медиана соответствует варианту, стоящему в середине ранжированного ряда. Положение медианы определяется её номером:
Следовательно, медианным является 5-ый интервал 317,2–348,2. Численное же значение медианы определяется по формуле:
319,414%ВЫВОД: в качестве показателя центра распределения можно выбрать любой из полученных показателей, т. к. их численные значения примерно равны.
Показатели вариации (колеблемости) признака:
Абсолютные показатели:
Размах колебаний (размах вариации):
R=Xmax-Xmin
R= 439,8–180,6 = 259,2
Для расчета показателей вариации построим дополнительную таблицу:
Группа регионов по уровню заболеваемости (на 1000 человек населения): болезни органов дыхания | Число регионов, f | x' | x' * f | d =| x' – x | | d*f | d2 * f | |
180,6 | 230,4 | 12 | 90,3 | 1083,6 | 205,49 | 2465,88 | 506713,68 |
230,4 | 266,6 | 12 | 115,2 | 1382,4 | 180,59 | 2167,08 | 391352,98 |
266,6 | 277,4 | 11 | 133,3 | 1466,3 | 162,49 | 1787,39 | 290433,00 |
277,4 | 317,2 | 14 | 138,7 | 1941,8 | 157,09 | 2199,26 | 345481,75 |
317,2 | 348,2 | 14 | 158,6 | 2220,4 | 137,19 | 1920,66 | 263495,35 |
348,2 | 439,8 | 14 | 174,1 | 2437,4 | 121,69 | 1703,66 | 207318,39 |
Итого: | 77 | 10531,9 | 964,54 | 12243,93 | 2004795,14 |
Среднее линейное отклонение:
Дисперсия:
Среднее квадратичное отклонение:
%Среднее линейное и среднее квадратическое отклонения показывают, на сколько в среднем отличаются индивидуальные значения признака от среднего его значения.
Квартильное отклонение:
Квартиль – значения признака, которые делят ранжированный ряд на четыре равные по численности части.
Сначала определим положение квартилей:
Это 2 ой интервал 230,4 – 266,6Это 3 ий интервал 266,6 – 277,4
Это 4 интервал 277,4 – 317,2
Теперь найдём значение квартилей:
, гдеxQ – нижняя граница интервала, в котором находится квартиль
SQ-1 – накопленная частота интервала, предшествующего тому, в котором находится квартиль
fQ – частота интервала, в котором находится квартиль
Итак,
Квартильное отклонение применяется вместо размаха вариации, чтобы избежать недостатков, связанных с использованием крайних значений.
Относительные показатели вариации:
Коэффициент осцилляции:
Коэффициент вариации:
Вывод: совокупность данных является однородной, т. к. коэффициент вариации не превышает 33%.
Относительное линейное отклонение:
Относительный показатель квартильной вариации:
Показатели дифференциации и концентрации:
Для оценки дифференциации используем фондовый коэффициент дифференциации и коэффициент децильной дифференциации.
Фондовый коэффициент дифференциации.
8 регионов – 10% от общего числа регионов.
Среднее значение признака для 10% самых мелких единиц совокупности (180,6; 189,2; 199; 202,9; 210,1; 213,8; 215,1; 223,3; 224,4; 229,5):
208,28Среднее значение признака для 10% самых крупных единиц совокупности (369,5; 372; 372,8; 384,4; 394,3; 396; 398,4; 399,3; 437,7; 439,8):
396,46