Смекни!
smekni.com

Ряды распределения и аналитические группировки (стр. 1 из 2)

Задача 2. Постройте ряд распределения студентов по успеваемости: 2, 3, 3, 4, 2, 5, 5, 3, 3, 4, 5, 4, 5, 5, 5, 4, 3, 3, 3, 3, 4, 4, 4, 4, 4, 5, 5, 4, 4, 4. Подсчитайте локальные и накопительные частоты. Постройте полигон и кумуляту распределения. Определите моду, медиану, среднюю, дисперсию, среднее квадратическое отклонение, коэффициент вариации.

Решение:

Ряд распределения – это ряд чисел, в котором значение изучаемого признака (варианты), расположены в определенном порядке: либо в порядке возрастания, либо убывания. Наряду с вариантами ряд распределения включает и частоты – величины, показывающие сколько раз каждая варианта встречается в данной совокупности. Сумма частот равна объему совокупности. Таким образом, ряд распределения состоит из вариант (х) и частот (f)

В зависимости от прерывности или непрерывности варьирующего признака ряды распределения удобно представлять в виде двух разновидностей: дискретного и вариационного (интервального). Дискретный ряд представляет собой ряд прерывных чисел. Например, распределение студентов по успеваемости (табл. 1). При непрерывной вариации распределение признака называется интервальным. Частоты относятся ко всему интервалу.

В зависимости от вида ряда распределения по-разному можно изобразить их графически. Если ряд дискретный – строится полигон распределения. Величина признака откладывается на оси абсцисс, частоты – на оси ординат. Вершины ординат соединяются прямыми линиями. Гистограмма распределения отличается от полигона тем, что на оси абсцисс берутся не точки, а отрезки, изображающие интервал, т.е. гистограмма, строится на


Оценка (балл) Число студентов (частоты) Накопленные
2 2 2
3 8 10
4 12 22
5 8 30
Итого 30

В основе вариационного (интервального) ряда. По накопленным частотам строится кумулятивная кривая (кумулята).
Для определения средней арифметической надо сложить все варианты и полученную сумму разделить на число единиц, входящих в совокупность (объем совокупности). Средняя арифметическая бывает простая и взвешенная. Простая средняя используется тогда, когда каждая варианта встречается лишь один раз (1). Если каждая варианта встречается несколько раз, то следует подсчитать частоты и умножить (взвесить) каждую варианту на соответствующую частоту (2).

Простая средняя арифметическая х = (1)

Средняя арифметическая взвешенная х = (2)

Средний процент влажности найдём по формуле средней арифметической взвешенной:

=
=

При расчете средней арифметической для интервального ряда нужно сначала определить середины интервалов как полусуммы значений верхней и нижней границ интервала. При наличии интервалов, где <хоткрыты» верхняя или нижняя граница, величину интервала определяют по последующему или предыдущему интервалу.

Для характеристики рядов распределения кроме средней степенной применяются структурные средние: мода и медиана.

Мода – варианта, которая наиболее часто встречается в данной совокупности, т.е. варианта с наибольшей частотой. Мо=4

Медиана – варианта, находящаяся в середине ряда распределения.

Мода для дискретного ряда определяется просто и соответствует варианте с наибольшей частотой.

Медиану для дискретного определяют по накопленным частотам делением объема совокупности пополам: по таблице 1 – 30:2=15. Это соответствует медиане, равной 4.

Размах вариации – разность между наибольшей и наименьшей вариантой:

R=

=5–2=3

Среднее квадратическое отклонение – показатель вариации, измеряющий величину, на которую все варианты в среднем отклоняются от средней арифметической.

Квадрат среднего квадратического отклонения называется дисперсией, или средним квадратом отклонений.

Найдем дисперсию:

s2=

=

s=

=0,885 – среднее квадратическое отклонение.

Наряду с абсолютным показателем колеблемости признака – средним квадратическим отклонением – широко применяется и относительный показатель – коэффициент вариации, который показывает меру колеблемости признака относительно его среднего значения и измеряется в процентах.


V=

Задача 12. Используя данные задачи 2, проверьте при уровне значимости 0,05 гипотезу о нормальном законе распределения студентов по успеваемости.

Решение:

Применяем критерий согласия – Пирсона.

Каждому ряду распределения достаточно большой совокупности объективно свойственна определенная закономерность. Моделирование кривой распределения позволяет в компактной форме дать характеристику закономерности распределения, используя ее в планировании и прогнозировании. Одним из наиболее распространенных законов распределения, применяемых в качестве стандарта, с которым сравнивают другие распределения и которое имеет важное значение для решения задач выборочного наблюдения является нормальное распределение. для того чтобы установить, верно, ли предположение о том, что эмпирическое распределение подчиняется закону нормального распределения, необходимо сравнить его с теоретическим распределением. Важно определить, являются ли различия между ними результатом действия случайных причин или обусловлены неправильно подобранной функцией.

Критерий X-Пирсона:

Значение Х 2факрi, рассчитывается по изложенной выше формуле, для которой предварительно определяются теоретические частоты.


Нормированное отклонение определяется по формуле:

Таблица – Эмпирическое и теоретическое распределение студентов по успеваемости

Оценка балл Число студентов t F(t) fm
2 2 2,1 0,0880 3 0,3
3 8 0,98 0,2017 7 0,14
4 12 0,15 0,3212 11 0,09
5 8 1,28 0,2617 9 0,11
Итого 30 х Х 30 0,64

Х 2 табл 8,95 при уровне значимости 0,05 и числе степеней свободы число интервалов – 1.

Так как Х 2 факт < Х 2 табл критического (допустимого) значения, то эмпирическое распределение соответствует нормальному.

Задача 27. На основании данных таблицы б (с 1 по 26 предприятие) о выпуске продукции и размере прибыли постройте аналитическую группировку, а также исследуйте наличие и характер взаимосвязи между ними. Рассчитайте коэффициент корреляции, детерминации. Сделайте выводы.


Таблица 6– Исходные данные деятельности предприятий, млн. руб.

№ предприятия – Выпуск продукции, Среднегодовая стоимость ОПФ, Численность работающих, чел. Потери рабочего времени, тыс. чел. дн. Прибыль.
1 65,0 54,6 340 66,0 15,7
2 78,0 73,6 700 44,0 18,0
3 41,0 42,0 100 91,0 12,1
4 54,0 46,0 280 78,0 13,8
5 66,0 62,0 410 57,4 15,5
6 80,0 68,4 650 42,0 17.9
7 45,0 36,0 170 100,0 12,8
8 57,0 49,6 260 79,8 14,2
9 67,0 62,4 380 57,0 15,9
10 81,0 71,2 680 38,0 17,6
11 92,0 78,8 800 23,1 18,2
12 48,0 51,0 210 112,0 13,0
13 59,0 60,8 230 72,0 16,5
14 680 69,0 400 55,7 16,2
15 83,0 70,4 710 36,0 16,7
16 52,0 50,0 340 85,2 14,6
17 62,0 55,0 290 72,8 14,8
18 69,0 58,4 520 54,6 16,1
19 850 83,2 720 37,0 16,7
20 70,0 75,2 420 56,4 15,8
21 71,0 67,2 420 56,0 16,4
22 64,0 64,2 400 70,4 15,0
23 72,0 65,0 430 53,6 16,5
24 88,0 76,2 790 34,9 18,5
25 73,0 68,0 560 55,4 16,4
26 740 65,6 550 52,0 16,0
27 28 96,0 87,2 810 20,4 19,1
75,0 71,8 570 53,1 16,3
29 101,0 96,0 820 12,0 19,6
30 76,0 69,2 600 46,0 17,2

Решение: