Смекни!
smekni.com

Основные понятия статистики (стр. 6 из 13)

По данным таблицы вычислим показатели вариации

1. Размах вариации R = 210 – 150 = 60 шт.

2. Среднее линейное отклонение

=
шт.

3. Дисперсия

= 324.

4. Среднее квадратическое отклонение

= 18 шт.

6. Коэффициент вариации

% = 9,8%.

Как видно из расчётов, коэффициент вариации составляет 9,8% и, следовательно, типичность среднего значения высока.

В ряде задач статистическая совокупность оказывается разделенной на несколько групп. В этом случае вычисляют три вида дисперсий: общую

, межгрупповую
и среднюю внутригрупповую дисперсию
.

Рассмотрим статистическую совокупность, которая разделена на mгрупп. (Это разделение может совпадать или не совпадать с группировкой той же совокупности, представленной вариационным рядом, в котором совокупность разделена на kгрупп). Обозначим количество элементов, попавших в i-ю группу через

(
).

Общая дисперсия

характеризует рассеяние признака по всей изучаемой совокупности под влиянием всех факторов, формирующих уровень признака у единиц совокупности, и определяется по формуле (5.1)

, (8)

где

– общая средняя арифметическая для всей изучаемой совокупности.

Межгрупповая дисперсия

отражает различия в величине изучаемого признака, возникающие под влиянием фактора, положенного в основу группировки, и показывает рассеяние групповых средних вокруг средней величины признака в совокупности

, (9)

где

– средняя арифметическая по i-й группе.

Внутригрупповая дисперсия используется для оценки рассеяния признака внутри группы. Она характеризует вариацию, не зависящую от значений признака, положенного в основу группировки (факторного признака), и возникающую под влиянием других факторов. Средняя внутригрупповая дисперсия вычисляется по формуле

, (10)

Здесь

– дисперсия признака в i-й группе, где
– частота признака
в i-й группе.

Общая, межгрупповая и средняя внутригрупповая дисперсии связаны правилом сложения дисперсий

=
.

Смысл этого соотношения заключается в том, что общая дисперсия, определяемая влиянием всех факторов, равна дисперсии, определяемой фактором группировки, и дисперсии, возникающей под влиянием прочих факторов.

В статистическом анализе вычисляют характеристики, зависящие от распределения частот по вариантам – от структуры распределения. Поэтому эти характеристики получили название структурных средних величин. К таким показателям относятся мода и медиана.

Мода

– значение признака, наиболее часто встречающееся в ряду распределения. Мода определяется различными способами в зависимости от вида вариационного ряда. В дискретном вариационном ряду мода – вариант с максимальной частотой в изучаемой совокупности.

Пример. По данным статистического наблюдения получены значения величины X = {5, 3, 1, 2, 1, 4, 1, 5, 2, 1, 4, 2, 1, 1, 6}. Определить моду.

Построим вариационный ряд

X 1 1 1 1 1 1 2 2 2 3 4 4 5 5 6

Соответствующий сгруппированный вариационный ряд имеет вид:


X 1 2 3 4 5 6
F 6 3 1 2 2 1

Значение признака Х, имеющего наибольшую частоту (6) равно 1. Следовательно, для данного вариационного ряда

= 1.

При отыскании моды в интервальном ряду сначала определяют модальный интервал – интервал, имеющий наибольшую частоту. Затем мода рассчитывается по формуле

, (11)

где

– нижняя граница модального интервала;
– величина модального интервала;
– частота модального интервала, fm-1 – частота интервала, предшествующего модальному, fm+1 – частота интервала, следующего за модальным.

Пример. По данным статистического наблюдения построен интервальный ряд распределения рабочих по заработной плате

Зар. плата (руб.) 1300-1400 1400-1500 1500-1600 1600-1700 1700-1800
Число рабочих (частота) 20 40 55 60 35
Кумулятивная частота 20 60 115 175 210

Найти моду.

Модальным интервалом является интервал (1600-1700). Подставив данные таблицы в формулу (5.5), получим

o =

1616,7 руб.

Медиана

– значение признака (вариант), которое делит вариационный ряд на две равные части, одна из которых – со значениями признака меньше медианы, вторая – со значениями признака больше медианы.

Медиана для дискретных и интервальных вариационных рядов определяется по-разному. Если дан дискретный несгруппированный вариационный ряд и число вариантов nнечетно, то

=
, где
; если число вариантов nчетное,
= ( x
+ x
) / 2, где
.

Пример. По данным примера 5.2 найти медиану дискретного вариационного ряда.

Число вариантов nнесгруппированного ряда равно 15, следовательно, k = (n + 1)/2 = 8, и медиана равна 2.

Пример 5.3. Определить медиану по данным, приведенным в таблице

Размер заработной платы (тыс. руб.) Число работников (частота) Накопленная частота
5800 30 30
6000 45 75
6200 80 155
6400 60 215
6600 35 250

Решение. Сумма частот n = 250 – четно,

= 125.
= 6200.