Смекни!
smekni.com

Теория вероятности (стр. 5 из 5)

Значения параметров

и
влияют на форму и положение графика на координатной плоскости. С изменением
при
кривая скользит вдоль оси x. С изменением
при
чем больше
тем более плосковершинной становится нормальная кривая. Нормальная кривая имеет точки перегиба с координатами
. Площадь, ограниченная функцией и ординатами, проведенными из точек с координатами:

составляет 0,6827 площади всей кривой;

- 0,9545 площади всей кривой;

- 0,9973 площади всей кривой.

14. Сравнительная оценка параметров эмпирического и нормального распределений. Критерий Пирсона.

Нормальный характер распределения свидетельствует о количественной однородности статистических данных и об отсутствии каких-либо причин существенным образом определяющих вариацию изучаемого явления.

Поэтому статистический анализ нередко начинается с проверки того, как фактически (эмпирически) данные ложатся на идеальную теоретическую кривую или апроксимируются (то есть выражение данных какой-либо кривой) сравнение эмпирических и теоретических данных. Производится путем оценки гипотезы нормального характера распределения. Вероятностные статистические предположения выдвигаются в виде нулевой гипотезы. Отклонения данных эмпирических от нормальных носят случайный характер. Оценку нулевой гипотезы в данном случае осуществляют графическим методом или путем расчета специальных обобщающих показателей сходства, называемых критериями согласия.

Независимо от выбранного метода генеральные ряды распределения преобразуются в дискретные и стандартизируются.

Пример: Известно, что среднемесячная заработная плата всех рабочих

=1402,42 руб., среднеквадратическое отклонение
=338,58 руб.

Данные распределения среднемесячной заработной платы.

Средне-месячная заработная плата

Число раб-ков,

(эмпир.)

(теор.)

До 700

16

600

-2,37

-2,81

0,0241

12,93

3,07

9,41

0,73

700,1-900

56

800

-1,78

-1,58

0,0819

44,04

11,96

142,95

3,25

900,1-1100

89

1000

-1,19

-0,71

0,1969

105,82

-16,82

282,90

2,67

1100,1-1300

172

1200

-0,60

-0,18

0,3337

179,35

-7,35

54,05

0,30

1300,1-1500

244

1400

-0,01

0,00

0,3989

214,44

29,56

873,70

4,07

1500,1-1700

163

1600

0,58

-0,17

0,3365

180,87

-17,87

319,44

1,77

1700,1-1900

93

1800

1,17

-0,69

0,2002

107,62

-14,62

213,80

1,99

1900,1-2100

64

2000

1,76

-1,56

0,0840

45,17

18,83

354,42

7,85

Свыше 2100,1

13

2200

2,36

-2,77

0,0249

13,38

-0,38

0,14

0,01

Итого

910

22,63

В связи с тем, что табличные значения рассчитаны для непрерывно изменяющегося признака с дисперсией равной 1, необходимо скорректировать полученные частости на фактическую величину интервала и среднеквадратическое отклонение.

, где
величина интервала. Так как все интервалы равны
, тогда
.

Графики не позволяют определить насколько существенны отклонения, поэтому более точным считается способ расчета критериев согласия. Наиболее известный из них:

В соответствии с формулой, чем сильнее совпадение кривых, тем меньше величина

. При отсутствии отклонений
, но даже при небольших отклонениях величина
зависит от числа слагаемых (то есть от числа групп). Если
>0, то необходима его вероятностная оценка (стр. 368).

- число степеней свободы и заданная вероятность несущественности отклонений эмпирических данных и теоретических. r – число групп, k - число параметров, которые нельзя изменить.

Поскольку фактическое значение

(22,63) гораздо больше табличного (5,348) даже для вероятности 0,5, гипотеза о случайном характере отклонений эмпирических данных от теоретических отклоняется.