Если s остается неизменной, а
изменяется, то кривые нормального распределения имеют одинаковую форму, но отличаются положением максимальной ординаты.Особенности кривой нормального распределения (рис.2):
Кривая симметрична и имеет максимум в точке, где
.Кривая асимптотически приближается к оси абсцисс, продолжаясь в обе стороны до бесконечности.
Кривая имеет две точки перегиба при t = ±1, т.е. при таких значениях х, когда отклонение варианты от средней равно среднему квадратическому отклонению:
.При нормальном распределении 68,3% всех исследуемых частот находятся в пределах от
до . В промежутке, ограниченном точками , находится 95,4%, а в промежутке , соответственно, 99,7% всех частот исследуемой совокупности (рис.1).y
ss х
Рис.1. Кривая нормального распределения
В анализе распределения большое значение имеет, насколько эмпирическое распределение признака соответствует нормальному. Для этого частоты фактического распределения нужно сравнить с теоретическими, которые характерны для нормального распределения. Значит, нужно по фактическим данным вычислить теоретические частоты кривой нормального распределения, являющиеся функцией нормированных отклонений (см. уравнение кривой
).Иначе говоря, эмпирическую кривую распределения нужно выравнить кривой нормального распределения.
Порядок расчета теоретических частот кривой нормального распределения:
по эмпирическим данным рассчитывают среднюю арифметическую ряда
и среднее квадратическое отклонение s; находят нормированное отклонение t каждой варианты от средней арифметической; по таблице распределения функции определяют ее значения; вычисляют теоретические частоты по формуле: ,где N- объем совокупности,
і- длина интервала;
строят и сравнивают графики эмпирические и теоретических частот (кривых распределения).
Сумма теоретических и эмпирических частот должна быть равной, но может не совпадать из-за округлений в расчетах.
Так как все предположения о характере того или иного распределения - это гипотезы, то они должны быть подвергнуты статистической проверке с помощью критериев согласия, которые дают возможность установить, когда расхождения между теоретическими и эмпирическими частотами следует признать несущественными, т.е. случайными, а когда - существенными (неслучайными). Таким образом, критерии согласия позволяют отвергнуть или подтвердить правильность выдвинутой при выравнивании ряда гипотезы о характере распределения в эмпирическом ряду.
Существует ряд критериев согласия. Чаще применяют критерии Пирсона, Романовского и Колмогорова.
Критерий согласия Пирсона
- один из основных:где k- число групп, на которые разбито эмпирическое распределение,
- наблюдаемая частота признака в i-й группе, - теоретическая частота.Для распределения
составлены таблицы, где указано критическое значение критерия согласия для выбранного уровня значимости и степеней свободы df. (или )Уровень значимости
- вероятность ошибочного отклонения выдвинутой гипотезы, т.е. вероятность того, что будет отвергнута правильная гипотеза. В статистике пользуются тремя уровнями: a= 0,10, тогда Р=0,90 (в 10 случаях их 100 может быть отвергнута правильная гипотеза); a= 0,05, тогда Р=0,95; a= 0,01, тогда Р=0,99.Число степеней свободы df определяется как число групп в ряду распределения минус число связей: df = k-z. Под числом связей понимается число показателей эмпирического ряда, использованных при вычислении теоретических частот, т.е. показателей, связывающих эмпирические и теоретические частоты.
Например, при выравнивании по кривой нормального распределения имеется три связи:
; ; .Поэтому при выравнивании по кривой нормального распределения число степеней свободы определяется как df = k-3.
Для оценки существенности расчетное значение
сравнивается с табличным .При полном совпадении теоретического и эмпирического распределений
, в противном случае >0. Если > , то при заданном уровне значимости и числе степеней свободы гипотезу о несущественности (случайности) расхождений отклоняем.В случае, если
, заключаем, что эмпирический ряд хорошо согласуется с гипотезой о предполагаемом распределении и с вероятностью Р= (1-a) можно утверждать, что расхождение между теоретическими и эмпирическими частотами случайно.Критерий согласия Пирсона используется, если объем совокупности достаточно велик
, при этом частота каждой группы должна быть не менее 5.Критерий Романовского с основан на использовании критерия Пирсона, т.е. уже найденных значений
, и числа степеней свободы df:Он удобен при отсутствии таблиц для
.Если с<3, то расхождения распределений случайны, если же с>3, то не случайны и теоретическое распределение не может служить моделью для изучаемого эмпирического распределения.
Критерий Колмогорова l основан на определении максимального расхождения между накопленными частотами и частостями эмпирических и теоретических распределений:
или ,где D и d- соответственно максимальная разность между накопленными частотами
и накопленными частостями эмпирического и теоретического рядов распределений;N- число единиц совокупности.
Рассчитав значение l, по таблице Р (l) определяют вероятность, с которой можно утверждать, что отклонения эмпирических частот от теоретических случайны. Вероятность Р (l) может изменяться от 0 до 1. При Р (l) =1 происходит полное совпадение частот, Р (l) =0 - полное расхождение. Если l принимает значения до 0,3, то Р (l) =1.
Основное условие использования критерия Колмогорова - достаточно большое число наблюдений.
Симметричный вариационный ряд - это ряд, в котором частоты вариант, равностоящих от средней влево и вправо, равны между собой.
Необходимым, но недостаточным условием симметричности является равенство трех характеристик: средней арифметической, моды и медианы:
= Ме=Mо