С определенной вероятностью можно судить о величине разности между генеральными и выборочными характеристиками на основе предельных теорем. Предельные теоремы исходят из нормального распределения величин. Нормальное распределение показывает, что большая часть величин сосредотачивается около генеральной средней. Около 68,3% численности выборочных средних не будет выходить за пределы
2. Определение ошибок выборочного наблюдения при различных видах выборки
Расхождение между выборочной средней и генеральной средней. Теорема Чебышева-Ляпунова. Расхождения между выборочными и генеральными характеристиками называют ошибками.
Теорема Чебышева применительно к выборочному наблюдению утверждает, что ошибка репрезентативности – разность между выборочной средней и генеральной средней – при достаточно большом числе наблюдений будет сколь угодно малой, т.е.
где
Теорема была доказана П.Л. Чебышевым только для независимых событий, т.е. производстве повторной выборки. Позднее академиком А.А. Марковым было доказано сохранение этого условия для зависимых событий (бесповторной выборки).
Академик А.М. Ляпунов доказал, что вероятность отклонений выборочной средней от генеральной средней при достаточно большом числе отобранных единиц подчиняется закону нормального распределения. Из теоремы Ляпунова следует, что вероятность этих отклонений при разных значениях t может определяться по формуле:
Значения этого интеграла при разных значениях t табулированы и даются в специальных таблицах. Вероятность для некоторых t (из таблицы):
при t=1 F(t)=0,683, при t=1,5 F(t)=0,866,
при t=2 F(t)=0,954, при t=2,5 F(t)=0,988,
при t=3 F(t)=0,997, при t=3,5 F(t)=0,999.
Доверительное число t указывает, что расхождение не превысит кратную ему среднюю ошибку выборки
Средняя ошибка выборки показывает, какие возможны отклонения характеристик выборочной совокупности от соответствующих характеристик генеральной совокупности. Величина
Предельная ошибка выборки позволяет определять предельные значения характеристик генеральной совокупности при заданной вероятности и их доверительные интервалы:
Генеральная средняя (
Это означает: с заданной вероятностью можно утверждать, что значение генеральной средней можно ожидать в пределаx от
Расхождение между частостью и долей. Теорема Бернулли рассматривает ошибку выборки для альтернативного признака, т.е. признака, у которого возможны только два исхода: наличие признака (1) и его отсутствие (0). Т.е. при достаточно большом объеме выборки по мере его увеличения вероятность расхождения между долей признака в выборочной совокупности w и долей признака в генеральной совокупности p будет стремиться к единице. Математически теорема Бернулли выглядит следующим образом:
Иными словами: с вероятностью, сколько угодно близкой к единице, можно утверждать, что при достаточно большом объеме выборки частость признака (выборочная доля) сколько угодно мало отличается от его вероятности (доли в генеральной совокупности).
Поскольку
Поскольку дисперсия доли признака генеральной совокупности (pq) неизвестна, то дисперсию альтернативного признака принимают за w(1–w), тогда формула средней ошибки выборки:
Предельная величина разности между частостью и долей называется предельной ошибкой выборочной доли. О ее величине можно судить, некоторой вероятностью, определив ее по формуле:
Зная выборочную долю признака (w) и предельную ошибку выборки (
Средняя ошибка случайной выборки: а) повторный отбор
б) бесповторный отбор
где N – число единиц в генеральной совокупности
n –число единиц в выборочной совокупности
При механическом отборе ошибка выборки рассматривается по формуле собственно-случайной бесповторного отбора.
Средняя ошибкапропорциональной типической выборки определяется по формулам:
а) повторный отбор:
где
Средняя ошибка серийной выборки :
а) повторный отбор:
гдеR –общее число серий в генеральной совокупности
Межсерийная дисперсия вычисляется по формуле: