Смекни!
smekni.com

Выборочный метод (стр. 3 из 4)

3.4 Точечные оценки для средней и дисперсии генеральной совокупности

Обозначим через

и σ2 среднюю и дисперсию генеральной совокупности.

Возвратная выборка объема n может рассматриваться как совокупность n независимых случайных величин Xj, имеющих одно и то же распределение, совпадающее с генеральным, для которых, следовательно:

M(Xj) =

; D(Xj)= σ2

Для точечной оценки генеральной средней

естественно использовать статистику

¾ среднюю. Используя свойства математического ожидания и дисперсии, получим:

(1.9.16)

(1.9.17)

Нетрудно видеть, что статистика θ ¾X* является состоятельной, несмещенной и эффективной оценкой параметра

.

Для точечной оценки генеральной дисперсии воспользуемся статистикой

выборочной дисперсией. Однако при ближайшем рассмотрении оказывается, что

(1.9.18)

Таким образом, статистика θ = D* является смещеннойоценкой для генеральной дисперсии σ2. Однако смещенность легко устраняется путем введения корректирующего множителя

.Статистика

(1.9.19)

(так называемая «исправленная» выборочная дисперсия) является несмещенной оценкой генеральной дисперсии σ2 и используется для ее точечной оценки.

Заметим, что при большом п отношение

и потому значение s2D*

В случае безвозвратной выборки можно показать, что точечная оценка средней будет той же (т. е.

*), а точечная оценка дисперсии должна быть заменена на:

(1.9.20)

где N — объем генеральной совокупности

В случае безвозвратной выборки изменится и выражение для D(

*), которое потребуется для построения доверительного интервала при оценке средней:

(1.9.21)

При относительно небольшом объеме выборки

и

3.5 Интервальные оценки средней

При изложении данного вопроса будем различать случаи больших и малых выборок. При этом оба случая сначала рассмотрим в более простой, с теоретической точки зрения, ситуации возвратной (повторной) выборки.

3.5.1 Большая выборка

Если объем выборки достаточно большой (практически, начиная с п > 20—30), то распределение выборочной средней

, согласно центральной предельной теореме, независимо от характера генерального распределения приближается к нормальному распределению с параметрами

М(

)=
и
)

где

генеральная средняя,

σ— генеральное среднее квадратическое отклонение,

п — объем выборки.

Таким образом, величина

распределена по стандартному нормальному закону (с математическим ожиданием M(z) = 0и средним квадратическим отклонением σ(z) = 1).

Задавшись доверительной вероятностью Р = 1 — α, определяем из равенства 2Ф(z) = 1 — α соответствующее значение za(используем при этом таблицу интегральной функции Лапласа). Тогда с вероятностью Р = 1 — α выполняется неравенство:

(1.9.22)

которое эквивалентно неравенству:

(1.9.23)

Величина

называется предельной ошибкой выборки.

Таким образом, мы имеем доверительный интервал для генеральной средней:

(

;
)

Наоборот, если задана предельная ошибка ε , а требуется определить вероятность Р, то схема решения задачи следующая:

ε→z=

→Ф(z)→P=2Ф(z) (1.9.24)

Наконец, определение объема выборки п по данным Р и ε производится по следующей схеме:

P=2Ф(z) →zn=

(1.9.25)

Пример 1.9.4. Взвешивание 50 случайно отобранных коробок печенья дало

=1200г. Определить с вероятностью Р = 0,95 доверительные границы для среднего веса коробки печенья
в генеральной совокупности, если есть основания полагать, что генеральная дисперсия σ2 = 11664.

Решение:

Дано: n=50;

=1200; σ2 =11664 (
=
108); Р = 0,95.

Из равенства Р = 2Ф(z)=0,95 по таблице значений интегральной функции Лапласа находим z=1,96, откуда:

ε=

(г)

Таким образом, получаем доверительный интервал:

1200 — 30 <

< 1200 + 30.

Пример 1.9.5 Определить, с какой доверительной вероятностью можно утверждать, что при данном объеме выборки (50 коробок) ошибка выборки не превысит 20 г.

Решение:

По величине ε=20 вычисляем

, откуда по таблице Ф(z): Р = 2Ф(1,31)≈0,81

Пример 1.9.6. Определить необходимый объем выборки n, который с вероятностью 0,99 гарантировал бы ошибку выборки не более чем ε = 20г.

Решение:

Из Р = 2Ф(z) =0,99 находим z = 2,58, откуда:

коробок

Предположение о том, что генеральная дисперсия σ2известна при неизвестной генеральной средней, на практике выполняется весьма редко. Чаще всего мы имеем лишь выборочные данные и можем дать лишь выборочную оценку s2 неизвестной дисперсии σ2.

Статистика

(1.9.26)

подчиняется закону распределения Стьюдента с v = n—1 степенями свободы. Однако при больших значениях параметра v (v ≥ 30) распределение Стьюдента практически совпадает с нормальным. Поэтому в случае больших выборок схема решения задач остается прежней, даже если вместо 'Неизве стного генерального среднего квадратического отклонения а используется его выборочная оценка s.

3.5.2. Малая выборка

Если генеральная совокупность подчинена нормальному закону распределения (что на практике имеет место очень часто), то выборочная средняя

как средняя арифметическая п нормально распределенных случайных величин также имеет нормальный закон распределения. Таким образом, величина
распределена по стандартному нормальному закону, и схема решения задач при известном генеральном среднем квадратическом отклонении σ остается прежней.

Если же генеральное среднее квадратическое отклонение σ неизвестно и приходится пользоваться его выборочной оценкой s, то используется статистика t(1.9.26), которая, как мы уже отмечали, подчинена закону распределения Стьюдента с v = n—1 степенями свободы. При v < 30 имеются значительные различия между распределением Стьюдента и нормальным распределением (тем более значительные, чем меньше v). Используя функцию распределения Стьюдента, мы можем записать равенство, аналогичное формуле Лапласа: