3.4 Точечные оценки для средней и дисперсии генеральной совокупности
Обозначим через
Возвратная выборка объема n может рассматриваться как совокупность n независимых случайных величин Xj, имеющих одно и то же распределение, совпадающее с генеральным, для которых, следовательно:
M(Xj) = ; D(Xj)= σ2
Для точечной оценки генеральной средней естественно использовать статистику
Нетрудно видеть, что статистика θ ¾X* является состоятельной, несмещенной и эффективной оценкой параметра .
Для точечной оценки генеральной дисперсии воспользуемся статистикой
Таким образом, статистика θ = D* является смещеннойоценкой для генеральной дисперсии σ2. Однако смещенность легко устраняется путем введения корректирующего множителя
(так называемая «исправленная» выборочная дисперсия) является несмещенной оценкой генеральной дисперсии σ2 и используется для ее точечной оценки.
Заметим, что при большом п отношение
В случае безвозвратной выборки можно показать, что точечная оценка средней будет той же (т. е.
где N — объем генеральной совокупности
В случае безвозвратной выборки изменится и выражение для D(
При относительно небольшом объеме выборки
3.5 Интервальные оценки средней
При изложении данного вопроса будем различать случаи больших и малых выборок. При этом оба случая сначала рассмотрим в более простой, с теоретической точки зрения, ситуации возвратной (повторной) выборки.
3.5.1 Большая выборка
Если объем выборки достаточно большой (практически, начиная с п > 20—30), то распределение выборочной средней
М(
где
σ— генеральное среднее квадратическое отклонение,
п — объем выборки.
Таким образом, величина
распределена по стандартному нормальному закону (с математическим ожиданием M(z) = 0и средним квадратическим отклонением σ(z) = 1).
Задавшись доверительной вероятностью Р = 1 — α, определяем из равенства 2Ф(z) = 1 — α соответствующее значение za(используем при этом таблицу интегральной функции Лапласа). Тогда с вероятностью Р = 1 — α выполняется неравенство:
которое эквивалентно неравенству:
Величина
Таким образом, мы имеем доверительный интервал для генеральной средней:
(
Наоборот, если задана предельная ошибка ε , а требуется определить вероятность Р, то схема решения задачи следующая:
ε→z=
Наконец, определение объема выборки п по данным Р и ε производится по следующей схеме:
P=2Ф(z) →z→n=
Пример 1.9.4. Взвешивание 50 случайно отобранных коробок печенья дало
Решение:
Дано: n=50;
Из равенства Р = 2Ф(z)=0,95 по таблице значений интегральной функции Лапласа находим z=1,96, откуда:
ε=
Таким образом, получаем доверительный интервал:
1200 — 30 <
Пример 1.9.5 Определить, с какой доверительной вероятностью можно утверждать, что при данном объеме выборки (50 коробок) ошибка выборки не превысит 20 г.
Решение:
По величине ε=20 вычисляем
Пример 1.9.6. Определить необходимый объем выборки n, который с вероятностью 0,99 гарантировал бы ошибку выборки не более чем ε = 20г.
Решение:
Из Р = 2Ф(z) =0,99 находим z = 2,58, откуда:
Предположение о том, что генеральная дисперсия σ2известна при неизвестной генеральной средней, на практике выполняется весьма редко. Чаще всего мы имеем лишь выборочные данные и можем дать лишь выборочную оценку s2 неизвестной дисперсии σ2.
Статистика
подчиняется закону распределения Стьюдента с v = n—1 степенями свободы. Однако при больших значениях параметра v (v ≥ 30) распределение Стьюдента практически совпадает с нормальным. Поэтому в случае больших выборок схема решения задач остается прежней, даже если вместо 'Неизве стного генерального среднего квадратического отклонения а используется его выборочная оценка s.
3.5.2. Малая выборка
Если генеральная совокупность подчинена нормальному закону распределения (что на практике имеет место очень часто), то выборочная средняя
Если же генеральное среднее квадратическое отклонение σ неизвестно и приходится пользоваться его выборочной оценкой s, то используется статистика t(1.9.26), которая, как мы уже отмечали, подчинена закону распределения Стьюдента с v = n—1 степенями свободы. При v < 30 имеются значительные различия между распределением Стьюдента и нормальным распределением (тем более значительные, чем меньше v). Используя функцию распределения Стьюдента, мы можем записать равенство, аналогичное формуле Лапласа: