До настоящего времени на практике в качестве способа отбора обычно применяют механическое формирование выборочной совокупности, не связанное с процедурами получения случайных чисел. При этом способе отбирается каждый (n/N)-й элемент генеральной совокупности. Например, если имеется совокупность из 100 тыс. ед. и требуется выборка в 1000, то в нее попадет каждый сотый элемент. Если единицы в совокупности не ранжированы относительно изучаемого признака, то первый элемент выбирается наугад, произвольно, а если ранжированы, то из середины первой сотни. При достаточно большой совокупности этот способ отбора близок к собственно случайному, при условии, что применяемый список не составлен таким образом, чтобы какие-то единицы совокупности имели больше шансов попасть в выборку. К сожалению, это условие может нарушается. Так, использование 25%-й механической выборки при обследовании городского населения может привести к тому, что для каждого этажа при 4-квартирных площадках будет выбран один и тот же тип квартир (например, только трехкомнатные).
Отбор единиц из неоднородной совокупности осуществляется так называемым стратифицированным (расслоенным) способом, дающим модифицированную форму выборки. В этом случае генеральную совокупность предварительно разбивают на однородные группы с помощью типологической группировки, после чего производят отбор единиц из каждой группы в выборочную совокупность случайным или механическим способом. Этот метод гарантирует, что единицы разных групп (слоев) включаются в выборку пропорционально их численности в генеральной совокупности.
Особая форма составления выборки предполагает серийный, или гнездовой, отбор, при котором в порядке случайной или механической выборки выбирают не единицы, а определенные районы, серии (гнезда), внутри которых производится сплошное наблюдение.
Особенности обследуемых объектов определяют два метода отбора единиц в выборочную совокупность – повторный (отбор по схеме возвращенного шара) и бесповторный (отбор по схеме невозвращенного шара) При повторном отборе каждая попавшая в выборку единица или серия возвращается в генеральную совокупность и имеет шанс вторично попасть в выборку. При этом вероятность попадания в выборочную совокупность всех единиц генеральной совокупности остается одинаковой. Бесповторный отбор означает, что каждая отобранная единица (или серия) не возвращается в генеральную совокупность и не может подвергнуться вторичной регистрации, а потому для остальных единиц вероятность попасть в выборку увеличивается.
Бесповторный отбор дает более точные результаты по сравнению с повторным, так как при одном и том же объеме выборки наблюдение охватывает больше единиц генеральной совокупности. Поэтому он находит более широкое применение в статистической практике. И только в тех случаях, когда бесповторный отбор провести нельзя, используется повторная выборка (при обследовании потребительского спроса, пассажирооборота и т.п.).
В вопросе № 3 дается пример случайной выборки.
Вопрос № 3
Z-Тест
Условие задачи:
Булочная Truro отчиталась, что количество продаваемого ежедневно хлеба составляет 3000. Работник желает проверить точность данного отчета. Случайная выборка за 36 дней показала, что в среднем ежедневные продажи составляют 3150 с колебаниями в 300. Проверьте с 1% уровнем значимости, можно ли принять отчет булочной.
Решение:
1. Сформулируем нулевую и альтернативные гипотезы:
Н0 = {количество ежедневно продаваемого хлеба составляет}:μ = 3000.
Н1 = {количество ежедневно продаваемого хлеба не равно}:μ ≠ 3000.
2. Уровень значимости α = 0,01 (это вероятность отклонения верной гипотезы)
По таблице распределения Стьюдента при заданном уровне значимости α и числу степеней свободы df, где df = n – 1 (n – объем выборки) находим квантили (критические точки)
распределения Стьюдента. Они равны:Accept H0 if -2.75 < Z < 2.75.
Reject H0 if Z ≤ -2.75; Z ≥ 2.75.
3.
4.
что свидетельствует о попадании в критическую область, то есть выпадает из зоны значений принятия гипотезы Н0.5. Следовательно, гипотеза Н0 отвергается, то есть при 1% уровне значимости количество продаваемого ежедневно хлеба в количестве 3000 в виде отчета принята быть не может.
В качестве примеров распределений непрерывной случайной величины приведем следующие часто используемые в задачах управления качеством распределения, которые понадобятся нам для дальнейшей работы.
Нормальное (гауссовское) распределение имеет вид
,Здесь
– среднее, – дисперсия распределения СВ.Равномерное (равновероятное для дискретных СВ) распределение на интервале [a,b] описывается соотношением
Среднее значение и дисперсия этого распределения равны соответственно
, .Распределение
(хи – квадрат). Если , - независимые нормально распределенные числа с нулевым средним и единичной дисперсией, то статистика (функция случайных величин) подчиняется распределению с k степенями свободы.Здесь
- гамма функция. Математическое ожидание и дисперсия данного распределения имеют вид соответственно .Распределение Стьюдента (t - распределение).
Пусть z – нормальная случайная величина с нулевым математическим ожиданием и единичной дисперсией. Пусть также v – независимая от z СВ, имеющая распределение с k степенями свободы. Тогда СВ
имеет t - распределение с k степенями свободы
Среднее значение и дисперсия равны соответственно
.Распределение Фишера-Снедекора.
Если u и v независимые СВ, распределенные по закону со степенями свободы
и соответственно, то СВимеет распределение Фишера-Снедекора
Здесь
., среднее значение и дисперсия равны соответственно , .Приведем примеры распределений дискретной СВ, используемые в задачах управления качеством.
Гипергеометрическое распределение, часто применяемое в задачах выборочного контроля, имеет вид
Здесь V - объем контролируемой партии, N – число изделий в выборке, k – число дефектных изделий в выборке, D – число дефектных изделий в партии,
- число сочетаний из D по k.Среднее значение и дисперсия этого распределения равны соответственно
В случае N<<V гипергеометрическое распределение хорошо аппроксимируется биномиальным распределением, вычисляемым по формуле