В выборочных обследованиях способ оценивания называется состоятельным, если оценка становится в точности равной оцениваемому параметру для совокупности при n = N, т.е. когда выборку составляет вся совокупность. Очевидно, что при простом случайном отборе выборочное среднее
и произведение представляют собой состоятельные оценки соответственно среднего и суммарного значений для совокупности.В данном контексте способ оценивания называется несмещенным, если среднее значение оценки, взятое по всем возможным выборкам данного объема n, в точности равно истинному значению для совокупности, и это утверждение справедливо для любой конечной совокупности значений
и для любого n. Например, при простом случайном отборе выборочное среднее - несмещенная оценка среднего значения признака, - несмещенная оценка суммарного значения Y для совокупности, где - среднее значение признака по выборке.В теории и практике выборочных обследований часто приходится рассматривать смещенные оценки. Это обусловлено следующими причинами. Во-первых, в некоторых случаях, особенно при оценивании отношений двух величин, смещенные оценки дают более достоверные результаты, чем несмещенные. Во-вторых, даже в случае использования теоретически несмещенных оценок ошибки наблюдения и неполучение ответов от респондентов могут привести к смещениям в распространенных результатах.
Кратко опишем некоторые, наиболее часто используемые в статистической практике способы формирования вероятностной выборки.
Простой случайный отбор. Простым случайным отбором называется способ, при котором извлечение единиц из совокупности для обследования осуществляется методом жеребьевки или с использованием таблиц или генератора случайных чисел без деления этой совокупности на какие-либо классы или группы.
Простую случайную выборку получают, отбирая последовательно единицу за единицей. Единицы в совокупности нумеруются числами от 1 до N, после чего выбирается последовательность nслучайных чисел, заключенных между 1 и N. Единицы совокупности, имеющие эти номера, составляют выборку. На каждом этапе отбора такой процесс обеспечивает для всех еще не выбранных номеров равную вероятность быть отобранными. Легко показать, что равную вероятность быть отобранными имеют все
возможных выборок.Уже отобранные номера исключаются из списка, иначе одна и та же единица могла бы попасть в выборку более одного раза. Поэтому такой отбор называется отбором безвозвращения. Отбор с возвращением легко осуществим, но им, за исключением особых случаев, пользуются редко, поскольку нет особых оснований допускать, чтобы одна и та же единица встречалась в выборке дважды.
При простом случайном отборе для получения выводов о параметрах совокупности используют выборочное среднее в качестве оценки среднего значения признака совокупности, а дисперсию признака по выборке – для оценки дисперсии признака совокупности. Для простой случайной выборки усредненные выборочные средние и дисперсии точно равны среднему и дисперсии признака совокупности.
Формулы оценивания при простом случайном отборе
Статистические показатели | Истинное значение | Оценка |
Суммарное значение признака | ||
Среднее значение признака | ||
Дисперсия признака | ||
Дисперсия оценки суммарного значения признака | ||
Дисперсия оценки среднего значения признака | ||
Стандартная ошибка оценки суммарного значения признака | ||
Стандартная ошибка оценки среднего значения признака | ||
Коэффициент вариации оценки |
В таблице 2 использованы следующие обозначения:
i | - | номер элемента; |
N | - | объем (количество элементов) генеральной совокупности; |
yi | - | значение признака yi-го элемента, i = 1, 2,…, N или i = 1, 2,…, n; |
n | - | объем (количество элементов) выборочной совокупности. |
Другие методы отбора часто оказываются предпочтительнее простого случайного отбора по соображениям удобства или повышения точности. Однако простая случайная выборка – наипростейший вид объективной вероятностной выборки, она служит основой для многих более сложных ее видов.
Расслоенный (типизированный) случайный отбор. Расслоенный случайный отбор – это отбор, предусматривающий предварительное разделение совокупности, содержащей N единиц, на слои и проведение простого случайного отбора в каждом слое.
Формулы оценивания при расслоенном отборе
Статистические показатели | Истинное значение | Оценка |
Суммарное значение признака | ||
Среднее значение признака | ||
Дисперсия оценки суммарного значения признака | ||
Дисперсия оценки среднего значения признака | ||
Стандартная ошибка оценки суммарного значения признака | ||
Стандартная ошибка оценки среднего значения признака | ||
Коэффициент вариации оценки |
L | - | число слоев; |
h | - | номер слоя; |
Yh | - | суммарное значение признака y в h-м слое генеральной совокупности; |
Nh | - | объем h-го слоя генеральной совокупности; |
- | среднее значение признака y в h-м слое выборки; | |
N | - | объем генеральной совокупности; |
- | среднее значение признака y в h-м слое генеральной совокупности; | |
nh | - | объем h-го слоя выборки; |
- | истинное значение дисперсии для h-го слоя: | |
i | - | номер элемента внутри слоя; |
yhi | - | значение признака y i-го элемента слоя h; |
- | несмещенная оценка дисперсии для h-го слоя: |
Гнездовой (кластерный или серийный) отбор. Гнездовой отбор – способ формирования выборки, при котором единица отбора состоит из группы или гнезда более мелких единиц, называемых элементами. Таким образом, гнездовая выборочная единица – группа элементов, которая в процессе извлечения выборки рассматривается как одна единица. В простейшем случае элементы, составляющие гнездо, либо входят в выборку как группа, либо не входят в нее вообще.