Содержание
1. Понятие о выборочном наблюдении.
2. Ошибки репрезентативности.
3. Измерение ошибки выборки.
4. Определение необходимой численности выборки.
1. Понятие о выборочном наблюдении
Выборочное наблюдение представляет собой такой вид не сплошного наблюдения, при котором обследованию подвергается часть единиц исследуемой совокупности, позволяющей по ней получить данные для характеристики всей совокупности в целом.
Вся изучаемая совокупность явлений называется генеральной совокупностью (обозн. N)
Та же часть единиц, которая отобрана из генеральной совокупности для выборочного направления, называется выборочной совокупностью (n - единиц).
Применение выборочного метода в замен сплошного дает возможность лучше организовать наблюдение, обеспечивает быстроту проведения наблюдения, приводит к экономии средств затрат труда на получение и обработку информации.
Выборочный метод находит широкое применение не только как самостоятельный метод статистического исследования, но может быть также использован для ускоренной обработки материалов сплошного наблюдения и проверки данных сплошных переписей и учетов.
Задача формирования выборочной совокупности заключается в том, что средние и относительные показатели, характеризующие эту совокупность, с достаточной точностью отражали соответствующие средние и относительные показатели генеральной совокупности.
Средняя или относительная величина (доля) признака в генеральной совокупности называются генеральными, а средняя или относительная величина (доля) признака в выборочной совокупности называются выборочными.
Соответственно и дисперсия в генеральной совокупности называется генеральной (s2), а выборочной совокупности называется выборочной (s02).
Приведем пример расчета показателей для генеральной и для выборочной совокупности.
Положим, что из 300 одинаковых по площади посева участков, имеющих различную урожайность яровой пшеницы, отобрано в случайном порядке 30 участков (10% от всей совокупности) – составляющих выборочную совокупность. Данные в таблице 1.
Распределение участка по урожайности яровой пшеницы.
Группы участков по урожайности, (ц с га) | число участков | |
Всего (генер. совокупн.) | В т. числе отобрано (выборочн. совокупн.) | |
14 | 60 | 8 |
15 | 150 | 15 |
16 | 90 | 7 |
Итого | 300 | 30 |
Определим по этим данным среднюю урожайность, дисперсию урожайности и долю участков с урожайностью в 15 и более ц с га для генеральной и для выборочной совокупности.
а) Для генеральной совокупности:
средняя урожайность:
дисперсия урожайности:
доля участков с урожайностью 15 и более ц с 1 га:
б) Для выборочной совокупности:
средняя урожайность:
дисперсия урожайности:
доля участков с урожайностью 15 и более ц с 1 га (для выборочной совокупности доля обозн. - v)
При сопоставлении показателей выборочной и генеральной совокупностей обнаружилось, что характеристики выборочной совокупности не совпадают с характеристиками генеральной совокупности. Средняя урожайность по выборке на 0,1 ц с га меньше чем по генеральной совокупности; не совпадают также величины дисперсии урожайности (0,5 ц и 0,49 ц) и доли участков с урожайностью 15 и более ц с га (73% и 80%).
По сравнению с генеральной совокупностью характеристики выборочной совокупности могут иметь некоторые неточности. Эти неточности в общих случаях могут быть больше; в других – меньше. Размеры этих неточностей зависят от того, насколько точно отобранная часть воспроизводит или, как говорят, репрезентирует всю совокупность исследуемых явлений.
2. Ошибки репрезентативности
Общая величина возможной ошибки выборки слагается из ошибок двоякого рода:
- ошибки регистрации;
- ошибки репрезентативности.
Ошибки регистрации свойственны всякому статистическому наблюдению и их появление может быть вызвано несовершенством измерительных приборов, недостаточной квалификацией наблюдателя, недостаточной точностью подсчетов и т.п. Можно полагать, что по сравнению со силошными наблюдениями опасность возникновения ошибок регистрации при выборочном наблюдении должна быть меньше, так как они проводятся более квалифицированными работниками.
Значительно уменьшается при выборочном наблюдении и опасность преднамеренных искажений данных, так как специально подобранные и обученные наблюдатели в них не заинтересованы.
Ошибками репрезентативности называют расхождения между средними величинами или долями признака выборочной и генеральной совокупности. Они присущи только несилошным наблюдениям. Ошибки репрезентативности могут быть:
- систематическими;
- случайными.
Систематическими называются ошибки, которые возникают из-за нарушения научного принципа отбора единиц в выборочную совокупность. Они возникают в тех случаях, когда в результате непрпавильного отбора в выборочную совокупность попали наилучшие или наихудшие единицы.
В результате такого отбора средние и относительные показатели, полученные по выборочной совокупности, будут искаженно характеризовать генеральную совокупность.
Случайные ошибки репрезентативности – это неточности, которые возникают из-за того, что выборочная совокупность не совсем правильно отражает средние величины и величины доли признака генеральной совокупности. Такие ошибки возникают даже при самом строгом соблюдении принципов и правил отбора единиц в выборочную совокупность.
Ошибки репрезентативности свойственны только выборочному наблюдению. Они не могут быть полностью устранены, но они могут быть доведены до незначительных размеров, если соответствующим образом организовать отбор единиц в выборочную совокупность.
Пределы ошибок репрезентативности можно определить с достаточной степенью точности на основании ряда теорем в теории вероятности и математической статистике.
Исключительно важную роль для обоснования и применения выборочного наблюдения играет закон больших чисел. Использование законы больших чисел состоит в том, что при определенных условиях и при достаточно большом объеме наблюдений сводные характеристики, полученные на основе выборочного наблюдения, будут мало отличаться от соответствующих характеристик генеральной доверенности. Основываясь на этом, можно, увеличивая объем выборочной совокупности, уменьшить пределы возможных ошибок репрезентативности, довести их до наименьших размеров. С другой стороны, зная пределы ошибок репрезентативности, можно определить необходимую численность выборочной совокупности.
3. Измерение ошибки выборки
Величина ошибки выборки зависит от численности выборочной совокупности и от степени колеблемости изучаемого признака.
Зависимость величины ошибки выборки: одна формула применяется при выборочном определении средней величины признака, а другая – при выборочном определении доли признака. Доказательства и вывод этих формул даются в курсах математической статистики.
Формула средней ошибки выборки при определении средней величины признака имеет следующий вид:
где m - средняя ошибка выборки;
s2 - дисперсия признака в генеральной совокупности;
n – число единиц в выборочной совокупности.
Следовательно, средняя ошибка выборки равна корню квадратному из дисперсии признака, деленной на численность выборочной совокупности. Это значит, что ошибка выборки уменьшается при уменьшении колеблемости признака, а также при увеличении выборочной совокупности. Это означает также, что при уменьшении колеблемости признака можно уменьшить объем выборки.
Формула средней ошибки выборки при определении доли признака такова:
где m - средняя ошибка выборки;
p –доля признака в генеральной совокупности;
n – число единиц в выборочной совокупности.
Вышеприведенные формулы ошибки выборки применяются, когда отбор единиц в выборочную совокупность производится в порядке случайной повторной выборки. Повторная выборка называется потому, что каждая из единиц, отобранная из генеральной совокупности, после регистрации ее признаков возвращается обратно и может при каждом последующем отборе попасть в выборку еще раз, т.е. повторно. Практически случайная повторная выборка встречается сравнительно редко. Большей частью имеют дело со случайной бесповторной выборкой. Бесповторная выборка называется потому, что каждая из единиц после регистрации ее признаков обратно не возвращается и в дальнейшем уже в отборе не существует.
При бесповторной выборке сокращается численность единиц генеральной совокупности. Поэтому при определении ошибки выборочной средней и доли признака при бесповторном отборе должна быть учтена численность генеральной совокупности и доля выборки.
Генеральную совокупность обозначим через N, тогда доля выборочной совокупности n, будет равна
. Поэтому в формулу ошибки выборки при повторном отборе должен быть введен дополнительный множитель . Тогда формулы ошибок выборки бесповторного отбора примут следующий вид: