Случайные числа могут быть выбраны по таблице случайных чисел (приложение 1), которая содержит 2000 случайных чисел, объединенных для удобства пользования таблицей в 500 блоков по 4 значения) Например,
5489, 5583, 3156, 0835, 1988, 3912.
Применение комбинаций этих цифр зависит от размера совокупности: если в генеральной совокупности 1000 единиц, то порядковый номер каждой единицы должен состоять из двух цифр от 000 до 999. В этом случае первые 8 номеров единиц выборочной совокупности следующие:
548, 955, 833, 156, 083, 519, 883, 912.
При произвольном объеме генеральной совокупности, отличающегося от 100, 1000, 10000 могут использоваться псевдослучайные числа, сформированные на ЭВМ, или из таблицы случайных чисел формируется последовательность случайных величин, распределенных в интервале от 0 до 1. Например, в приведенном выше примере
0,5489; 0,5583; 0,3156; 0,0835; 0,1988; 0,3912 и т.д.
Если генеральная совокупность состоит из 2000 единиц, то в выборочную совокупность должны войти единицы с номерами:
2000 × 0,5489 = 1097,8 или 1099;
2000 × 0,5583 = 1116,6 или 1117;
2000 × 0,3156 = 631,2 или 631;
2000 × 0,0835 = 167,0 или 167;
2000 × 0,1988 = 397,6 или 398;
2000 × 0,3912 = 782,4 или 782.
Процесс формирования случайных чисел и определения номера отбираемой единицы продолжается до тех пор, пока не будет получен заданный объем выборочной совокупности.
Можно предложить другой способ случайного отбора единиц в выборку. Допустим, что выборка состоит из 75 единиц, а генеральная совокупность - из 780. Из таблицы случайных чисел выбираются, например, следующие
5489, 5583, 3156, 0835, 1988, 3912.
В выборку могут войти только единицы, порядковые номера которых равны трехзначным числам меньше 780. Поэтому, используя только три последние цифры каждого числа, отбирается необходимые 75 номеров: 489, 583, 156 и т.д. Можно использовать и первые три цифры каждого числа, тогда отобранные номера: 548, 558, 315, 83, 198, 391. Можно разбить случайные четырехзначные случайные числа на ряд, состоящий из трехзначных чисел:
548, 955, 833, 156, 083, 519, 883, 912
и отобрать из них номера, которые меньше 780, а именно: 548, 156, 83, 519.
Механический отбор заключается в том, что составляется список единиц генеральной совокупности и в зависимости от числа отбираемых единиц (серий) устанавливается шаг отбора, т.е. через какой интервал следует брать для наблюдения единицы (серии). Например, в простейшем случае, при 10%–м отборе, отбирается каждая десятая единица по этому списку, т.е. если первой взята единица за № 1, то следующими отбираются 11–я, 21–я и т.д. В такой последовательности производится отбор, если единицы совокупности расположены в списке без учета их “рангов”, т.е. значимости по изучаемым признакам. Начало отбора в этом случае не имеет значения, его можно начать в приведенном примере от любой единицы из первого десятка. При расположении единиц совокупности в ранжированном порядке за начало отбора должна быть принята середина интервала (шага отбора) во избежание систематической ошибки выборки.
При достаточно большой совокупности этот способ отбора близок к собственно случайному, при условии, что применяемый список не составлен таким образом, чтобы какие-то единицы совокупности имели больше шансов попасть в выборку.
При типическом отборе генеральная совокупность разбивается на типические группы единиц по какому–либо признаку (формируются однородные совокупности), а затем из каждой из них производится механический или собственно–случайный отбор. Отбор единиц из типов производится тремя методами: пропорционально численности единиц типических групп, непропорционально численности единиц типических групп и пропорционально колеблемости признака в группах.
В целях экономии средств данные по некоторым интересующим исследователя признакам можно анализировать на основании изучения всех единиц выборочной совокупности, а по другим признакам - на основании части единиц выборочной совокупности, которые представляют подвыборку из единиц первоначальной выборки. Этот метод называется двухфазным отбором. При наличии нескольких подвыборок - метод многофазного отбора.
Многофазный отбор по своей структуре отличается от многоступенчатого отбора, так при многофазном отборе используются на каждой фазе одни и те же отобранные единицы, при многоступенчатом отборе на разных ступенях применяются единицы отбора разных порядков. Многофазным отбором чаще всего пользуются в тех случаях, когда различно число единиц, необходимых для определения отдельных показателей с заданной точностью. Это связано как с различиями в степени колеблемости признаков, так и с разной точностью, требуемой для расчетов. Ошибки при многофазной выборке рассчитываются на каждой фазе отдельно.[1]
Все виды отбора, поскольку они могут быть повторными или бесповторными, имеют разновидности (табл.1).
Таблица1
Вид отбора | Разновидности отбора в зависимости от | |
повторяемости отбора единиц совокупности | от величины серий или пропорциональности отбора единиц совокупности в группах | |
Собственно случайный | 1. Собственно случайный повторный2. Собственно случайный бесповторный | |
Механический | 1. Механический повторный2. Механический бесповторный | |
Серийный | 1. Серийный с повторным отбором серий2. Серийный с бесповтор- ным отбором серий | 1.1. Серийный с повторным отбором равновеликих серий1.2. Серийный с повторным отбором неравновеликих серий2.1. Серийный с бесповторном отбором равновеликих серий2.2. Серийный с бесповторном отбором неравновеликих серий |
Комбиниро-ванный | 1. Комбинированный с повторным отбором серий 2. Комбинированный с бесповторным отбором серий | 1.1. Комбинированный с повторным отбором равновеликих серий1.2. Комбинированный с повторным отбором неравновеликих серий2.1. Комбинированный с бесповторным отбором равновеликих серий2.2. Комбинированный с бесповторным отбором неравновеликих серий |
Типический | 1. Типический с повторным случайном отборе внутри групп2. Типический при бесповторном случайном отборе внутри групп | 1.1. Типический с повторным случайном отборе внутри групп, пропорциональ- ном объему групп1.2. Типический с повторным случайном отборе внутри групп, непропорцио- нальном объему групп1.3. Типический с повторным случайном отборе внутри групп, пропорциональ- ном колеблемости в группах2.1. Типический с бесповторным случайном отборе внутри групп, пропорциональ- ном объему групп2.2. Типический с бесповторным случайном отборе внутри групп, непропорцио- нальном объему групп2.3. Типический бесповторным случайном отборе внутри групп, пропорциональ- ном колеблемости в группах |
3. Ошибки выборки
Разность между показателями выборочной и генеральной совокупности называется ошибкой выборки. Ошибки выборки подразделяются на ошибки регистрации и ошибки репрезентативности.
Ошибки регистрации возникают из-за неправильных или неточных сведений. Источниками таких ошибок могут быть непонимание существа вопроса, невнимательность регистратора, пропуск или повторный счет некоторых единиц совокупности, описки при заполнении формуляров и т.д.
Среди ошибок регистрации выделяются систематические, обусловленные причинами, действующими в каком-то одном направлении и искажающими результаты работы (например, округление цифр, тяготение к полным пятеркам, десяткам и т.д.), и случайные,проявляющиеся в различных направлениях, уравновешивающие друг друга и лишь изредка дающие заметный суммарный итог.
Расхождение между значениями изучаемого признака выборочной и генеральных совокупностей является ошибкой репрезентативности (представительности). Она может быть случайной и систематической. Случайная возникает в силу того, что выборочное статистическое наблюдение является несплошным наблюдением, и выборка недостаточно точно воспроизводит (репрезентирует) генеральную совокупность.
Систематические ошибка репрезентативности возникают из-за неправильного, тенденциозного отбора единиц, при котором нарушается основной принцип научно организованной выборки - принцип случайности.
При определении величины репрезентативной ошибки предполагается, что ошибка регистрации равна нулю. Определение ошибки производится по формулам ошибки выборочной доли и ошибки выборочной средней. Систематическая ошибка репрезентативности возникает вследствие нарушения правил отбора единиц генеральной совокупности, в частности принципа беспристрастного, непреднамеренного отбора. Систематическая ошибка может привести к полной непригодности результатов наблюдений.
Рассмотрим на примере, насколько отличаются выборочные и генеральные показатели по данным об успеваемости студентов (две 10%-е выборки):
Оценка | Число студентов, чел | ||
Генеральная совокупность | Первая выборка | Вторая выборка | |
2345 | 100 300 520 80 | 9 27 54 10 | 12 29 52 7 |
Итого | 1000 | 100 | 100 |
Средний балл для генеральной совокупности
по первой выборке
по второй выборке
Доля студентов, получивших оценки "4" и "5":
по генеральной совокупности