Основная задача выборочного наблюдения – получить показатели, пригодные для характеристики генеральной совокупности.
Преимущества выборочного метода:
1) сроки обследования уменьшаются, так как обследуется только часть совокупности;
2) уменьшаются затраты труда;
3) уменьшаются затраты материальных средств;
4) повышается оперативность информации;
5) сокращается число единиц наблюдения, поэтому уменьшается количество ошибок регистрации.
В условиях перехода к рынку для принятия оперативных решений нужна надежная информация и это способствует более широкому применению выборочного метода наблюдения.
Основные условия научного применения выборочного метода:
1) достаточная численность выборочной совокупности;
2) равная возможность каждой единицы генеральной совокупности попасть в выборку.
По способу организации отбора различают:
1. индивидуальный отбор – отбирают отдельные единицы;
2. групповой – отбираются качественно однородные группы или серии единиц;
3. комбинированный отбор – комбинация индивидуального и группового отбора.
Выборка может быть:
· собственно-случайной;
· механической;
· типической (или районированная);
· серийной (или гнездовая);
· комбинированной.
I. Собственно-случайная – при которой отбор единиц в выборочную совокупность производится 3 непосредственно из всей массы единиц генеральной совокупности. При этом каждой единице совокупности обеспечивается одинаковая вероятность быть отобранной благодаря случайности отбора. Случайный отбор может осуществляться в виде повторного отбора и бесповторного.
Повторная выборка – при этом каждая отобранная из генеральной совокупности единица вновь возвращается в нее после обследования. Т.е. при новом исследовании единица может опять попасть в выборку.
Бесповторная выборка – каждая отобранная единица исключается из числа генеральной совокупности, т.е. может попасть в выборку один раз.
II. Механическая выборка – разновидность собственно-случайной.
Например: 20% отбор – наблюдению подвергается каждая 5 единица.
III. Типическая, или районированная – вся генеральная совокупность предварительно подразделяется на качественно-однородные по существенному признаку группы, а затем уже из этих групп производится случайный отбор n единиц.
Отбор единиц почти прямо пропорционален численности групп:
если учитывается вариация изучаемого признака, которая измеряется средним квадратическим отклонением (si):
IV. Серийная (гнездовая) выборка – отбору подлежат группы единиц совокупности. Они могут быть связаны: территориально; организационно (группы, предприятия); упаковкой (ящик, пачка); во времени (продукция за определенный период).
Моментные выборочные обследования – метод моментных наблюдений - изучает наличие или длительность отдельных элементов процесса, явления. Метод предложен в 1938 году английским статистиком Типпетом.
Пример: определение структуры рабочего времени оборудования (работа, наладка, простой). То есть определяется состояние единиц наблюдения в определенный момент наблюдения.
Для определения числа моментов обследования n применяется формула:
, гдеw – доля изучаемого признака в выборке;
d – относительная величина предельной ошибки выборки, %.
t – коэффициент доверия зависит от вероятности ошибки.
1. ошибки регистрации
2. ошибки репрезентативности.
I. Ошибки регистрации зависят от:
подготовленности счетчика
ошибочных ответов наблюдаемых
способа наблюдения.
При хорошей организации они должны быть меньше, чем при сплошном обследовании.
II. Ошибки репрезентативности свойственны только выборочному методу, показывают величину расхождения между показателями выборочной и генеральной совокупности. Имеют систематический или случайный характер.
Систематическая ошибка – ошибка появляется в результате нарушения случайности отбора (в сторону уменьшения или увеличения).
Случайная ошибка – имеет одинаковую величину вероятности в сторону увеличения или в сторону уменьшения изучаемого показателя, так как исследуется часть, а не вся совокупность.
Определение ошибки выборки:
Возможные расхождения между характеристиками выборочной и генеральной совокупности измеряются средней ошибкой выборки , генеральная совокупность численность выборки при проведении выборочных исследований s 0 неизвестна.Между дисперсиями выборочной и генеральной совокупности существует следующее соотношение:
Если n достаточно велико, то
Поэтому на практике применяется следующая формула:
дисперсия выборкиДля показателя средней величины дисперсии количественного признака в выборке определяется по формуле:
– для случайной выборки при повторном отбореПри бесповторном отборе численность генеральной совокупности N в ходе выборки сокращается, в формулу включают дополнительный множитель
, если пренебречь единицей в знаменателе при больших значениях N: для бесповторного отбораОшибка при определении доли
Для определения ошибок выборки при установлении доли тех или иных единиц в совокупности генеральная дисперсия заменяется показателем дисперсии альтернативного признака: pq
по теории вероятности 1= p+q, но поскольку р – генеральная доля неизвестна, то практически вместо нее принимается выборочная частость w:
для повторного отбора для бесповторного отбораПредельная ошибка выборки
Расхождение между выборочной средней и генеральной может быть:
I. средняя ошибка выборки
II. Каждое расхождение имеет различную вероятность.
Поэтому
рассматриваем как некую предельную ошибку, но она:связана со средней ошибкой m гарантирует определенную вероятность – р
, где D – предельная ошибка;m – средняя ошибка;
t – коэффициент доверия – зависит от вероятности, с какой определена предельная ошибка.
Формула предельной ошибки выборки вытекает из основных положений теории выборочного метода, сформулированной в ряде теорем теории вероятностей, отражающих закон больших чисел.
III. Одной из главных является теорема Чебышева: «сколь угодно близка к единице вероятность того, что при достаточно большом объеме выборки и ограниченной дисперсии генеральной совокупности разность между х – х 0 будет сколь угодно мала, т.е. не превзойдет заданного предела tm.».
Теорему Чебышева можно записать:
при
Т.е. по мере увеличения объема выборки расхождения между х – х 0 будут сокращаться, вероятность этого близка к 1.Но какова вероятность наступления каждого значения tm это неравенство не определяет.
IV. Эта неопределенность устраняется Ляпуновым, который доказал, что при достатачно большом числе наблюдений и ограниченной дисперсии распределение вероятностей выборочных средних, а следовательно, и их отклонений от генеральной средней подчиняется закону нормального распределения, значит, вероятность p наступления той или иной величины предельной ошибки может быть рассчитана как f от
t‑коэффициента доверия по интегралу Лапласа.
Интеграл Лапласа является функцией от t. По формуле величины вероятности F (t) для разных коэффициентов доверия t рассчитаны и сведены в таблицу значения F (t).
По таблице: при
Вывод: эти показатели означают, что с вероятностью = 0,683 предельная ошибка не превзойдет среднюю ошибку; при 0,954 – не превзойдет 2‑х кратной средней ошибки.
Методика расчета предельной ошибки:
1) по выборке определяется средняя ошибка m;
2) задается вероятность F, с которой искомая предельная ошибка гарантируется;