Обобщающей характеристикой совокупности по изучаемому признаку является средняя величина признака. Поэтому, как правило, сначала рассчитывают среднее значение признака для выборочной совокупности (
), а затем, исходя из меры соответствия между генеральной и выборочной совокупностями, определяют пределы, в которых может колебаться среднее значение признака в генеральной совокупности ( ).Поскольку точные характеристики генеральной совокупности не определены, то указать единичное значение расхождения между средними для выборочной и генеральной совокупностей невозможно. В связи с этим, определяют средний размер всех возможных ошибок (
) выборочного наблюдения. Другими словами, показатель называется средняя ошибка выборочной средней. Для повторного отбора [8]: – дисперсия выборочной совокупности;n – численность единиц выборочной совокупности [13].
С применением поправочного коэффициента на бесповторность средняя ошибка выборочной средней для бесповторного отбора будет определяться следующим образом:
– дисперсия выборочной совокупности;N – численность единиц генеральной совокупности.
То есть, средняя в генеральной совокупности может отклониться от средней в выборочной совокупности в сторону увеличения или уменьшения на величину
.Предельная ошибка выборочной средней (
) определяет границы, в пределах которых может колебаться среднее значение генеральной совокупности относительно среднего значения выборки. Различия между средней и предельной ошибкой обусловлены величиной коэффициента доверия t.Суть этого коэффициента можно определить как ряд следующих заключений:
· предполагается наличие расхождения между параметрами выборки и параметрами генеральной совокупности, которое называется ошибкой;
· предполагается, что вместо полученных определенных результатов выборки, могли быть другие, несколько отличные результаты, и, следовательно, могли быть другие характеристики выборочной совокупности и другие ошибки [15];
· предполагается образование ряда распределения из возможных ошибок, причем, в таком ряду рассчитывается среднее значение – средняя ошибка выборки (
);· предполагается наличие степени вероятности Р у каждой ошибки в этом ряду распределения;
· предполагается формирование распределения вероятностей ошибок Р(t), т.е. определение плотности вероятности ошибок (графическое изображение см. рис 2.);
· предполагается более высокая вероятность появления ошибок определенного размера (среднего размера ошибки) (графически отображается в виде возвышения «волны», характеризующей вероятность, см. рис. 2.);
· по оси абсцисс на графике откладывается значение t; тогда, чем ближе вероятность ошибки расположена к оси ординат (соответственно, к вероятности появления средней ошибки), тем меньше значение t.
· в зависимости от степени репрезентативности («доверия») выборочных данных, определяется значение t, от величины которого зависит вероятность появления ошибок других размеров, отличных от средней ошибки, следовательно, зависят границы колебания значения параметров генеральной совокупности относительно выборки [6].
Таким образом, количественное выражение t, в конечном итоге, является мерой «доверия» к реальности выборочных данных. Тогда предельная ошибка выборочной средней (
) будет определяться следующим образом: .Отсюда, среднее значение генеральной совокупности имеет вид:
В статистике существуют наиболее распространенные уровни вероятностей, например: 0,954; 0,997 и др. Это означает, что, соответственно, в 6 случаях из 1000 и в 3 случаях из 1000 ошибка выборки может превысить пределы, определенные выборочным наблюдением.
Рис. 2.
На рисунке 2. затемненная площадь под кривой показывает вероятность появления средней ошибки выборочной средней. Площадь фигуры, образованной перпендикулярами, опущенными на ось абсцисс[1], и кривой плотности вероятности определяет вероятность появления предельной ошибки выборочной средней [17].
Средняя и предельная ошибка для показателей доли
Анализ генеральной совокупности не ограничивается расчетом средних величин. Для характеристики распространенности единиц совокупности с тем или иным значением изучаемого признака рассчитываются показатели структуры (доли).
Принцип транспонирования выводов о выборке на генеральную совокупность, принятый для средних величин, сохраняется и при определении показателей доли:
1. Средняя ошибка выборки (
)для доли (w) единиц, обладающих изучаемым признаком, при повторном отборе:w – удельный вес единиц, обладающих изучаемым признаком;
– дисперсия для показателя доли;n – численность единиц выборочной совокупности.
2. Средняя ошибка выборки (
)для доли (w) единиц, при бесповторном отборе:N – численность единиц генеральной совокупности.
3. Предельная ошибка выборочной доли (
):Тогда, удельный вес единиц, обладающих изучаемым признаком, в генеральной совокупности будет находиться в пределах:
Определение необходимого объема выборки
Прежде чем приступить к осуществлению выборочного наблюдения необходимо определить количество единиц выборочной совокупности, обеспечивающее репрезентативность, и, следовательно, надежность результатов исследования [4].
На практике для реализации выборочного наблюдения исследователем задаются:
· степень точности исследования (вероятность);
· предельная ошибка, т.е. интервал отклонения, определяемый целями исследования.
Исходя из этих критериев, рассчитывается необходимая численность выборочной совокупности (n) на основе формулы предельной ошибки выборки. Как указывалось выше, предельная ошибка выборки определяется для средней величины (
) и для доли (w), то, соответственно, имеем два варианта определения необходимой численности выборочной совокупности:а) для повторного отбора:
б) для бесповторного отбора:
В практике статистического исследования иногда необходимо сделать выводы по малому числу наблюдений. Это может быть связано с ограниченностью ресурсов на проведение выборки, или с ограниченным доступом к объекту исследования. Если число наблюдений (единиц выборочной совокупности) не превышает 30, то выборка называется малой. Расчет показателей для малой выборки осуществляется с применением специальной методики, учитывающей распределение вероятностей появления ошибок определенных размеров. Напротив, в выборочной совокупности с большим количеством единиц распределение ошибок предполагается нормальным или близким к нормальному.
Расчетная часть
Задача:
Имеются следующие выборочные данные по предприятиям одной из отраслей промышленности региона в отчетном году (выборка 20% - ная механическая), млн. руб.:
Таблица 1
№ предприятия п /п | Выручка от продажи продукции | Затраты на производство и реализацию продукции |
1 | 36,45 | 30,255 |
2 | 23,4 | 20,124 |
3 | 46,54 | 38,163 |
4 | 59,752 | 47,204 |
5 | 41,415 | 33,546 |
6 | 26,86 | 22,831 |
7 | 79,2 | 60,984 |
8 | 54,72 | 43,776 |
9 | 40,424 | 33,148 |
10 | 30,21 | 25,376 |
11 | 42,418 | 34,359 |
12 | 64,575 | 51,014 |
13 | 51,612 | 41,806 |
14 | 35,42 | 29,753 |
15 | 14,4 | 12,528 |
16 | 36,936 | 31,026 |
17 | 53,392 | 42,714 |
18 | 41 | 33,62 |
19 | 55,68 | 43,987 |
20 | 18,2 | 15,652 |
21 | 31,8 | 26,394 |
22 | 39,1204 | 32,539 |
23 | 57,128 | 45,702 |
24 | 28,44 | 23,89 |
25 | 43,344 | 35,542 |
26 | 70,72 | 54,454 |
27 | 41,832 | 34,302 |
28 | 69,345 | 54,089 |
29 | 35,903 | 30,159 |
30 | 50,22 | 40,678 |
Задание 1