К. Пирсона χ2(«хи- квадрат»), исчисляемый по формуле
где f - эмпирические частоты (частости) в интервале;
f'' - теоретические частоты (частости) в интервале.
Полученное значение критерия (х2 расч) сравнивается с табличным значением (х2табл)- Последнее определяется по специальной таблице (см. приложение 2) в зависимости от принятой вероятности (Р) и числа степеней свободы k(для нормального распределения kравно числу групп в раду распределения минус 3).
Если X2расч <= Х2табл, то гипотеза о близости эмпирического распределения к нормальному не отвергается.
При расчете критерия Пирсона необходимо соблюдать условия: число наблюдений должно быть достаточно велико (п > 50); если теоретические частоты в некоторых интервалах меньше 5, то интервалы объединяют так, чтобы частоты были больше 5.
РЕШЕНИЕ ТИПОВЫХ ЗАДАЧ
3.2. Имеются следующие данные о возрастном составе рабочих цеха (лет): 18; 38; 28; 29; 26; 38; 34; 22; 28; 30; 22; 23; 35; 33; 27; 24; 30; 32; 28; 25; 29; 26; 31; 24; 29; 27; 32; 25; 29; 29.
Для анализа распределения рабочих цеха по возрасту требуется: 1) построить интервальный ряд распределения; 2) дать графическое изображение ряда; 3) исчислить показатели центра распределения, показатели вариации и формы распределения. Сформулировать вывод.
Решение \. Величина интервала группировки определяется по формуле
Интервальный ряд распределения
2. Графически интервальный вариационный ряд может быть представлен в виде гистограммы, полигона, кумуляты.
Гистограмма строится в прямоугольной системе координат. По оси абсцисс откладывают интервалы значений вариационного признака, причем число интервалов целесообразно увеличить на два4ло одному в начале и в конце имеющегося ряда) для удобства преобразования гистограммы в полигон частот. На отрезках (интервалах) строятся прямоугольники, высота которых соответствует частоте.
Для преобразования гистограммы в полигон частот середины верхних сторон прямоугольников соединяют отрезками прямой, и две крайние точки прямоугольников замыкаются по оси абсцисс на середине интервалов, в которых частоты равны нулю.
На рис. 3.2 представлено графическое изображение построенного интервального вариационного ряда в виде гистограммы и полигона частот.
Как видно из графика, треугольники, относящиеся к площади гистограммы и к площади полигона, попарно равны между собой, и, следовательно, площадь гистограммы и площадь полигона данного вариационного ряда также совпадают.
На основе построенной гистограммы графически можно определить значение моды. Для этого правую вершину модального прямоугольника соединяют прямой с правым верхним углом предыдущего прямоугольника, а левую вершину модального прямоугольника соединяют с левым верхним углом последующего прямоугольника. Абсцисса точки пересечения этих прямых и будет модой распределения. Мо = 28,3 года. На рис. 3.2 эти прямые
Рис. 3.2. Гистограмма и полигон распределения рабочих цеха по возрасту линии, соединяющие вершины прямоугольников, и перпендикуляр из точки их пересечения показаны пунктирной линией.
На рис. 3.3 представлена кумулятивная кривая (кумулята).
Кумулята может быть использована для графического определения медианы. Для этого последнюю ординату кумуляты делят пополам. Через полученную точку проводят прямую, параллельную оси дг, до пересечения ее с кумулятой. Из точки пересечения опускается перпендикуляр до оси абсцисс. Абсцисса точки пересечения является медианой. Линии, определяющие медиану, на рис. 3.3 показаны пунктирными линиями. Ме = 28,6 года.
3. Расчет показателей центра распределения:
Для интервального вариационного ряда порядок расчета структурных средних следующий: сначала находят интервал, содержащий моду или медиану, а затем рассчитывают соответствующие значения названных показателей.
Модальным в данном распределении является интервал 27 -30 лет, так как наибольшее число рабочих {f = 10) находится в этом интервале. Значение моды определяется по формуле
Для расчета показателей вариации составляется вспомогательная таблица (табл. 3.4).
Таблица 3.4 Вспомогательная таблица для расчета показателей
Следовательно, вариация возраста у рабочих данного цеха не является значительной, что подтверждает достаточную однородность совокупности.
Как видно на рис. 3.2, распределение рабочих по возрасту несимметрично, поэтому определяется показатель асимметрии:
Следовательно, асимметрия правосторонняя, незначительная. При правосторонней асимметрии между показателями центра распределения существует соотношение
Для данного распределения это соотношение выполняется, т. е. 28, 33 < 28, 65 < 28, 70. При левосторонней асимметрии (Л, со знаком минус) соотношение между показателями центра распределения будет иметь вид:
Мо > Ме > х.
4. ВЫБОРОЧНОЕ НАБЛЮДЕНИЕ
Понятие о выборочном наблюдении
Выборочное наблюдение при строгом соблюдении условий случайности и достаточно большой численности отобранных единиц репрезентативно (представительно); по результатам изучения определенной части единиц с достаточной для практики степенью точности можно судить о всей совокупности. Однако вычисленные по материалам выборочного наблюдения статистические показатели не будут точно совпадать с соответствующими характеристиками для всей совокупности (генеральной совокупности). Величина этих отклонений называется ошибкой наблюдения, которая складывается из ошибок двоякого рода: ошибки регистрации (точности) и ошибки репрезентативности.
Ошибки репрезентативности свойственны только несплошным наблюдениям. Они характеризуют размер расхождений между величинами показателя, полученного в выборочной и генеральной совокупности в условиях одинаковой точности единичных наблюдений. Ошибки репрезентативности могут быть систематическими и случайными. Систематические ошибки возникают при нарушении установленных правил отбора единиц. Случайные ошибки репрезентативности обязаны своим возникновением недостаточно равномерным представлением в выборочной совокупности различных категорий единиц генеральной совокупности.
Величина случайной ошибки определяет надежность данных выборочного наблюдения, их пригодность для суждения о генеральной совокупности. При помощи формул теории вероятностей можно рассчитать возможную максимальную случайную ошибку - вероятный (стохастический) предел ошибки.
Максимально возможная ошибка - это такая величина отклонения выборочной средней (доли) от генеральной, вероятность превышения которой вследствие случайных причин в условиях данной выборки очень мала.
Величина случайной ошибки репрезентативности зависит от:
• степени колеблемости изучаемого признака в генеральной совокупности;
• способа формирования выборочной совокупности;
• объема выборки.
По степени охвата единиц исследуемой совокупности различают большие и малые выборки.
По способу формирования выборочной совокупности различают следующие виды выборочного наблюдения: простая случайная (собственно случайная) выборка, расслоенная (типическая или районированная), серийная, механическая, комбинированная, ступенчатая, многофазная.
Принятые условные обозначения
Совокупность единиц, из которых производится отбор, принято называть генеральной совокупностью. Совокупность отобранных единиц из генеральной совокупности называется выборочной совокупностью.
N - объем генеральной совокупности (число входящих в нее единиц);
п - объем выборочной совокупности (число единиц, попавших в выборку);
х - генеральная средняя (среднее значение признака в генеральной совокупности);
х - выборочная средняя (среднее значение признака в выборочной совокупности);
р - генеральная доля (доля единиц, обладающих данным признаком в генеральной совокупности);
w - выборочная доля (доля единиц, обладающих данным признаком в выборочной совокупности);
ơ2 - генеральная дисперсия (дисперсия признака в генеральной совокупности);
S2 - выборочная дисперсия (дисперсия признака в выборочной совокупности);
ơ- среднее квадратическое отклонение признака в генеральной совокупности;
S - среднее квадратическое отклонение признака в выборочной совокупности.
Простая случайная выборка
При простой случайной выборке отбор единиц в выборочную совокупность производится непосредственно из всей массы единиц генеральной совокупности в форме случайного отбора, при котором каждой единице генеральной совокупности обеспечивается одинаковая вероятность (возможность) быть выбранной. Единица отбора совпадает с единицей наблюдения. Случайный отбор осуществляется путем применения жеребьевки (лотереи) или путем использования таблиц случайных чисел.
Случайный отбор может быть проведен в двух формах: в форме возвратной (повторной) выборки ив форме безвозвратной (бесповторной) выборки. При повторном отборе вероятность попадания каждой единицы генеральной совокупности остается постоянной, так как после отбора какой-то единицы она снова может быть выбранной. При бесповторном отборе выбранная единица не возвращается в генеральную совокупность и вероятность попадания отдельных единиц в выборку все время изменяется (для оставшихся единиц она возрастает).