Итак, выборочной (эмпирической) функцией распределения называется функция F*(x), задающая для каждого значения х относительную частоту события Х < x. Выборочную (эмпирическую) функцию распределения можно задать таблично или графически.
Определение 4. Функция распределения генеральной совокупности F (x) называется теоретической функцией распределения.
В отличие от эмпирической функции F*(x) теоретической функцией распределения
F (x) определяет вероятность события X < x , а F*(x) его относительную частоту. Относительные частоты pi* в соответствии с теоремой Бернулли при стремлении объёма выборки n → ∞ сходится по вероятности к вероятности pi. Поэтому в математической статистике эмпирическую функцию F*(x) используют для приближённого представления теоретической функции распределения F (х).
3. Методы первичного анализа экспериментальных данных. Построение вариационных рядов и определение их основных характеристик
Выборочные данные, упорядоченные по возрастанию или убыванию, получают название вариационного ряда.
Важнейшими числовыми характеристиками вариационных рядов являются средние показатели. Средней величиной в статистике называется обобщающая характеристика совокупности однотипных по некоторому количественно варьируемому признаку явлений. Средняя величина отражает то общее, типическое, что характерно для всех этих единиц. Применяют простые и взвешенные средние величины. При вычислении простой средней величины каждый вариант совокупности учитывается один раз. Взвешенная средняя величина вычисляется, когда варианты повторяются. При вычислении средней этого вида вес каждого из вариантов выбираются пропорциональным частоте повторений этого варианта.
В математической статистике используют различные виды средних величин. Наиболее часто применяются средняя арифметическая, средняя гармоническая и средняя геометрическая величины.
Чаще других средних величин используют средние арифметические
. По данным не сгруппированного вариационного ряда вычисляется средняя арифметическая простая величина, представляющая собой сумму всех вариантов ряда, деленную на число вариантов . (1)Здесь: x
– варианты, n – число вариантов.По данным сгруппированного вариационного ряда рассчитывается средняя арифметическая взвешенная, представляющая сумму попарных произведений вариантов на соответствующие им частоты, деленную на число вариантов
. (2)При решении некоторых задач статистики используют понятие доли – отношения числа единиц совокупности, обладающих изучаемым признаком, к общему числу единиц совокупности. Доля единиц совокупности, объединенных по некоторому признаку в i-ю группу, определяется формулой
.Формула для средней арифметической, записанная с использованием доли, имеет вид
.Примечание. При расчете средних величин по данным интервального вариационного ряда вместо варианта x
следует использовать значение x*i– абсциссу середины i-го интервала.В теории вероятностей аналогом средней взвешенной величины является математическое ожидание случайной величины.
Помимо средней арифметической в математической статистике применяется средняя гармоническая величина
. – средняя величина из обратных значений признака.Средняя гармоническая простая вычисляется по формуле
. (3)Средняя гармоническая взвешенная используется тогда, когда статистическая информация не содержит частот
по отдельным вариантам совокупности, а представлена как их произведение , и определяется по формуле . (4)Пример. В таблице представлены данные о заработных платах.
Группы рабочих | Зар. плата ( ) | Фонд оплаты труда ( ) |
1 | 1500 | 48000 |
2 | 1300 | 58500 |
3 | 1700 | 39100 |
Определить среднюю заработную плату по цеху.
Средняя заработная плата по цеху равна суммарному фонду оплаты труда
, деленному на общее число рабочих , т.е. вычисляется по формуле (4.4) средней гармонической взвешенной руб.При анализе динамики явлений, когда рассматриваются относительные величины, используют среднюю геометрическую величину
– корень n-ой степени из произведения n значений признака, позволяющую определить средний коэффициент роста явления. Средняя геометрическая простая определяется по формуле . (5)Средняя геометрическая взвешенная вычисляется по формуле
. (6)Если какой-либо количественный признак имеет разные значения у различных единиц совокупности, говорят, что он имеет вариацию. Для характеристики размера вариации в статистике применяются показатели вариации: размах вариации, среднее линейное отклонение, дисперсия, среднее квадратическое отклонение (стандарт).
Размах вариации Rпредставляет собой разность между максимальным и минимальным значениями признака в совокупности
R =
x .Среднее линейное отклонение dпредставляет собой среднее арифметическое абсолютных значений отклонений вариантов от средней арифметической и рассчитывается по формуле
Дисперсия (от лат. dispersus – рассеянный, рассыпанный) представляет собой среднее арифметическое квадратов отклонений вариантов от среднего значения.
Дисперсия, рассчитанная по данным несгруппированного вариационного ряда, записыва-ется в виде
.Для сгруппированного вариационного ряда формула вычисления дисперсии имеет вид
. (7)Преобразовав выражение (7), получим иной вид записи дисперсии
.Среднее квадратическое отклонение (стандарт) S представляет собой квадратный корень из дисперсии
.Коэффициент вариации V – выраженное в процентах отношение среднего квадратического отклонения и среднего арифметического:
.Коэффициент вариации является критерием типичности, достоверности средней. Если коэффициент вариации не велик (не превышает 35%), это значит, что средняя величина характеризует совокупность по признаку, который мало изменяется при переходе от одной единицы совокупности к другой. Типичность такой средней высока, и в последующих вычислениях и выводах вариационный ряд может быть заменён своим средним значением. Если коэффициент вариации превышает 35%, то среднее арифметическое не является типичным значением вариационного ряда, и использование его в качестве средней характеристики некорректно.
Пример. Имеются данные о средней месячной выработке изделий рабочими бригады
Средняя месячная выработка Изделий рабочим (штук) (X) | 140-160 | 160-180 | 180-200 | 200-220 |
Число рабочих (F) | 1 | 3 | 4 | 2 |
Определить показатели вариации.
Сформируем вспомогательную таблицу, обозначив
середину i-го интервалаX | F | ||||||
140-160 | 1 | 150 | 150 | -34 | 34 | 1156 | 1156 |
160-180 | 3 | 170 | 510 | -14 | 42 | 196 | 588 |
180-200 | 4 | 190 | 760 | +6 | 24 | 36 | 144 |
200-220 | 2 | 210 | 420 | +26 | 52 | 676 | 1352 |
Итого | 10 | 1840 | 152 | 3240 |
Cредняя арифметическая месячная выработка
= шт.