Если функция f*(x) – бимодальная (имеет два максимума), то статистическое данные неоднородные.
Методы математической статистики должны позволить сделать обоснованные выводы о числовых параметрах и законе распределения генеральной совокупности по ограниченному числу выборок из этой совокупности.
Состав выборок случаен и выводы могут быть ложными. С увеличением объема выборки вероятность правильных выводов растет. Всякому решению, принимаемому при статистической оценке параметров, ставится в соответствие некоторая вероятность, характеризующая степень достоверности принимаемого решения.
Задачи оценки параметров распределения ставятся следующим образом:
Есть СВ Х, характеризуемая функцией F(X, q).
q – параметр, подлежащий оценке.
Делаем m независимых выборок объемом n элементов xij (i – номер выборки, j – номер элемента в выборке).
1 x11, x12, …, x1n X1
2 x21, x22, …, x2n X2
…
mxm1, xm2, …, xmnXm
Случайные величины X1, X2,…Xm мы рассматриваем как m независимых СВ, каждая из которых распределена по закону F(X, q).
Всякую однозначную функцию наблюдений над СВ х, с помощью которой судят о значении параметра q, называют
Выбор оценки, позволяющей получить хорошее приближение к оцениваемому параметру – задача исследования.
Основные свойства оценок
Несмещенность, эффективность и состоятельность.
Оценка
Если
Несмещенность оценки гарантирует отсутствие систематической ошибки в оценке параметра.
Несмещенных оценок может быть несколько.
Разброс параметров или рассеяние величины относительно математического ожидания q характеризует дисперсия D(
Из двух или более несмещенных оценок предпочтение отдается оценке, обладающей меньшим рассеянием относительно оцениваемого параметра.
Оценка
На практике не всегда удается удовлетворить одновременно всем трем требованиям.
Оценка математического ожидания по выборке
Теорема 1. Среднее арифметическое
Доказательство: x1,x2,…,xnM(x)=mM(x1)=M(x2)=…=M(xn)=m
Теорема 2. Среднее арифметическое
Доказательство: D(x)=s2D(x1)=D(x2)=…=D(xn)=s2
Теорема 3. Если СВ Х распределена по нормальному закону с параметрами (m,s2), то несмещенная и состоятельная оценка
Оценки дисперсии по выборке
Если случайная выборка состоит из n независимых наблюдений над СВ Х с M(X)=m и D(X)=s2, то выборочная дисперсия не является несмещенной оценкой дисперсии генеральной совокупности.
Несмещенной оценкой D(x) является
Легко доказать по формуле Чебышева, что оценки S2 и
Несмещенная, состоятельная и эффективная оценка дисперсии:
Если МО генеральной совокупности неизвестно, то используют
Существуют регулярные методы получения оценок параметров генеральной совокупности по данным выборок.
Методы оценки параметров генеральной совокупности
Метод наибольшего (максимального) правдоподобия (МНП)(ММП) обладает следующими достоинствами:
1. Всегда приводит к состоятельным оценкам (иногда смещенным)
2. Получаемые оценки распределены асимптотически нормально и имеют минимально возможную дисперсию по сравнению с другими асимптотически нормальными оценками.
Недостаток: требуется решать громоздкие системы уравнений.
Имеется СВ Х, f(x,q) – функция ее плотности вероятности, выражение которой известно.
q – неизвестный параметр, подлежащий оценке.
x1, x2,…,xn – n независимых наблюдений над СВ x.
В основе МНП лежит функция L(q) – функция правдоподобия, формирующаяся с учетом свойств многомерной функции распределения наблюдений над СВ х.
f(x1, x2,…,xn,q)=f(x1, q)×f(x2,q)×…×f(xn,q)
В указанное равенство подставляются данные и получаем функцию L(q):
L(q)=f(x1, q)×f(x2,q)×…×f(xn,q)
За максимальное правдоподобное значение параметра q принимаем
L'(q)=0 => qmax=
Метод моментов(Метод Пирсона).
Метод обладает следующими достоинствами:
1. Оценки получаемые этим методом всегда являются состоятельными.
2. Метод моментов мало зависит от закона распределения случайной величины.
3. Сложность вычисления незначительна.
Известна случайная величина Х, которая характеризуется f(x, θ1, θ2…θq), аналитический вид этой функции известен.
По выборке объёмом n х1,х2,х3,…хn – значения случайной величины в выборке вычисляем эмпирические начальные моменты случайной величины:
Находим теоретические моменты:
Основная идея метода моментов заключается в приравнивании значения эмпирических значений моментов теоретическим.
Решим систему q-уравнений с q-неизвестными:
Состоятельность этих оценок основана на том, что эмпирические моменты при достаточно большом n (n→∞) стремится к теоретическим. Выполняется закон больших чисел.
Распределение средней арифметической для выборки
из нормальной совокупности. Распределение Стьюдента.
Выборочное среднее рассчитанное по конкретной выборке, есть конкретное число. Состав выборки случаен и среднее арифметическое вычисленное по элементам другой выборки того же объёма, будет число отличное от первого.
Теорема: Если случайная величина Х подчиняется нормальному закону с параметрами m и σ2 Х(m, σ2), а х1,х2,х3,…,хn – это выборка из генеральной совокупности, то средняя арифметическая:
так же является случайной величиной подчиняющаяся нормальному закону с параметрами m и σ2/n, а нормированная случайная величина:
так же подчиняется нормальному закону с параметрами (0;1).
Предполагается при использовании таблиц интеграла вероятности, что объём выборки n достаточно велик(n ≥ 30).
Существует достаточно большое количество технических задач в которых не удаётся собрать выборку такого объёма. Тем не менее анализу такой выборки необходимо дать вероятностную оценку.