Случайную величину
будем называть центрированной и нормированной суммой.Интегральную теорему Муавра-Лапласа можно теперь сформулировать так:
Если
, последовательность независимых, одинаково распределённых бернуллиевских случайных величин, то, при , последовательность функций распределения случайных величин сходится к функции распределения нормального закона N(0,1): .Аналогично теорему Бернулли можно, переписать так:
.Если обозначить:
, то теорему Бернулли сформулируем так:Если
, последовательность независимых, одинаково распределённых бернуллиевских случайных величин, то, при , случайная величина с вероятностью близкой к единице принимает значения, мало отличающиеся от нуля:Обращаясь к теореме Пуассона, рассмотрим «двойную» последовательность бернуллиевских случайных величин
. Для каждого nслучайные величины , , имеют одинаковое распределение . Вероятности уменьшаются с изменением n. Обозначим .Теорема Пуассона:
Если
, но так что , то, при , случайная величина имеет распределение вероятностей мало отличающееся от распределения вероятностей закона Пуассона, то есть: .Суммируя всё, можем сказать, что для случайной величины
, являющейся суммой независимых бернуллиевских случайных величин , в качестве предельного распределения вероятностей при будет нормальное, вырожденное или пуассоновское распределение вероятностей.Естественно возникает вопрос: «А если снять ограничение, состоящее в том, что случайные величины
- бернуллиевские? Какие ограничения надо наложить на последовательность случайных величин , чтобы их суммы и в качестве предельного при имели, соответственно, нормальное, вырожденное и пуассоновское распределение вероятностей?».Определяем три новых понятия: «Закон больших чисел», «Центральная предельная теорема» и «Закон малых чисел». Знакомимся с теоремами, в которых на последовательности случайных величин
налагаются ограничения, при которых:1)
имеет распределение, мало отличающееся от нормального ( N(0,1));2)
имеет распределение, мало отличающееся от вырожденного ( );3)
имеет распределение, мало отличающееся от распределения Пуассона ( ( )).Необходимо уметь объяснить практическую значимость предельных теорем для последовательностей независимых случайных величин.
Математическая статистика
Модуль 6. Первичная обработка статистических данных. Точечные оценки числовых характеристик
Цель модуля: Узнать новую терминологию, понятия и определения математической статистики. Показать приёмы и правила первичной обработки статистических данных, принципы выбора точечных оценок числовых характеристик изучаемых случайных величин.
Математическая статистика - самостоятельная математическая дисциплина, имеющая свой словарь терминов, с которым мы знакомимся, как и при изучении теории вероятностей, путём введения основных понятий и определений. Изучение свойств введённых терминов и формулирование выводов, которые делаются по результатам обработки статистических данных, проводятся путём использования основных положений теории вероятностей.
Надо всё время иметь в виду, что все объекты и построения математической статистики являются экспериментальными моделями объектов и построений, которые вводились и изучались в теории вероятностей.
Первыми основными понятиями являются понятия «генеральная совокупность» и «выборка».
Генеральная совокупность – это все объекты, обладающие интересующим нас количественным признаком. Исследуемый количественный признак – случайная величина. Каждый объект генеральной совокупности имеет определённое значение количественного признака. Это значение количественного признака является одним из возможных значений случайной величины. Наблюдая объекты генеральной совокупности, мы фиксируем возможные значения случайной величины. Частота встречаемости возможных значений случайной величины определяется законом распределения вероятностей этой случайной величины.
Однако не всегда удаётся, а иногда просто невозможно, обследовать все объекты генеральной совокупности для определения значения количественного признака, которым они обладают. Для изучения случайной величины из генеральной совокупности отбирают некоторое количество объектов и определяют значения количественного признака, которым обладают эти объекты.
Полученные значения количественного признака
у этих объектов будут называться статистическими данными или выборкой из генеральной совокупности, если они репрезентативны. Под термином репрезентативность (представительность) мы понимаем, что полученные данные вполне отражают в общих чертах особенности количественного признака, которым обладают объекты генеральной совокупности.Различные методики отбора объектов из генеральной совокупности, стремятся обеспечить репрезентативность получаемых данных. Мы отмечаем, что попадание каждого объекта в выборку должно быть независимым от остальных объектов. Измерения значений количественного признака у выбранных объектов должны проводиться по одной методике, в одинаковых условиях и одним и тем же инструментом.
Если полученная выборка
- репрезентативна, то на её элементы мы будем смотреть двояко. С одной стороны мы элементы выборки будем рассматривать как набор n чисел, являющихся значениями эмпирической случайной величины . А с другой стороны - как на n-мерный случайный вектор с независимыми, одинаково распределёнными компонентами.При первичной обработке статистических данных строится вариационный ряд, являющийся, по существу, рядом распределения эмпирической случайной величины . При этом мы считаем, что все элементы выборки - равновозможные, то есть
. Геометрическая иллюстрация вариационного ряда – гистограмма даёт наглядное представление о характере распределения вероятностей исследуемой случайной величины . Теорема Гливенко показывает, что при с вероятностью близкой к единице значения эмпирической функции распределения будут очень мало отличаться от значений теоретической функции распределения исследуемой случайной величины .