Случайная величина
имеет числовые характеристики и другие. Значения этих характеристик мы не знаем, это – теоретические числа. По элементам выборки мы должны оценить эти теоретические числа - дать их точечные оценки. Так как эмпирическая случайная величина понимается нами как статистическая модель исследуемой случайной величины , то естественно принять значения числовых характеристик в качестве точечных оценок неизвестных значений числовых характеристик. Так как мы приняли, что , а эмпирическая случайная величина - случайная величина дискретного типа, то , . То есть предлагается эмпирическое математическое ожидание - среднее арифметическое элементов выборки и эмпирическую дисперсию принять в качестве точечных оценок.Обобщая сказанное, теоретические числовые характеристики исследуемой случайной величины обозначим
, а соответствующие эмпирические числовые характеристики, предлагаемые в качестве оценок, обозначим .Любая точечная оценка
является функцией элементов выборки: . Элементы, попавшие в выборку – случайные величины. Следовательно, функция - случайная величина. Всякую функцию элементов выборки будем называть статистикой.Но функций от элементов выборки можно придумать много. И каждую придуманную функцию можно предложить в качестве статистической оценки теоретической числовой характеристики. Возникает вопрос: «Как выбрать из множества предлагаемых точечных оценок наилучшую оценку?». Чтобы ответить на этот вопрос, мы должны сформулировать требования, исходящие из здравого смысла, и проверять выполнение этих требований к предлагаемым точечным оценкам. Та оценка, которая будет удовлетворять всем требованиям, будет наилучшей оценкой и будет принята в качестве точечной оценки неизвестного значения числовой характеристики.
Формулировки требований состоятельности, несмещённости и эффективности, предъявляемые к точечным оценкам, основаны на знании закона больших чисел и центральной предельной теоремы теории вероятностей. Логичность и справедливость этих требований не вызывает сомнений.
Рассматриваемые методы получения точечных оценок, позволяют обоснованным теорией вероятностей путём получать их и проверять выполнение сформулированных требований к ним.
Модуль 7. Интервальные оценки числовых характеристик
Цель модуля: Продолжить знакомство с приёмами первичной обработки статистических данных. Узнать три типа распределений случайных величин, которые используются при определении закона распределения различных функций статистических данных.
Кроме точечной оценки
значения теоретической числовой характеристики изучаемой случайной величины исследователю иногда бывает необходимо знать интервал , в котором с достаточно большой степенью уверенности (0,9; 0,95; 0,999,…) может находиться неизвестное значение числовой характеристики . То есть, при заданном уровне надёжности ,по имеющейся выборке надо определить границы интервала и так, чтобы выполнялось неравенство: .Вероятность называется доверительной вероятностью, а интервал
- доверительным интервалом.Ясно, что границы интервала, как функции элементов выборки, являются статистиками – случайными величинами:
и . Значит для определения при заданной доверительной вероятности их числовых значений, надо знать закон распределения вероятностей этих статистик.Наиболее часто в математической статистике используются три распределения вероятностей: распределение Пирсона, распределение Стьюдента и распределение Фишера-Снедекора. Случайные величины
, и , подчиняющиеся, соответственно, этим распределениям, являются функциями независимых случайных величин, имеющих одинаковое нормальное распределение N(0,1).Применение этих трёх распределений в математической статистике основано на предположении о нормальном распределении исследуемого количественного признака, определённого на генеральной совокупности, и некоторых статистик, что, в свою очередь, обосновывается центральной предельной теоремой теории вероятностей.
Модуль8.Статистическая проверка гипотез
Цель модуля: Ознакомить студентов с одним из способов научного мышления по схеме рассуждений, называемой силлогизмом. Научить постановке задачи, практическим действиям при решении её и правилам принятия решений при статистической проверке гипотез.
Статистическая проверка гипотез осуществляется по схеме научного мышления, называемого силлогизмом.
Силлогизм – дедуктивное логическое умозаключение, состоящее из посылок и выводов.
Гипотеза – научное предположение, выдвигаемое для объяснения каких-нибудь явлений.
Исследование, изучение количественного признака – случайной величины
мы осуществляем, наблюдая попавшие в выборку возможные значения этой случайной величины. Проведя первичную обработку статистических данных , вычислив по этим данным значения точечных оценок числовых характеристик, мы выдвигаем предположения - гипотезы о виде закона распределения вероятностей, о значениях числовых характеристик случайной величины и т.п.Гипотеза – научное предположение, выдвигаемое для объяснения каких-нибудь явлений.
Ту гипотезу, которая нам особенно важна, или дорога, будем называть основной гипотезой и обозначать
. Остальные гипотезы (по крайней мере, должна быть хотя бы одна гипотеза) будем называть альтернативными гипотезами и обозначать . На самом деле, то есть в реальности, может быть справедлива только основная гипотеза , или одна из альтернативных гипотез .Для проверки справедливости основной гипотезы
подбирается критерий проверки гипотезы , являющийся мерой расхождения между предполагаемыми, гипотетическими и опытными, полученными по выборке, значениями или характеристиками исследуемой случайной величины. Критерий - функция элементов выборки, статистика. Следовательно, существует закон распределения статистики T: .