
(1)
називається надійністю оцінки

. Рівність (1) можна переписати у вигляді

,

.
Виходить, що ймовірність того, що випадковий інтервал

покриває невідоме значення параметра
qдорівнює
g. Такий інтервал називається
довірчим. Отже, інтервальна оцінка визначається довірчим інтервалом та надійністю. Чим менша надійність, тим вужчий довірчий інтервал, і навпаки. На практиці надійність задається близькою да
1. Найбільш часто задають надійності
0.95,
0.99 і
0.999.
6.Статистичні оцінки чисельних характеристик дискретних розподілів
Нехай X дискретна випадкова величина із розподілом

.(1.2)
Множина значень випадкової величини X є генеральною сукупністю і вважається відомою.
Приклад 4.1.1. Кількість очок, яка випадає при киданні несиметричного кубика є дискретною випадковою величиною з розподілом

з відомими значеннями та невідомими ймовірностями.
Нехай потрібно знайти математичне сподівання

випадкової величини
X (яке в математичній статистиці називається
генеральним середнім і позначається

) та дисперсію

(
генеральну дисперсією 
). Для цього здійснюють вибірку об’єму
n.
Статистичною оцінкою генерального середнього є випадкова величина

,(1.3)
де

– дискретна випадкова величина – кількість значень

у вибірці. Вона може набувати значень від
0 до
n. Статистична оцінка

є незміщенною (

), ефективною та умотивованною.
Доведення. Якщо вважати, що вибірка здійснюється по одному, то випадкову величину

можна також представити як суму випадкових величин

- варіанта при

-вийманні, кожна з яких має розподіл, який співпадає з розподілом випадкової величини

:

Тому для математичного сподівання випадкової величини

можна записати

З врахуванням того, що випадкові величини

мають однаковий розподіл з випадковою величиною

можна записати, що

,
і, як наслідок,

.
Отже, статистична оцінка

є незміщенною.
Дисперсії випадкових величин

однакові. Якщо вони обмежені, то згідно теореми Чебишева (3.9.2.1

,
а це означає, що

по ймовірності збігається до генерального середнього, що, у свою чергу, означає, що

є ефективною статистичною оцінкою генерального середнього.
Випадкова величина (вибіркова дисперсія)

(1.4)
є зміщенною (

) статистичною оцінкою дисперсії дискретної випадкової величини
X – генеральної дисперсії. Тому для генеральної дисперсії використовується “виправлена” вибіркова дисперсія

,(1.5)
яка є незміщенною (

), ефективною та умотиванною.
Різниця між вибірковою та “виправленною” вибірковою дисперсіями при достатньо великому об’ємі вибірки мала. На практиці користуються “виправленною” дисперсією , якщо приблизно

.
Для оцінки середньоквадратичного відхилення генеральної сукупності (в цьому випадку - дискретної випадкової величини X) використовують “виправлене” середньоквадратичне відхилення вибірки

,(1.6)
яка є незміщенною (

,
sz – середньоквадратичне відхилення генеральної сукупності), ефективною та умотивованною.
Статистичними оцінками ймовірностей

є відносні частоти
, які є незміщенними (

), ефективними та умотивованими.
Довірчі інтервали ймовірностей

обчислюються за формулами

,(1.7а)

.(1.7b)
Значення змінної t (різне для кожного i) знаходиться з умови

, де

- інтеграл Лапласа,

- надійність відносної частоти

як статистичної оцінки ймовірності
pi.
Приклад 1.2. Несиметричний кубик кинули 80 разів і при цьому шість очок випало 16 разів. Знайти довірчий інтервал для невідомої ймовірності

з надійністю
0.9Розв’язування. За умовою задачі

. Відносна частота

.Значення змінної
t знаходиться рівняння

. Розв’язок рівняння

. За формулами (4.1.6а) та (4.1.6b)

,

.
Отже, довірчий інтеграл для оцінки невідомої ймовірності

з надійністю
0.97. Метод максимальної правдоподібності
Метод максимальної провдоподібності використовуються для знаходження статистичних оцінок параметрів розподілів випадкових величин (як дискретних, розподіл яких задається аналітичним виразом, так і неперервних випадкових величин).
Нехай X – випадкова величина з розподілом (якщо вона дискретна) або густиною розподілу ймовірностей (якщо вона неперервна)

, який (яка) однозначно визначається параметром

, і який невідомий. Для його визначення здійснюється
n експериментів. Результати кожного з експериментів є випадковими величинами

. Очевидно, що розподіли цих випадкових величин співпадають з функцією

випадкової величини
X. Експерименти незалежні, тому за теоремою множення ймовірностей незалежних подійможна записати

.