НОРМАЛЬНИЙ РОЗПОДІЛ, який також називають розподілом Гауса, - розподіл вірогідності, який грає найважливішу роль в багатьох галузях знань, особливо у фізиці. Фізична величина підкоряється нормальному розподілу, коли вона схильна до впливу величезного числа випадкових перешкод. Ясно, що така ситуація украй поширена, тому можна сказати, що зі всіх розподілів в природі найчастіше зустрічається саме нормальний розподіл - звідси і походить одна з його назв.
Нормальний розподіл залежить від двох параметрів - зсуву і масштабу, тобто є з математичної точки зору не одним розподілом, а цілим їх сімейством. Значення параметрів відповідають значенням середнього (математичного очікування) і стандартного відхилення.
Стандартним нормальним розподілом називається нормальний розподіл з математичним очікуванням 0 і стандартним відхиленням 1.
Щільність вірогідності нормального розподілу
Функція розподілу
Функція моментів нормального розподілу має вигляд
Нормальні розподіли утворюють масштабно-зсувне сімейство. При цьому параметром масштабу є d = 1/
За допомогою нормального розподілу визначаються три розподіли, які в даний час часто використовуються при статистичній обробці даних.
РОЗПОДІЛ ПІРСОНУ (хі - квадрат) - розподіл випадкової величини
де випадкові величини X1, X2., Xnнезалежні і мають один і той же розподіл N(0,1).
Розподіл хі-квадрат використовують при оцінюванні дисперсії (за допомогою довірчого інтервалу), при перевірці гіпотез згоди, однорідності, незалежності, перш за все для якісних (категорізованих) змінних, що приймають кінцеве число значень, і в багатьох інших завданнях статистичного аналізу даних.
РОЗПОДІЛ СТЬЮДЕНТА - це розподіл випадкової величини
де випадкові величини U і X незалежні, U має розподіл стандартний нормальний розподіл N(0,1), а X - розподіл хі - квадрат з n мірами свободи. При цьому n називається «Числом мір свободи» розподілу Стьюдента.
Розподіл Стьюдента був введений в 1908 р. англійським статистиком Ст. Госсетом, що працював на фабриці, що випускає пиво. Ймовірносно-статистичні методи використовувалися для ухвалення економічних і технічних рішень на цій фабриці, тому її керівництво забороняло В. Госсету публікувати наукові статті під своїм ім'ям. У такий спосіб охоронялася комерційна таємниця, «ноу-хау» у вигляді ймовірносно-статистичних методів, розроблених Ст. Госсетом. Проте він мав можливість публікуватися під псевдонімом «Стьюдент». Історія Госсета - Стьюдента показує, що ще сто років тому менеджерам Великобританії була очевидна велика економічна ефективність ймовірносно-статистичних методів.
В даний час розподіл Стьюдента - один з найбільш відомих розподілів серед використовуваних при аналізі реальних даних. Його застосовують при оцінюванні математичного очікування, прогнозного значення і інших характеристик за допомогою довірчих інтервалів, по перевірці гіпотез про значення математичних очікувань, коефіцієнтів регресійної залежності, гіпотез однорідності вибірок і так далі
Розподіл Фішера - це розподіл випадкової величини
де випадкові величини Х1 і Х2 незалежні і мають розподіли хі - квадрат з числом мір свободи k1і k2відповідно. При цьому пара (k1, k2) - пара «чисел мір свободи» розподілу Фішера, а саме, k1- число мір свободи чисельника, а k2- число мір свободи знаменника. Розподіл випадкової величини F названий на честь великого англійського статистика Р.Фішера (1890-1962), що активно використав його в своїх роботах.
Розподіл Фішера використовують при перевірці гіпотез про адекватність моделі в регресійному аналізі, про рівність дисперсій і в інших завданнях прикладної статистики.
Виразу для функцій розподілу хі - квадрат, Стьюдента і Фішера, їх щільності і характеристик, а також таблиці, необхідні для їх практичного використання, можна знайти в спеціальній літературі.
Якщо потрібно отримати теоретичні частоти f' при вирівнюванні варіаційного ряду по кривій нормального розподілу, то можна скористатися формулою
де
За допомогою цієї формули ми отримуємо теоретичний (імовірнісне) розподіл, замінюючи ним емпіричний (фактичне) розподіл, по характеру вони не повинні відрізнятися один від одного.
Порівнюючи отримані величини теоретичних частот f' з емпіричними (фактичними) частотами f, переконуємося, що їх розбіжності можуть бути вельми невеликі.
Об'єктивна характеристика відповідності теоретичних і емпіричних частот може бути отримана за допомогою спеціальних статистичних показників, які називають критеріями згоди.
Для оцінки близькості емпіричних і теоретичних частот застосовуються критерій згоди Пірсону, критерій згоди Романовського, критерій згоди Колмогорова[1].
Найбільш поширеним є критерій згоди К. Пірсона, який можна представити як суму відносин квадратів розбіжностей між f' і f до теоретичних частот:
Обчислене значення критерію необхідно порівняти з табличним (критичним) значенням . Табличне значення визначається по спеціальній таблиці, воно залежить від прийнятої вірогідності Р і числа мір свободи до (при цьому до = m - 3, де m - число груп у ряді розподілу для нормального розподілу). При розрахунку критерію згоди Пірсону повинна дотримуватися наступна умова: достатньо великим повинне бути число спостережень (n
Якщо
В тому випадку, якщо відсутні таблиці для оцінки випадковості розбіжності теоретичних і емпіричних частот, можна використовувати критерій згоди В.І. Романовського КРом , який, використовуючи величину
де m - число груп; до = (m - 3 ) - число мір свободи при численні частот нормального розподілу.
Якщо вищезгадане відношення < 3, то розбіжності емпіричних і теоретичних частот можна вважати випадковими, а емпіричний розподіл - відповідним нормальному. Якщо відношення > 3, то розбіжності можуть бути достатньо істотними і гіпотезу про нормальний розподіл слід відкинути.
Критерій згоди А.Н. Колмогорова використовується при визначенні максимальної розбіжності між частотами емпіричного і теоретичного розподілу, обчислюється за формулою
де D - максимальне значення різниці між накопиченими емпіричними і теоретичними частотами;
По таблицях значень вірогідності
Необхідною умовою при використанні критерію згоди Колмогорова є достатньо велике число спостережень (не менше ста).
За первинними даними щодо розміру кредитування юридичних осіб установами комерційних банків України станом на 01/01/2009 р, наведеними в додатку 1, побудуємо статистичний ряд розподілу та розрахуємо основні показники ряду розподілу.
Визначимо кількість груп, скориставшись формулою Стерджесса:
Визначимо розмір інтервалу, скориставшись формулою: