Рис. 3.22 – 3.24 Порівняння методу прямокутних внесків, методу зменшення невизначеності та методу апріорно-емпіричних функцій
З курсу матаматичної статистики відомо, що відхилення емпіричної функції від гіпотетичної, побудоване за формулою (3.1.1) при достатньо великих n має колмогорівський розподіл. За допомогою критерія Смірнова перевіримо гіпотезу про те, що відхилення, побудоване за формулою (3.1.2), має розподіл Колмогорова. Результати перевірки гіпотези наведено в таблицях 3.12-3.14.
Таблиця 3.12 Відхилення Смірнова
| |||
Обсяг вибірки | | | |
3 | 2,85 | 2,85 | 3,00 |
4 | 2,69 | 2,21 | 3,00 |
5 | 2,69 | 2,53 | 3,00 |
6 | 3,00 | 2,53 | 3,00 |
7 | 2,21 | 1,90 | 3,00 |
8 | 2,53 | 1,42 | 3,00 |
9 | 2,53 | 1,74 | 3,00 |
10 | 2,21 | 1,74 | 3,00 |
11 | 2,85 | 1,74 | 3,00 |
12 | 2,53 | 1,11 | 3,00 |
13 | 2,85 | 1,74 | 3,00 |
14 | 2,85 | 1,74 | 3,00 |
15 | 2,37 | 1,42 | 3,00 |
Таблиця 3.13 Відхилення Смірнова
| |||
Обсяг вибірки | | | |
3 | 1,26 | 2,37 | 2,53 |
4 | 1,11 | 1,42 | 2,53 |
5 | 1,26 | 1,90 | 2,06 |
6 | 0,63 | 1,26 | 2,53 |
7 | 2,21 | 1,58 | 2,37 |
8 | 2,21 | 1,26 | 2,37 |
9 | 2,53 | 1,74 | 2,53 |
10 | 2,85 | 1,26 | 1,74 |
11 | 2,53 | 1,42 | 2,21 |
12 | 3,00 | 1,42 | 1,74 |
13 | 2,69 | 1,26 | 1,74 |
14 | 3,00 | 0,79 | 1,74 |
15 | 2,85 | 1,11 | 1,90 |
Таблиця 3.14 Відхилення Смірнова
| |||
Обсяг вибірки | | | |
3 | 2,06 | 1,74 | 2,37 |
4 | 1,90 | 2,53 | 1,74 |
5 | 0,95 | 1,11 | 1,74 |
6 | 0,79 | 1,26 | 1,90 |
7 | 0,95 | 2,06 | 2,21 |
8 | 1,11 | 1,58 | 1,26 |
9 | 0,63 | 1,58 | 1,26 |
10 | 0,95 | 1,42 | 1,58 |
11 | 1,90 | 1,42 | 1,74 |
12 | 2,06 | 1,42 | 1,42 |
13 | 1,90 | 1,74 | 0,95 |
14 | 2,53 | 1,90 | 1,42 |
15 | 2,21 | 1,11 | 1,42 |
Відхилення Смірнова
обчислене для кожного з методів порівнювалось з
отже, гіпотеза про розподіл Колмогорова, відхилення (3.1.2), відхиляється.
Висновки
Для математичної статистики проблема малої вибірки завжди є цікавою та актуальною.
Трудоємність та матеріальні затрати не завжди дозволяють провести стохастичний експеримент достатню кількість разів для знаходження вибірки потрібного обсягу, тому на практиці доводиться приймати рішення, аналізуючи вибірку малого обсягу.
В сучасній науковій літературі відомості з цього питання різносторонні. Деякі автори вважають малими вибірками вибірки обсягом до 200 спостережень, інші автори називають малими вибірками вибірки обсягом до 50 спостережень. Експериментально встановлено, що для знаходження стійких оцінок необхідна вибірка обсягом 40-50 спостережень. На сьогоднішній день відкритим питанням залишається строго математичне означення малої вибірки.
Вибіркою малого обсягу, або малою вибіркою будемо називати вибірку, для аналізу якої не можна використати асимптотичні методи.
На практиці часто виникає питання: як оцінити розподіл малої вибірки? Яким методом? Адже методи, які засновані на групуванні вибіркових значень, застосовувати до малої вибірки неможна.
В дипломній роботі ставиться задача порівняння класичного методу оцінювання розподілу вибірки, в основі якого лежить побудова емпіричної функції розподілу, та сучасних методів оцінювання розподілу малої вибірки.
Розглянемо кожен з методів. Почнемо з класичного. Нехай
називають емпіричною функцією розподілу. Емпірична функція розподілу є незміщеною та спроможною оцінкою функції розподілу F(x). За міру відхилення функції розподілу
Розглянемо три методи оцінювання функції розподілу малої вибірки. Ці методи мають спільну ідею побудови оцінки функції розподілу, яка полягає в таких припущеннях: множина можливих значень випадкових величин
Для всіх методів оцінка щільності розподілу складається з двох компонент: апріорної та апостеріорної:
Різним методам оцінювання відповідають різні значення ваги
Розглянемо докладніше перший метод.
Метод прямокутних внесків був запропонований Чавчанідзе В.В. та Кумсішвілі В.А. в 1959 році.
Жодній випадковій величині з відрізка [а;b] не можна віддати перевагу. Саме таку властивість має рівномірний розподіл, щільність якого
будемо називати апріорною щільністю розподілу.
За вагу
Далі проводиться стохастичний експеримент, результатом якого є реалізація
Реалізація
А саме: припишемо кожній реалізації
При цьому для прямокутників, що виходять за межі інтервалу