або Аγ = 0, де А-матрица розміру (К- 1)×2K рангу K-1. Використовуючи загальну теорію регресії з q = K-1, n = N і р = 2К, одержуємо, що статистика критерія для перевірки гіпотези H1, має вигляд
(1.4.2)Для знаходження RSS необхідно мінімізувати
S = ε'ε =
.Продиференціюємо S по αk та βk
З перших K рівнянь системи знаходимо, що
Підставляємо αk в (1.4.4)
(1.4.5)Тоді
Підставляємо оцінки в S. ЗнаходимоRSS =
(1.4.6)Для знаходження
мінімізуємо суму S = відносно α і β. Продиференціюємо S по αk та β (k = 1, 2, …, K)З перших K рівнянь системи знаходимо
Підставляємо знайдені αk в друге рівняння системи
Тоді
Підставляючи оцінки
в S, знаходимоОтже, гіпотезу H1: β1 = β2 = . . . = βK = β відхиляємо при
і не відхиляємо в супротивному разі. Рівень значущості критерію α.
Критерій збігу прямих
Для вирішення питання про збіг всіх K ліній регресії розглянемо гіпотезу H2: α1 = α2 = ... = αK і β1 = β1 = ... = βK, або, що те ж саме, H2: α1- αK = = α2 - αK = ... = αK-1 - αK = 0 і β1 - βK = ... = βK-1 - βK = 0.
В матричній формі гіпотеза H2 приймає вигляд:Aγ = 0, зокрема
Матриця А має розмір (2K-2) рядків, 2K стовпців (ранг 2М – 2).
F – статистика для перевірки гіпотези H2 має вигляд
(1.4.7)Знайдемо RSSH2. Для знаходження RSSH2 необхідно мінімізувати суму
по α і β, одержуємоІз першого рівняння знаходимо
Підставляючи α в перше рівняння системи одержуємо β
Тоді
Отже,
Отже, гіпотезу H2:α1 = α2 = ... = αK і β1 = β1 = ... = βK відхиляємо при
> Fα,(2K-2),(N-2K)і не відхиляємо в супротивному разі. Рівень значущості критерію α.
На практиці спочатку застосовують критерій паралельності прямих, а потім вже, якщо гіпотеза Н1 не відхиляється, перевіряють гіпотезу H2 (вважаючи, що гіпотеза H1 справелива), використовуючи статистику
.РОЗДІЛ 2. ДОСЛІДЖЕННЯ ЗАХВОРЮВАНОСТІ НА ТУБЕРКУЛЬОЗ, РАК, СНІД, ГЕПАТИТ А, ГЕПАТИТ Б
2.1 Дослідження захворюваності на туберкульоз (всі форми), туберкульоз легенів
Необхідно перевірити гіпотезу про наявність лінійної залежності між y- захворюваністю на туберкульоз на 100 000 населення та х – роком проведення спостереження, оцінити невідомі параметри
лінійної одновимірної регресії , побудувати довірчі інтервали для параметрів .Захворюваність на туберкульоз в кожній з 24 областей, А.Р.Крим, м.Київ та м. Севастополі, а також в Україні в цілому розглядається окремо.
Для кожної області дослідження залежності захворюваності на туберкульоз від року спостереження проводиться так:
1) знаходяться МНК- оцінки
коефіцієнтів регресії ;2) перевіряється гіпотеза H0:
про значущість вільного члена регресії за допомогою t – критерію;3) перевіряється гіпотеза H0:
про значущість коефіцієнта при незалежній змінній x за допомогою F- критерію та t- критерію;4) перевіряється гіпотеза H0:
про значущість коефіцієнта кореляції за допомогою t- критерію;5) будується довірчий інтервал для
з коефіцієнтом довіри 0,95;6) будується довірчий інтервал для
з коефіцієнтом довіри 0,95;7) будується довірчий інтервал для
з коефіцієнтом довіри 0,95.А. Р. Крим
Рис.2.1.1 Захворюваність на туберкульоз на 100000 населення в А.Р. Крим (всі форми)
Лінійна регресія
4,2862х – 8512,2 значуща.F = 124,76 >
= 4,6; t1 = 11,17 > = 2,145, гіпотеза H0:b1 = 0 відхиляється на рівні значущості α = 0,05.t0 = |-11,105| >
= 2,145 – гіпотеза H0:b0 = 0 відхиляється на рівні значущості α = 0,05.tR = 11,17 >
= 2,145 – гіпотеза H0:R = 0 відхиляється на рівні значущості α = 0,05.Вінницька область
Рис. 2.1.2 Захворюваність на туберкульоз на 100000 населення в Вінницькій області, (всі форми)
Лінійна регресія
2,5399х – 5024 значуща.F = 82,203 >
= 4,6, t1 = 9,07 > = 2,145, гіпотеза H0:b1 = 0 відхиляється на рівні значущості α = 0,05.t0 = |-8,978| >
= 2,145 – гіпотеза H0:b0 = 0 відхиляється на рівні значущості α = 0,05.tR = 9,07 >
= 2,145 – гіпотеза H0:R = 0 відхиляється на рівні значущості α = 0,05.Волинська область
Рис. 2.1.3 Захворюваність на туберкульоз на 100000 населення в Волинській області, (всі форми)
Лінійна регресія
2,396х – 4735,2 значуща.F = 129,62 >
= 4,6, t1 = 11,385 > = 2,145, гіпотеза H0:b1 = 0 відхиляється на рівні значущості α = 0,05.