Ранговий коефіцієнт кореляції Спирмена
Коефіцієнт
Гіпотеза
Якщо
Порахуємо коефіцієнт Спирмена між Xi і Y в таблиці 2.1 з використанням спеціалізованої програми «Статистика».
N – обсяг вибірок
Spearman R – коефіцієнт рангової кореляції Спирмена
t (N‑2) – статистика
p-level – р-уровень
Тому що
Ранговий кореляційний зв'язок між Xi і Y є значимим.
Порахуємо коефіцієнт Спирмена між Xj і Y в таблиці 2.1 з використанням спеціалізованої програми «Статистика».
Тому що
Ранговий кореляційний зв'язок між Xj і Y є значимим.
На основі наведених даних спостережень будуються лінійна одновимірні Y=f(Xi) та багатовимірні Y=f (Xi, Xj) регресійні моделі, які встановлюютьє залежність результативної ознаки Y – середньорічного рівня надою молока від факторних ознак – Xi (кількості кормів на одну корову) та Xj (рівня приплоду телят на 100 корів) по 30 хазяйствам.
Одновимірна лінійна регресійна модель представляється як:
де
Існують різні способи оцінювання параметрів регресії. Найпростішим, найуніверсальнішим є метод найменших квадратів [48]. За цим методом параметри визначаються виходячи з умови, що найкраще наближення, яке мають забезпечувати параметри регресії, досягається, коли сума квадратів різниць
Відмітимо, що залишкова варіація (4.4) є функціоналом
За методом найменших квадратів параметри регресії
Розв’язок цієї системи має вигляд:
Середньоквадратична помилка регресії, знаходиться за формулою
Коефіцієнт детермінації для даної моделі
повинен дорівнювати:
Для характеристики кореляційного зв’язку між факторною і результативною ознаками побудуємо графік кореляційного поля та теоретичну лінію регресії, визначимо параметри лінійного рівняння регресії.
Для перевірки істотності зв’язку потрібно порівняти фактичне значення статистики Фішера (F-критерій) з його критичним (табличним) значенням, яке потрібно визначити з урахуванням умов аналітичного групування і заданого рівня істотності, скориставшись таблицею.
При виконанні процедури перевірки значущості коефіцієнта детермінації висувається нульова гіпотеза H0проти альтернативи H1, котрі полягають в наступному:
H0: істотної різниці між вибірковим коефіцієнтом детермінації та коефіцієнтом детермінації генеральної сукупності не існує. Ця гіпотеза рівносильна гіпотезі H0:b=0, тобто змінні X не впливають суттєво на залежну змінну Y. Для оцінки істотності коефіцієнта детермінації використовується статистика:
що має F-розподіл Фішера з f1=1 та f2=n‑2=30–2=28 ступенями вільності.
Значення статистики порівнюється з критичним значенням цієї статистики, знайденим за таблицею при заданому рівні значущості a=0,05 та відповідному числі ступенів вільності. Якщо F>F1,n-2,a, то обчислений коефіцієнт детермінації істотно відрізняється від нуля. Цей висновок забезпечується з ймовірністю 1-a. Рівень істотності a=0,05. Кількість ступенів вільності наступна: f1=1, f2=28.
Для лінійного зв’язку використовується лінійний коефіцієнт кореляції (Пірсона):
який набуває значень у межах +-1, тому характеризує не лише щільність, а й напрямок зв’язку. Додатне значення свідчить про прямий зв’язок, а від’ємне – про зворотний.
Щільність зв’язку оцінюється індексом детермінації: R=
На рис. 3.1 – 3.4 наведені лінійні та нелінійні регресійні одномірні моделі кореляційного зв’язку Y=F(Xi) та Y=f(Xj).Як видно з графіків рис. 3.1 – 3.2 коефіцієнт детермінації R2 для лінійної кореляції знаходиться в діапазоні 0,35 – 0,5, тобто лінійний одномірний кореляційний зв’язок є слабої сили. При побудові нелінійних одномірних рівнянь регресії (рис. 3.3 – 3.4) коефіцієнт детермінації R2 для нелінійної кореляції знаходиться в діапазоні 0,5 – 0,7, тобто нелінійний одномірний кореляційний зв’язок є сильним.