По виду корреляционной таблице можно судить о виде корреляционной зависимости.
Вычислим середины частичных интервалов
;i=1,…,n; j=1,…,m.
Внесем найденные значения в корреляционную таблицу. По таблице вычислим оценки математических ожиданий и дисперсий
; ; ; ; ; ; .Коэффициент линейной корреляции определяются по формуле:
Для простоты вычислений обычно используют замену переменных:
; ;где С1 и С2 – значения xi* и yj* соответствующие максимальной частоте
. Желательно, чтобы клетка с данной частотой находилась в середине таблицы. Точку (С1,С2) называют ложным нулем. Переменные U и V – принимают значения: 0; ±1; ±2,… , , , ; .При вычислениях используем, что
; .Коэффициент корреляции вычисляется по формуле:
.Вернемся к исходным переменным:
; ; ; .Уравнения регрессии:
; .Графики функций пересекаются в точке
.Пример:
Даны результаты 78 экспериментов:
X | Y | X | Y | X | Y | X | Y |
73 | -291 | 57 | -219 | 61 | -241 | 68 | -264 |
69 | -270 | 71 | -281 | 62 | -243 | 62 | -240 |
72 | -279 | 66 | -262 | 63 | -245 | 70 | -277 |
72 | -282 | 76 | -302 | 71 | -282 | 70 | -279 |
65 | -254 | 70 | -275 | 65 | -252 | 65 | -253 |
67 | -264 | 68 | -267 | 70 | -276 | 70 | -275 |
56 | -216 | 74 | -290 | 70 | -276 | 63 | -248 |
70 | -276 | 68 | -266 | 63 | -246 | 63 | -243 |
63 | -248 | 71 | -283 | 73 | -284 | 67 | -264 |
64 | -253 | 60 | -237 | 68 | -271 | 68 | -267 |
70 | -276 | 56 | -222 | 59 | -227 | 55 | -213 |
67 | -262 | 71 | -281 | 64 | -256 | 56 | -218 |
60 | -234 | 68 | -269 | 79 | -309 | 58 | -223 |
80 | -313 | 66 | -257 | 77 | -300 | 70 | -278 |
71 | -278 | 60 | -235 | 78 | -310 | 59 | -236 |
74 | -292 | 70 | -275 | 66 | -255 | 68 | -263 |
68 | -271 | 69 | -276 | 63 | -252 | 69 | -268 |
65 | -256 | 72 | -282 | 69 | -274 | 63 | -243 |
73 | -291 | 70 | -277 | 74 | -291 | 70 | -271 |
63 | -243 | 69 | -270 |
Начало первого интервала x0 = 53, y0 = –321;
Длина интервала h1 = 5, h2 = 17.
1. Построить корреляционное поле для 4-ых столбцов X и Y и методом “натянутой нити” найти линейные функции регрессии.
2. Составить корреляционную таблицу. Вычислить коэффициент линейной корреляции, найти уравнения регрессий и построить их графики.
3. Проверить гипотезу о незначимости коэффициента корреляции.
Решение.
1. По последним столбцам X и Y находим:
xmin=55; ymin=-279;
xmax=70; ymax=-213;
На осях отображаем тот промежуток, где находятся значения X и Y. Представляя в виде точек пары чисел (x1; yj) строим корреляционное поле:
Используя метод “натянутой нити”, проведём прямую. На прямой выберем две точки (57, -220) и (69, -270), расположенные достаточно далеко друг от друга.. Подставляя значения в функцию y=ax+b, получим систему уравнений относительно a и b.
,Получим решение a = - 4,17; b = 17,69. Уравнение линейной регрессии имеет вид: y = - 4,17 x + 17,69.
2. Найдём минимальные и максимальные значения X и Y среди результатов эксперимента:
xmin=55; ymin=-313; xmax=80; ymax=-213;
Составим корреляционную таблицу с шагом h1=5 по X и h2=17 по Y. Учитываем, что левая граница входит в интервал, а правая нет.
Клетка в шапке сверху содержит границы интервала по Y [yj, yj+1], значение середины интервала yj* и значение середины интервала для условной переменной V. Клетка в шапке слева содержит границы интервала по X [xi, xi+1], значение середины интервала xi* и значение середины интервала для условной переменной U.
Произвольная клетка таблицы содержит число результатов
, попавших в соответствующие интервалы. В нижней строке записываются суммы чисел в столбцах. В крайнем левом столбце – суммы чисел в строках.Таблица 8.
Y,V X,U | [321,-304) -312,5; -2 | [304,-287) -295,5; -1 | [287,-270) -278,5; 0 | [270,-253) -261,5; 1 | [253,-236) -244,5; 2 | [236,-219) -227, 5; 3 | [219,-202) -210,5 ; 4 | nx nu |
[53,58) 55,5;-3 | . 1 | . . . . 4 | 5 | |||||
[58,63) 60,5;-2 | . . . . 4 | . . . . 5 | 9 | |||||
[63,68) 65,5;-1 | . . . . 9 | . . . . . 11 | 20 | |||||
[68,73) 70,5;0 | .. 24 | . . . . 9 | 33 | |||||
[73,78) 75,5;1 | . . . . 7 | . 1 | 8 | |||||
[78,83) 80,5;2 | . . . 3 | 3 | ||||||
ny, nv | 3 | 7 | 25 | 18 | 15 | 6 | 4 | 78 |
Переход к условным вариантам.
; ;C1=70,5; С2=-278,5 – координаты клетки с максимальным числом результатов экспериментов.
, ,…, ; , ,…, ;Вычисляем средние:
.Вычислим среднее квадратов:
.Вычислим среднее квадратическое отклонение:
; ; ;