Смекни!
smekni.com

Регрессионный анализ корелляции субъективного ВАШ и лабораторных признаков активности реактивного (стр. 4 из 12)

p = 0.4569

Таблица №1.5.2. Дисперсионный анализ по одному признаку.

Компонента дисперсии Сумма квадратов Степень свободы Средний квадрат
Между выборками 1210.5 3 403.498
Остаточная 82391 178 462.871
Полная 83601.5 181 -----

p>pкр

Вывод:

Следовательно мы принимаем нулевую гипотезу. т.е. можно предположить что при 5% уровне значимости ВАШБП не зависит от инфекции вызывающей реактивный артрит.

VI) Влияние фактора на показатель ВАШСП

Таблица 1.6.1.Зависимость ВАШСП от инфекции вызвавшей заболевание

1 группа 2группа 3группа 4группа
20 35 62 70
53 32 70 78
68 28 40 41
55 40 50 30
43 65 60 60
75 25 56 40
12 70 68 60
40 38 20 42
67 52 10 83
38 40 40 53
80 100 70 70
80 55 50 51
41 50 34 70
65 78 30 80
50 15 32 70
48 38 25 80
45 50 20 75
50 28 39 30
25 30 10 19
40 35 10
55 29 31
89 68 60
60 45 45
25 70 45
70 50 39
50 10 15
50 20 50
55 35 20
55 20 20
60 2 50
55 37 40
40 55
32 50
40
54
47
80
78
65
50
62
25
52
50
30
60
19
70
70
41
30
43
17
60
15
20
41
43
40
5
80
95
35
20
35
40
48
18
18
40
60
10
20
12
10
50
3
0
5
63
58
10
0
80
10
30
20
5
9
10
40
20
33
5
18
40
15

После вычислений получаем:

p = 0.3222

Таблица №1.6.2. Дисперсионный анализ по одному признаку.

Компонента дисперсии Сумма квадратов Степень свободы Средний квадрат
Между выборками 1701.7 3 567.223
Остаточная 85230.9 176 484.266
Полная 86932.5 179 -----

p>pкр

Вывод:

Следовательно мы принимаем нулевую гипотезу. т.е. можно предположить что при 5% уровне значимости ВАШСП не зависит от инфекции вызывающей реактивный артрит.

В связи с тем что не один из показателей активности заболевания а также показатели ВАШ не зависят от инфекции предшествующей реактивному артриту дальнейшее разделение данных на группы можно считать не целесообразным.

2 Множественная линейная регрессия

Общее назначение множественной регрессии (этот термин был впервые использован в работе Пирсона - Pearson. 1908) состоит в анализе связи между несколькими независимыми переменными (называемыми также регрессорами или предикторами) и зависимой переменной.

В общественных и естественных науках процедуры множественной регрессии чрезвычайно широко используются в исследованиях. В общем. множественная регрессия позволяет исследователю задать вопрос (и. вероятно. получить ответ) о том. "что является лучшим предиктором для...".

Общая вычислительная задача. которую требуется решать при анализе методом множественной регрессии. состоит в подгонке прямой линии к некоторому набору точек.В многомерном случае. когда имеется более одной независимой переменной. линия регрессии не может быть отображена в двумерном пространстве. однако она также может быть легко оценена. В общем случае. процедуры множественной регрессии будут оценивать параметры линейного уравнения вида:

Y = a + b1*X1 + b2*X2 + ... + bp*Xp

Регрессионные коэффициенты (или B-коэффициенты) представляют независимые вклады каждой независимой переменной в предсказание зависимой переменной.

Линия регрессии выражает наилучшее предсказание зависимой переменной (Y) по независимым переменным (X). Однако обычно имеется существенный разброс наблюдаемых точек относительно подогнанной прямой. Отклонение отдельной точки от линии регрессии (от предсказанного значения) называется остатком.

Чем меньше разброс значений остатков около линии регрессии по отношению к общему разбросу значений. тем. очевидно. лучше прогноз. Например. если связь между переменными X и Y отсутствует. то отношение остаточной изменчивости переменной Y к исходной дисперсии равно 1.0. Если X и Y жестко связаны. то остаточная изменчивость отсутствует. и отношение дисперсий будет равно 0.0. В большинстве случаев отношение будет лежать где-то между этими экстремальными значениями. т.е. между 0.0 и 1.0. 1.0 минус это отношение называется R-квадратом или коэффициентом детерминации. Это значение непосредственно интерпретируется следующим образом. Значение R-квадрата является индикатором степени подгонки модели к данным (значение R-квадрата близкое к 1.0 показывает. что модель объясняет почти всю изменчивость соответствующих переменных).

Обычно. степень зависимости двух или более предикторов (независимых переменных или переменных X) с зависимой переменной (Y) выражается с помощью коэффициента множественной корреляции R. По определению он равен корню квадратному из коэффициента детерминации. Это неотрицательная величина. принимающая значения между 0 и 1. Для интерпретации направления связи между переменными смотрят на знаки (плюс или минус) регрессионных коэффициентов или B-коэффициентов. Если B-коэффициент положителен. то связь этой переменной с зависимой переменной положительна; если B-коэффициент отрицателен. то и связь носит отрицательный характер. Конечно. если B-коэффициент равен 0. связь между переменными отсутствует.

Прежде всего. как это видно уже из названия множественной линейной регрессии. предполагается. что связь между переменными является линейной. На практике это предположение. в сущности. никогда не может быть подтверждено; к счастью. процедуры множественного регрессионного анализы в незначительной степени подвержены воздействию малых отклонений от этого предположения.

Основное концептуальное ограничение всех методов регрессионного анализа состоит в том. что они позволяют обнаружить только числовые зависимости. а не лежащие в их основе причинные связи.

Важность анализа остатков. Хотя большинство предположений множественной регрессии нельзя в точности проверить. исследователь может обнаружить отклонения от этих предположений. В частности. выбросы (т.е. экстремальные наблюдения) могут вызвать серьезное смещение оценок. "сдвигая" линию регрессии в определенном направлении и тем самым. вызывая смещение регрессионных коэффициентов. Часто исключение всего одного экстремального наблюдения приводит к совершенно другому результату.

Используя Matlab найдем уравнение множественной регрессии для нахождения зависимости ВАШБП и ВАШСП от других показателей а также найдем коэффициент корреляции для определения зависимости между данными выборками и критерий Фишера для определения уровня доверия к полученному уравнению.