Группировка 3
Таблица 13
Самообразование | Число студентов, чел | Средний балл зачётки за 1 курс |
Посещали доп. курсы | 25 | 4,2 |
Не посещали доп. курсы | 25 | 4,0 |
Вывод: не наблюдается явной зависимости между признаком-фактором и признаком результатом.
Лабораторная работа № 2
Тема: Корреляционный анализ, множественная линейная регрессия.
Цель: выбор оптимальной модели многофакторной регрессии на основе анализа различных моделей и расчитан для них коэффициентов множественной детерминации и среднеквадратических ошибок уравнения многофакторной регрессии.
Корреляционная матрица
Таблица 1
0 | 1 | 2 | 3 | 4 | |
0 | 1 | 0,572 | 0,115 | 0,486 | 0,200 |
1 | 0,572 | 1 | 0,218 | 0,471 | -0,112 |
2 | 0,115 | 0,218 | 1 | 0,452 | -0,048 |
3 | 0,438 | 0,471 | 0,452 | 1 | -0,073 |
4 | -0,2 | -0,112 | -0,048 | -0,073 | 1 |
Где х0 – средний балл зачётки (результат), х1 – посещаемость занятий, х2 – самообразование (доп. курсы), х3 – подготовка к семинарским занятиям, х4 – сон.
Введём обозначения признаков-факторов: 1 – посещаемость занятий на 1 курсе (ч/нед); 2 – самообразование (ч/нед); 3 – подготовка к семинарским и практическим занятиям (ч/нед); 4 – сон (ч/сут); 0 – средний балл зачётки по итогам экзаменов за 1 курс.
Расчётная таблица для моделей многофакторной регрессии.
Таблица 2
Модель многофакторной регрессии | R2 | E2 |
1-2-3-4 | 0,39 | 0,45 |
1-2-3 | 0,37 | 0,46 |
2-3-4 | 0,23 | 0,51 |
1-3-4 | 0,38 | 0,45 |
1-2 | 0,33 | 0,47 |
1-3 | 0,36 | 0,46 |
1-4 | 0,35 | 0,47 |
2-3 | 0,20 | 0,52 |
2-4 | 0,05 | 0,56 |
3-4 | 0,22 | 0,51 |
По трём критериям выбираем оптимальную модель.
1. число факторов минимально (2)
2. max R, R = 0,36
3. min E, E = 0,46
Следовательно, оптимальной моделью является модель 1-3. Значит, признаки-факторы «посещаемость занятий на 1 курсе» и «подготовка к семинарским занятиям» влияют значительнее других факторов на признак-результат.
Среднеквадратическая ошибка уравнения многофакторной регрессии небольшая по сравнению с ошибками, рассчитанными для других моделей многофакторной регрессии.
Составляю для этой модели уравнение регрессии в естественных масштабах.
Х0/1,3 = a + b1x1 + b3x3
Корреляционная матрица.
Таблица 3
0 | 1 | 3 | |
0 | 1,00 | 0,57 | 0,48 |
1 | 0,57 | 1,00 | 0,47 |
3 | 0,43 | 0,47 | 1,00 |
t0/1,3 = b1t1 + b3t3
0,57 = b1 + 0,47b3 0,57 = b1 + 0,47(0,44 – 0,47b1) b1 = 0,40,44 = 0,47b1 + b3 b3 = 0,44 – 0,47b1 b3 = 0,25
t0/1,3 = 0,4t1 + 0,25t3
b1 = (d0 / dx1) b1 = (0,47 / 4,4) 0,4 = 0,071
b3 = (d0 / dx3) b3 = (0,79 / 2,68) 0,25 = 0,073
a = x0 – b1x1 – b3x3 = 4,27 – 0,071 × 16,13 – 0,073 × 4,08 = 2,8
имеем: х0/1,3 =2,8 + 0,071х1 + 0,073х3 – уравнение линейной множественной регрессии.
R0/1,3 = Öb1r01 + b3r03 R0/1,3 = Ö0,4 × 0,58 + 0,25 × 0,48 = 0,6Вывод: коэффициент b1 говорит о том, что признак-результат—средний балл зачётки за 1 курс на 0,4 долю от своего среднеквадратического отклонения (0,4 × 0,79 = 0,316 балла) при изменении признака-фактора—посещаемости на 1 курсе на одно своё СКО (4,4 ч/нед).
b3 – средний балл зачётки изменится на 0,25 долю от своего СКО (0,25 0,79 = 0,179 балла) при увеличении признака-фактора—подготовки к семинарским занятиям на одно своё СКО (2,68 ч/сут).
Т. к. b1 < b3, следовательно фактор 1—посещаемость занятий влияет на средний балл зачётки больше, чем фактор 3—подготовка к занятиям.
R2 говорит о том, что 36% общей вариации значений среднего балла зачётки на 1 курсе вызвано влиянием посещаемости и подготовки к занятиям. Остальные 60% вызваны прочими факторами.
R = 0,58 свидетельствует о том, что между посещаемостью занятий и подготовкой к ним и средним баллом зачётки существует заметная линейная зависимость.
Коэффициент b1 говорит о том, что если посещаемость занятий увеличится на 1 ч/нед, то средний балл зачётки увеличится в среднем на 0,071 балла, при условии неизменности всех остальных факторов. b2 говорит о том, что если подготовка к занятиям увеличится на 1 ч/нед, то средний балл зачётки в среднем увеличится на 0,073 балла.
b1 = 0,4 b3 = 0,25
r01 = 0,52
r03 = 0,44
Граф связи признаков-факторов: х2 – подготовки к семинарским занятиям, ч/нед; х1 - посещаемости занятий, ч/нед с признаком-результатом х0 – средним баллом зачётки по итогам экзаменов за 1 курс.
b1 – мера непосредственного влияния на признак-результат посещаемости занятий.
b3 – мера непосредственного влияния подготовки к занятиям на средний балл зачётки.
r01 = b1 + r13b3, где r01 – общее влияние х1 на r13b3 – мера опосредованного влияния х1 через х3 на х0.
r01 = 0,4 + 0,47 × 0,25 = 0,52
r03 = b3 + r31b1, где r03 – общее влияние х3 на r31b1 – мера опосредованного влияния х3 через х1 на х0.
Лабораторная работа № 3.
Тема: «Дисперсионное отношение. Эмпирическая и аналитическая регрессии.»
Цель: выявление зависимости между признаками-факторами и признаком-результатом.
Таблица с исходными данными.
Таблица 1
Средний балл зачётки по итогам экзаменов за 1-ый курс (баллы) | Посещаемость занятий на первом курсе (ч/нед) | Самообразование (доп. Курсы) (ч/нед) | Подготовка к семинарским занятиям (ч/нед) |
4,7 | 19,5 | 0 | 5 |
4,5 | 22 | 2 | 6 |
4,2 | 22 | 0 | 2 |
4,3 | 19,5 | 0 | 7 |
4,5 | 17,5 | 0 | 3 |
4,2 | 9,5 | 6 | 12 |
4,0 | 12,5 | 0 | 5 |
4,7 | 22 | 4 | 7 |
4,6 | 17,5 | 3 | 4 |
4,7 | 9,5 | 0 | 2 |
4,5 | 11,5 | 6 | 3 |
4,0 | 11,5 | 2 | 3 |
4,2 | 19,5 | 4 | 8 |
4,0 | 20,5 | 6 | 9 |
3,2 | 9,5 | 0 | 0 |
4,0 | 17,5 | 0 | 8 |
3,2 | 14,5 | 0 | 2 |
3,5 | 14,5 | 0 | 2 |
4,8 | 22 | 0 | 10 |
4,6 | 8,5 | 0 | 1 |
4,5 | 22 | 0 | 4 |
4,5 | 22 | 6 | 2 |
4,2 | 17,5 | 4 | 4 |
4,5 | 14,5 | 6 | 4 |
4,2 | 11,5 | 2 | 2 |
4,8 | 17,5 | 0 | 4 |
4,0 | 10,5 | 0 | 2 |
4,2 | 17,5 | 2 | 6 |
3,0 | 9,5 | 0 | 0 |
4,8 | 19,5 | 2 | 2 |
4,8 | 19,5 | 2 | 6 |
4,3 | 17,5 | 4 | 2 |
3,2 | 6,0 | 0 | 0 |
4,5 | 22 | 2 | 5 |
4,7 | 22 | 4 | 3 |
4,2 | 22 | 3 | 5 |
4,6 | 9,5 | 0 | 1 |
3,0 | 14,0 | 0 | 2 |
3,0 | 6,5 | 0 | 5 |
4,0 | 22 | 2 | 5 |
4,7 | 17,5 | 6 | 0 |
3,5 | 11,5 | 0 | 6 |
4,7 | 22 | 6 | 2 |
4,5 | 22 | 0 | 0 |
3,2 | 17,5 | 4 | 8 |
4,8 | 22 | 0 | 0 |
3,2 | 9,5 | 0 | 5 |
4,5 | 17,5 | 0 | 3 |
3,0 | 14,5 | 5 | 3 |
4,7 | 11,5 | 5 | 3 |
Рассматриваю первую пару признаков: признак-фактор—посещаемость занятий на 1 курсе (ч/нед) и признак-результат—средний балл зачётки по итогам экзаменов за 1 курс (баллы). Далее обосную взаимосвязь между ними.