Смекни!
smekni.com

Курсовая работа (стр. 4 из 6)


Группировка 3

Таблица 13

Самообразование

Число студентов, чел

Средний балл зачётки за 1 курс

Посещали доп. курсы

25

4,2

Не посещали доп. курсы

25

4,0

Вывод: не наблюдается явной зависимости между признаком-фактором и признаком результатом.


Лабораторная работа № 2

Тема: Корреляционный анализ, множественная линейная регрессия.

Цель: выбор оптимальной модели многофакторной регрессии на основе анализа различных моделей и расчитан для них коэффициентов множественной детерминации и среднеквадратических ошибок уравнения многофакторной регрессии.

Корреляционная матрица

Таблица 1

0

1

2

3

4

0

1

0,572

0,115

0,486

0,200

1

0,572

1

0,218

0,471

-0,112

2

0,115

0,218

1

0,452

-0,048

3

0,438

0,471

0,452

1

-0,073

4

-0,2

-0,112

-0,048

-0,073

1

Где х0 – средний балл зачётки (результат), х1 – посещаемость занятий, х2 – самообразование (доп. курсы), х3 – подготовка к семинарским занятиям, х4 – сон.

Введём обозначения признаков-факторов: 1 – посещаемость занятий на 1 курсе (ч/нед); 2 – самообразование (ч/нед); 3 – подготовка к семинарским и практическим занятиям (ч/нед); 4 – сон (ч/сут); 0 – средний балл зачётки по итогам экзаменов за 1 курс.

Расчётная таблица для моделей многофакторной регрессии.

Таблица 2

Модель многофакторной регрессии

R2

E2

1-2-3-4

0,39

0,45

1-2-3

0,37

0,46

2-3-4

0,23

0,51

1-3-4

0,38

0,45

1-2

0,33

0,47

1-3

0,36

0,46

1-4

0,35

0,47

2-3

0,20

0,52

2-4

0,05

0,56

3-4

0,22

0,51

По трём критериям выбираем оптимальную модель.

1. число факторов минимально (2)

2. max R, R = 0,36

3. min E, E = 0,46

Следовательно, оптимальной моделью является модель 1-3. Значит, признаки-факторы «посещаемость занятий на 1 курсе» и «подготовка к семинарским занятиям» влияют значительнее других факторов на признак-результат.

Среднеквадратическая ошибка уравнения многофакторной регрессии небольшая по сравнению с ошибками, рассчитанными для других моделей многофакторной регрессии.

Составляю для этой модели уравнение регрессии в естественных масштабах.

Х0/1,3 = a + b1x1 + b3x3

Корреляционная матрица.

Таблица 3

0

1

3

0

1,00

0,57

0,48

1

0,57

1,00

0,47

3

0,43

0,47

1,00

t0/1,3 = b1t1 + b3t3

0,57 = b1 + 0,47b3 0,57 = b1 + 0,47(0,44 – 0,47b1) b1 = 0,4

0,44 = 0,47b1 + b3 b3 = 0,44 – 0,47b1 b3 = 0,25

t0/1,3 = 0,4t1 + 0,25t3

b1 = (d0 / dx1) b1 = (0,47 / 4,4) 0,4 = 0,071

b3 = (d0 / dx3) b3 = (0,79 / 2,68) 0,25 = 0,073

a = x0 – b1x1 – b3x3 = 4,27 – 0,071 × 16,13 – 0,073 × 4,08 = 2,8

имеем: х0/1,3 =2,8 + 0,071х1 + 0,073х3 – уравнение линейной множественной регрессии.

R0/1,3 = Öb1r01 + b3r03

R0/1,3 = Ö0,4 × 0,58 + 0,25 × 0,48 = 0,6

Вывод: коэффициент b1 говорит о том, что признак-результат—средний балл зачётки за 1 курс на 0,4 долю от своего среднеквадратического отклонения (0,4 × 0,79 = 0,316 балла) при изменении признака-фактора—посещаемости на 1 курсе на одно своё СКО (4,4 ч/нед).

b3 – средний балл зачётки изменится на 0,25 долю от своего СКО (0,25 0,79 = 0,179 балла) при увеличении признака-фактора—подготовки к семинарским занятиям на одно своё СКО (2,68 ч/сут).

Т. к. b1 < b3, следовательно фактор 1—посещаемость занятий влияет на средний балл зачётки больше, чем фактор 3—подготовка к занятиям.

R2 говорит о том, что 36% общей вариации значений среднего балла зачётки на 1 курсе вызвано влиянием посещаемости и подготовки к занятиям. Остальные 60% вызваны прочими факторами.

R = 0,58 свидетельствует о том, что между посещаемостью занятий и подготовкой к ним и средним баллом зачётки существует заметная линейная зависимость.

Коэффициент b1 говорит о том, что если посещаемость занятий увеличится на 1 ч/нед, то средний балл зачётки увеличится в среднем на 0,071 балла, при условии неизменности всех остальных факторов. b2 говорит о том, что если подготовка к занятиям увеличится на 1 ч/нед, то средний балл зачётки в среднем увеличится на 0,073 балла.


b1 = 0,4 b3 = 0,25

r01 = 0,52

r03 = 0,44


r13 = 0,47

Граф связи признаков-факторов: х2 – подготовки к семинарским занятиям, ч/нед; х1 - посещаемости занятий, ч/нед с признаком-результатом х0 – средним баллом зачётки по итогам экзаменов за 1 курс.

b1 – мера непосредственного влияния на признак-результат посещаемости занятий.

b3 – мера непосредственного влияния подготовки к занятиям на средний балл зачётки.

r01 = b1 + r13b3, где r01 – общее влияние х1 на r13b3 – мера опосредованного влияния х1 через х3 на х0.

r01 = 0,4 + 0,47 × 0,25 = 0,52

r03 = b3 + r31b1, где r03 – общее влияние х3 на r31b1 – мера опосредованного влияния х3 через х1 на х0.

Лабораторная работа № 3.

Тема: «Дисперсионное отношение. Эмпирическая и аналитическая регрессии.»

Цель: выявление зависимости между признаками-факторами и признаком-результатом.

Таблица с исходными данными.

Таблица 1

Средний балл за­чётки по итогам экзаменов за 1-ый курс (баллы)

Посещаемость занятий на первом курсе (ч/нед)

Самообразование (доп. Курсы) (ч/нед)

Подготовка к семинар­ским заня­тиям (ч/нед)

4,7

19,5

0

5

4,5

22

2

6

4,2

22

0

2

4,3

19,5

0

7

4,5

17,5

0

3

4,2

9,5

6

12

4,0

12,5

0

5

4,7

22

4

7

4,6

17,5

3

4

4,7

9,5

0

2

4,5

11,5

6

3

4,0

11,5

2

3

4,2

19,5

4

8

4,0

20,5

6

9

3,2

9,5

0

0

4,0

17,5

0

8

3,2

14,5

0

2

3,5

14,5

0

2

4,8

22

0

10

4,6

8,5

0

1

4,5

22

0

4

4,5

22

6

2

4,2

17,5

4

4

4,5

14,5

6

4

4,2

11,5

2

2

4,8

17,5

0

4

4,0

10,5

0

2

4,2

17,5

2

6

3,0

9,5

0

0

4,8

19,5

2

2

4,8

19,5

2

6

4,3

17,5

4

2

3,2

6,0

0

0

4,5

22

2

5

4,7

22

4

3

4,2

22

3

5

4,6

9,5

0

1

3,0

14,0

0

2

3,0

6,5

0

5

4,0

22

2

5

4,7

17,5

6

0

3,5

11,5

0

6

4,7

22

6

2

4,5

22

0

0

3,2

17,5

4

8

4,8

22

0

0

3,2

9,5

0

5

4,5

17,5

0

3

3,0

14,5

5

3

4,7

11,5

5

3


Рассматриваю первую пару признаков: признак-фактор—посещаемость занятий на 1 курсе (ч/нед) и признак-результат—средний балл зачётки по итогам экзаменов за 1 курс (баллы). Далее обосную взаимосвязь между ними.