Государственное образовательное учреждение высшего профессионального образования
«Московский государственный институт электронной технки
(технический универститет)»
Курсовая работа
по дисциплине
«Теория вероятности и математическая статистика»
Тема работы
«Анализ данных в линейной регрессионной модели»
Выполнил:
Студент группы ЭКТ-21
Рыжов С.А.
Проверил:
Преподаватель
Бардушкина И. В.
Москва - 2010
Вариант 20.
Задание 1
Выполнить предварительную обработку результатов наблюдений, включающую:
1 построение диаграммы рассеивания (корреляционного поля);
2 группировку данных и построение корреляционной таблицы;
3 оценку числовых характеристик для негруппированных и группированных данных.
Оценка числовых характеристик для негруппированных данных:
X | Y | X | Y |
4,19 | 9,19 | 4,44 | 9,13 |
3,04 | 11,94 | 11,31 | 4,58 |
4,6 | 8,09 | 7,57 | 3,14 |
9,83 | 10,33 | 1,62 | 14,61 |
8,66 | 7,15 | 5,71 | 6,48 |
1,3 | 12,34 | 11,06 | 6,78 |
4,22 | 16,35 | 10,35 | 2,15 |
5,11 | 7,7 | 2,46 | 9,66 |
9,85 | 5,64 | 1,02 | 11,19 |
8,8 | 4,52 | 5,77 | 7,77 |
12,17 | 4,52 | 8,63 | 4,05 |
11,25 | 2,06 | 6,91 | 4,76 |
5,73 | 7,41 | 3,56 | 8,54 |
4,05 | 10,51 | 9,47 | 2,22 |
5,41 | 9,97 | 6,16 | 3,72 |
1,28 | 14,68 | 8,26 | 3,57 |
1,67 | 9,67 | 6,7 | 14,32 |
11,99 | 3,31 | 4,95 | 10,64 |
7,66 | 5,93 | 3,37 | 10,73 |
5,17 | 9,87 | 1,53 | 10,13 |
3,26 | 11,52 | 9,54 | 4,95 |
12,58 | 2,88 | 3,11 | 5,38 |
8,34 | 3,57 | 5,09 | 5,79 |
5,79 | 4,39 | 11,08 | 3,87 |
3,42 | 9,71 | 8,74 | -2,23 |
Сумма X | 317.78 | ||
Сумма Y | 369,18 | ||
MX | 6,3556 | ||
MY | 7,3836 | ||
s2X | 11,02005 | ||
s2Y | 15,31479 | ||
KXY | -9,1594 | ||
ρXY | -0,7194 |
Числовые характеристики для негруппированной выборки находятся по следующим формулам:
, ; ; ; ; ;Построение корреляционного поля:
Построение корреляционной таблицы:
Таблица 1.1
Y X | -1.5 | 1.5 | 4.5 | 7.5 | 10.5 | 13.5 | 16.5 | ni. |
2.5 | 0 | 0 | 1 | 1 | 8 | 3 | 0 | 13 |
5.5 | 0 | 0 | 4 | 5 | 6 | 1 | 1 | 17 |
8.5 | 1 | 1 | 8 | 1 | 1 | 0 | 0 | 12 |
11.5 | 0 | 3 | 4 | 1 | 0 | 0 | 0 | 8 |
nj. | 1 | 4 | 17 | 8 | 15 | 4 | 1 | 50 |
Оценка числовых характеристик для группированных данных:
, ; , ; ; ; , ; ; ; = - 0.87Задание 2
Для негруппированных данных проверить гипотезу
об отсуствии линейной статистической связи между компонентами X и Y при альтернативной гипотезе ( уровень значимости α = 0,05);Выборочное значение статистики равно
,Используя средства Matlab, найдем
Так как выборочное значение статистики больше квантили распределения Стьюдента, гипотеза H0 отклоняется в сторону гипотезы H1. Корреляция значима.
Задание 3
Для негруппированых данных получить интервальную оценку для истинного значения коэффициента корреляции ρX,Y, при уровне значимости α = 0,05.
Используя средства Matlab, найдем
, ,
Задание 4
Для негруппированных и группированных данных составить уравнения регрессии Y на x и X на Y.
Рассмотрим вначале случай негруппированных данных.
Этот интервал не содержит нуля, т.е. с доверительной вероятностью 1 – ЫВА = 0,95 существует корреляция между X и Y и имеет смысл построение уравнений регрессии.
y(x) = 12,77 – 0,848*x;
x(y) = 10,86 – 0,6*y;
Проверка.
, . , ; , , ;Случай группированных данных.
Подставим найденные значения
в уравнеиня линейной регрессии Y на x и X на y. Получим:y(x) = 17,14 – 1,4*x;
x(y) = 10,83 – 0,54*y;
Проверка:
Задание 5
Для негруппированных данных нанести графики выборочных регрессионных прямых на диаграмму рассеивания.
Задание 6
Для негруппированных данных по найденным оценкам параметров линейной регрессии Y на x получить оценку s2 для дисперсии ошибок наблюдений σ2, найти коэффициент детерминации R2, построить доверительные интервалы для параметров регрессии a и b, дисперсии ошибок наблюдений σ2 и среднего значения Y при x = x0 .
Для негруппированных данных были получены следующие оценки числовых характеристик и коэффициентов регрессии:
, , , , , , , .