Чтобы использовать формулу для линейного коэффициента корреляции рассчитаем дисперсию по даным приведенным в таблице 9:
Данный коэффициент попадет в интервал
- это говорит о том, что связь между признаками сильная, а положительный знак коэффициента говорит о том, что связь прямая.- это говорит о том, что связь мед++тной группы от 20 до 24ся актуальным, так как Для оценки значимости коэффициента корреляции r используют t-критерий Стьюдента, который применяется при t-распределении, отличном от нормального.При линейной однофакторной связи t-критерий можно рассчитать по формуле:
,где (n - 2) – число степеней свободы при заданном уровне значимости α и объеме выборки n.
Полученное значение tрасч сравнивают с табличным значением t-критерия (для α = 0,05 и 0,01)
Получаем:
tрасч > tтабл=2,7764[3] , линейный коэффициент считается значимым, а связь между x и y – существенной, т.е. мы можем исключить случайную ошибку и сказать, что коэффициент однозначно отражает связь между изучаемыми признаками.
Рассчитаем коэффициент детерминации, который показывает долю вариации результативного признака под влиянием вариации признака-фактора. В нашем случае
, т.е. спрос на 76,73% зависит от частоты посещаемости предприятия.С помощью мастер диаграмм строим графическую зависимость по данным таблицы 10, показывающую влияния стоимости заказа на спрос на предприятии общественного питания «Источник» (рис.4). Добавляем линию тренда и величину достоверности аппроксимации (показывает точность описания уравнения регрессии)-R2.
Таблица 10
Распределение значений стоимости заказа, сделанного на предприятии общественного питания «Источник» и спроса на предприятии среди населения в возрасте от 20 до 46лет
Возраст населения | Численность населения, n | Стоимость заказа на 1 чел, руб. x | Спрос на предприятии у |
20-24 | 7 | 2000 | 7 |
25-29 | 9 | 2500 | 10 |
30-34 | 9 | 3000 | 13 |
35-39 | 9 | 1000 | 7 |
40-44 | 12 | 1500 | 10 |
45-49 | 14 | 300 | 4 |
Рис. 4
В основе зависимости спроса от стоимости заказа лежит прямолинейная связь, которая может быть выражена простым линейным уравнением регрессии:
ŷ = a0 + a1x,
где ŷ - теоретические расчётные значения результативного признака (спрос на предприятиях), полученные по уравнению регрессии;
a0 , a1 - коэффициенты (параметры) уравнения регрессии;
х – частота посещений предприятий.
Параметры уравнения a0 , a1 находят методом наименьших квадратов (МНК - метод решения систем уравнений, при котором в качестве решения принимается точка минимума суммы квадратов отклонений), то есть в основу этого метода положено требование минимальности сумм квадратов отклонений эмпирических данных yi от выровненных ŷ :
S(yi – ŷ)2 = S(yi – a0 – a1xi)2 ® min
Для нахождения минимума данной функции приравняем к нулю ее частные производные и получим систему двух линейных уравнений, которая называется системой нормальных уравнений:
Решим эту систему в общем виде:
;Параметры уравнения парной линейной регрессии иногда удобно исчислять по следующим формулам, дающим тот же результат:
, , - средние значения результативного и факторного признаков соответственно.Определим значения a0 , a1 по данным рассчитанным в таблице 11, подставим их в уравнение связи ŷ = a0 + a1x, и найдем значения ŷ, зависящие только от заданного значения х.
Получаем:
Таблица 11
Расчетные значения
Возраст населения | Численность населения | Стоимость заказа, руб. x | Спрос на предприятии, порции y | ||||
20-24 | 7 | 2000 | 7 | 283,34 | 80281,5556 | -1,5 | -425,01 |
25-29 | 9 | 2500 | 10 | 783,34 | 613621,5556 | 1,5 | 1175,01 |
30-34 | 9 | 3000 | 13 | 1283,34 | 1646961,556 | 4,5 | 5775,03 |
35-39 | 9 | 1000 | 7 | -716,66 | 513601,5556 | -1,5 | 1074,99 |
40-44 | 12 | 1500 | 10 | -216,66 | 46941,5556 | 1,5 | -324,99 |
45-49 | 14 | 300 | 4 | -1416,66 | 2006925,556 | -4,5 | 6374,97 |
итого | 60 | 10300 | 51 | 4908333,334 | 13650 |
Таким образом, регрессионная модель зависимости спроса от частоты посещений может быть записана в виде конкретного простого уравнения регрессии:
.Проверка адекватности модели может быть дополнена нахождением значения средней ошибки аппроксимации:
,где y – значение результативного признака;
- теоретические значения результативного признака, полученные в результате подстановки соответствующих значений факторных признаков в уравнение регрессии.