Смекни!
smekni.com

Исследование статистических взаимосвязей показателей на предприятиях общественного питания на пр (стр. 5 из 9)

Чтобы использовать формулу для линейного коэффициента корреляции рассчитаем дисперсию по даным приведенным в таблице 9:

Данный коэффициент попадет в интервал

- это говорит о том, что связь между признаками сильная, а положительный знак коэффициента говорит о том, что связь прямая.- это говорит о том, что связь мед++тной группы от 20 до 24ся актуальным, так как Для оценки значимости коэффициента корреляции r используют t-критерий Стьюдента, который применяется при t-распределении, отличном от нормального.

При линейной однофакторной связи t-критерий можно рассчитать по формуле:

,

где (n - 2) – число степеней свободы при заданном уровне значимости α и объеме выборки n.

Полученное значение tрасч сравнивают с табличным значением t-критерия (для α = 0,05 и 0,01)

Получаем:

tрасч > tтабл=2,7764[3] , линейный коэффициент считается значимым, а связь между x и y – существенной, т.е. мы можем исключить случайную ошибку и сказать, что коэффициент однозначно отражает связь между изучаемыми признаками.

Рассчитаем коэффициент детерминации, который показывает долю вариации результативного признака под влиянием вариации признака-фактора. В нашем случае

, т.е. спрос на 76,73% зависит от частоты посещаемости предприятия.

С помощью мастер диаграмм строим графическую зависимость по данным таблицы 10, показывающую влияния стоимости заказа на спрос на предприятии общественного питания «Источник» (рис.4). Добавляем линию тренда и величину достоверности аппроксимации (показывает точность описания уравнения регрессии)-R2.

Таблица 10

Распределение значений стоимости заказа, сделанного на предприятии общественного питания «Источник» и спроса на предприятии среди населения в возрасте от 20 до 46лет

Возраст населения Численность населения, n Стоимость заказа на 1 чел, руб. x Спрос на предприятии у
20-24

7

2000

7

25-29

9

2500

10

30-34

9

3000

13

35-39

9

1000

7

40-44

12

1500

10

45-49

14

300

4

Рис. 4

В основе зависимости спроса от стоимости заказа лежит прямолинейная связь, которая может быть выражена простым линейным уравнением регрессии:

ŷ = a0 + a1x,

где ŷ - теоретические расчётные значения результативного признака (спрос на предприятиях), полученные по уравнению регрессии;

a0 , a1 - коэффициенты (параметры) уравнения регрессии;

х – частота посещений предприятий.

Параметры уравнения a0 , a1 находят методом наименьших квадратов (МНК - метод решения систем уравнений, при котором в качестве решения принимается точка минимума суммы квадратов отклонений), то есть в основу этого метода положено требование минимальности сумм квадратов отклонений эмпирических данных yi от выровненных ŷ :

S(yi – ŷ)2 = S(yi – a0 – a1xi)2 ® min

Для нахождения минимума данной функции приравняем к нулю ее частные производные и получим систему двух линейных уравнений, которая называется системой нормальных уравнений:

Решим эту систему в общем виде:

;

Параметры уравнения парной линейной регрессии иногда удобно исчислять по следующим формулам, дающим тот же результат:

,
,

- средние значения результативного и факторного признаков соответственно.

Определим значения a0 , a1 по данным рассчитанным в таблице 11, подставим их в уравнение связи ŷ = a0 + a1x, и найдем значения ŷ, зависящие только от заданного значения х.

Получаем:

Таблица 11

Расчетные значения

Возраст населения

Численность населения

Стоимость заказа, руб. x

Спрос на предприятии, порции y

20-24

7

2000

7

283,34

80281,5556

-1,5

-425,01

25-29

9

2500

10

783,34

613621,5556

1,5

1175,01

30-34

9

3000

13

1283,34

1646961,556

4,5

5775,03

35-39

9

1000

7

-716,66

513601,5556

-1,5

1074,99

40-44

12

1500

10

-216,66

46941,5556

1,5

-324,99

45-49

14

300

4

-1416,66

2006925,556

-4,5

6374,97

итого

60

10300

51

4908333,334

13650

Таким образом, регрессионная модель зависимости спроса от частоты посещений может быть записана в виде конкретного простого уравнения регрессии:

.

Проверка адекватности модели может быть дополнена нахождением значения средней ошибки аппроксимации:

,

где y – значение результативного признака;

- теоретические значения результативного признака, полученные в результате подстановки соответствующих значений факторных признаков в уравнение регрессии.