Смекни!
smekni.com

Линейный множественный регрессивный анализ (стр. 3 из 8)

С другой стороны, относительная ошибка аппроксимации свидетельствует, что модель подобрана не точно: в среднем теоретические (смоделированные данные) отличаются от фактических на 19,8 %. В целом применение полученного уравнения регрессии возможно в случае повышения его прогностической силы и практической ценности за счет увеличения объема выборки.

Задача 2

В исходной таблице (вариант 8) представлены статистические данные о различных параметрах уровня жизни населения в 2004 г.:

Страны Х1 Х3 Х6 Х8 Х9 У
1 Россия 55 30 20,4 28 124 84,98
2 Австралия 100 47 71,4 121 87 30,56
3 Австрия 93 37 78,7 146 74 38,42
4 Азербайджан 20 12,4 12,1 52 141 60,34
5 Армения 20 4,3 10,9 72 134 60,22
6 Белоруссия 72 28 20,4 38 120 60,79
7 Бельгия 85 48 79,7 83 72 29,82
8 Болгария 65 18 17,3 92 156 70,57
9 Великобритания 67 39 69,7 91 91 34,51
10 Венгрия 73 40 24,5 73 106 64,73
11 Германия 88 35 76,2 138 73 36,63
12 Греция 83 24 44,4 99 108 32,84
13 Грузия 21 36 11,3 55 140 62,64
14 Дания 98 38 79,2 89 77 34,07
15 Ирландия 99 31 57 87 102 39,27
16 Испания 89 26 54,8 103 72 28,46
17 Италия 84 27 72,1 169 118 30,27
18 Казахстан 61 19,2 13,4 10 191 69,04
19 Канада 98 44 79,9 123 77 25,42
20 Киргизия 46 23,5 11,2 20 134 53,13
21 Нидерланды 86 37 72,4 176 59 28,00
22 Португалия 73 27 48,6 150 83 38,79
23 США 115 29 100 99 103 32,04
24 Финляндия 62 36 63,9 82 94 38,58
25 Франция 91 36 77,5 84 85 18,51
26 Чехия 82 45 34,7 65 114 57,62
27 Япония 40 20 83,5 60 119 20,80
1966 837,4 1385,2 2405 2854 1181,05
72,81 31,01 51,3 89,07 105,7 43,74

Х1 - потребление мяса и мясопродуктов на душу населения (кг),

Х3 - потребление сахара на душу населения (кг),

Х6 - оценка ВВП по паритету покупательной способности в 1994 г. на душу населения (в % к США),

Х8 - потребление фруктов и ягод на душу населения (кг),

Х9 - потребление хлебных продуктов на душу населения (кг),

У – смертность населения по причине болезни органов кровообращения на 100000 населения.

Требуется:

1) Рассчитать параметры линейного уравнения множественной регрессии.

2) Определить сравнительную оценку влияния факторов на результативный показатель с помощью коэффициентов эластичности.

3) Оценить статистическую значимость параметров регрессионной модели с помощью t-критерия. Адекватность модели проверить с помощью F-критерия.

4) Оценить качество построенного уравнения с помощью средней ошибки аппроксимации.

5) Используя метод многошагового регрессионного анализа, построить регрессионную модель только со значимыми факторами и оценить ее параметры.

6) Определить прогнозное значение результата, если прогнозные значения факторов составляют 80 % от их максимальных значений.

7) Рассчитать ошибки и доверительный интервал прогноза для уровня значимости

и
.

8) Сделать выводы по полученным результатам.

Решение:

1. Рассчитаем параметры линейного уравнения множественной регрессии

Для удобства в ходе решения будем достраивать исходную таблицу данных до вспомогательной (см. Приложение 6), округляя и занося в ее промежуточные результаты. Уравнение множественной линейной регрессии для нашего случая имеет общий вид:

Параметры данного уравнения найдем с помощью инструмента «Регрессия» надстройки «Анализ данных» приложения MS Excel (результаты вычисления – в Приложении 7):

b0= 40,0007992

b1= 0,071828228

b2= 0,295651645

b3= -0,500054859

b4= -0,500054859

b5= 0,15192311

Получаем уравнение линейной множественной регрессии:

2. Определим сравнительную оценку влияния факторов на результативный показатель с помощью коэффициентов эластичности.

Т.к. факторы имеют различную природу и размерность, непосредственная оценка их влияния затруднена. Поэтому для каждого из них необходимо рассчитать свой коэффициент эластичности.

Для расчета коэффициентов найдем средние значения факторов и результативного показателя:

Подставим полученные значения в формулу:

Таким образом, смертность населения по причине болезни органов кровообращения на 100000 населения увеличивается примерно на 0,12 % при увеличении потребления мяса и мясопродуктов на душу населения на 1 %, на 0,21% при увеличении на 1% потребления сахара на душу населения и на 0,37% при увеличении потребления хлебных продуктов на душу населения на 1%.

А при увеличении оценки ВВП по паритету покупательной способности в 1994 г. на душу населения на 1% результативный показатель, наоборот, уменьшится на 0,59%. Увеличение же потребления фруктов и ягод на душу населения на 1% повлечет снижение смертности примерно на 1,02%.

3. Оценим статистическую значимость параметров регрессионной модели с помощью t-критерия.

Расчетные значения критерия для пяти заданных параметров получили с помощью инструмента «Регрессия» надстройки «Анализ данных» приложения MS Excel (результаты вычисления – в Приложении 7):

Поскольку

, то коэффициенты b1, b2, b3, b4, b5 не являются значимыми для построенной модели.

Адекватность модели проверим с помощью F-критерия.


Величина множественного коэффициента детерминации R2=0,799, также рассчитана с помощью инструмента «Регрессия» надстройки «Анализ данных» приложения MS Excel (результаты вычисления – в Приложении 7). Построенную модель на основе этого параметра можно признать достаточно качественной. А изменение результативного показателя примерно на 80 % обусловлено влиянием факторов, включенных в модель.

Наблюдаемое значение F–критерия превышает табличное: 16,65 > 4,52, т.е. выполнено неравенство

, а значит, в 95 % случаев уравнение регрессии статистически значимо и отражает существенную зависимость между факторами и результативным показателем.

Уравнение можно признать надежным и значимым, доказывающим наличие исследуемой зависимости.

4. Оценим качество построенного уравнения с помощью средней ошибки аппроксимации.

Проведем необходимые дополнительные расчеты с вспомогательной таблицей (графа 11 Приложения 6). На основе полученных данных найдем значение средней ошибки аппроксимации:

Полученное значение средней ошибки аппроксимации подтверждает удовлетворительную точность построенной модели.

5. Используя метод многошагового регрессионного анализа, построим регрессионную модель только со значимыми факторами и оценим ее параметры.