Рис.6. Корреляционное поле
При его рассмотрении можно сказать, что наиболее подходящей будет степенная модель, т.к. она визуально отражает зависимость
Табл. 12. Значения критериев отбора модели
Тип модели | R^2 | Ā | MAD | Sост |
линейная | 0,18 | 145,89% | 53,91433 | 6143,55 |
квадратичная | 0,38 | 74,27% | 40,744138 | 5361,10 |
гипербол(обратная) | 0,09 | 157,15% | 62,058889 | 6479,29 |
степенная | 0,59 | 53,26% | 41,088475 | 0,64 |
показательная | 0,24 | 7,47% | 0,0075565 | 0,87 |
логарифмическая | 0,28 | 99,97% | 101,84785 | 5741,17 |
Уравнение данной модели выглядит следующим образом:
По критерию Фишера модель является значимой, т.к.
Оценим тесноту связи с помощью коэффициента детерминации, который равен
Значит, математическая модель, выражающая данную зависимость объясняющей переменной, подходит для описания зависимой переменной. Включение этого фактора в модель множественной регрессии целесообразно.
В качестве факторов, оказывающих влияние на уровень доходов, после предварительного исследования, были отобраны следующие факторы:
Рассчитанные парные коэффициенты корреляции представим в виде корреляционной матрицы (табл. 13).
Табл. 13. Корреляционная матрица
| | | | | |
| 1 | 0,76 | 0,91 | 0,79 | 0,42 |
| 0,76 | 1 | 0,75 | 0,73 | 0,47 |
| 0,91 | 0,75 | 1 | 0,76 | 0,39 |
| 0,79 | 0,73 | 0,76 | 1 | 0,36 |
| 0,42 | 0,47 | 0,39 | 0,36 | 1 |
Из анализируемых факторов наибольшее влияние на уровень разводов оказывают все факторы, кроме шестого – инвалидность, т.к. значение линейных коэффициентов корреляции выше 0,7.
Построим модель множественной линейной регрессии:
Коэффициент детерминации
Скорректированный коэффициент детерминации
Данная модель является значимой по критерию Фишера, т.к.
Также проверим коэффициенты линейной регрессии на значимость:
значит, коэффициенты
Теперь мы получили новую модель, которая выглядит следующим образом:
Оценим точность прогноза, для этого рассчитаем среднюю ошибку аппроксимации:
По данной модели средняя ошибка аппроксимации, хотя и превышает рекомендуемое значение 8-10%, но не намного, следовательно, приближение построенной модели к наблюдаемым статистическим значениям считается хорошим. Точность прогноза найдена с помощью критерия
Произведем сравнение построенных моделей множественной и парной регрессии зависимости уровня разводов от алкоголизма. Сравнение производится, чтобы сделать выбор между двумя моделями (табл. 13).