Представим все рассмотренные модели в виде таблицы, содержащей среднюю абсолютную и среднеквадратическую ошибки.
Модель | Cредняя абсолютная ошибка | Среднеквадратическая ошибка | Коэффициент детерминации |
Линейная модель | 6,35 | 59,3 | 0,93% |
Полиномиальная модель | 1,14 | 2 | 96,61% |
Экспоненциальная модель | 6,3 | 59,6 | 0,7% |
Экспоненциальное сглаживание (a=0,25) | 6,34 | 61 | 27% |
Двухпараметрическая модель Хольта (t=1, a1=0,5, a2=0,5) | 8,48 | 401 | 69% |
Трехпараметрическая модель Бокса и Дженкинса (t=1, a1=0,8, a2=0,2, a3=0,1) | 7,63 | 228,7 | 53% |
Лучшей является полиномиальная модель МНК. Её и проверим на адекватность. Для проверки воспользуемся ППП Statistica. Импортируем данные в программу, предварительно преобразовав их. Нам необходимо привести модель к линейному виду, т.к. для проверки адекватности модель должна быть линейной. Для этого прологарифмируем обе части уравнения
. Получим: ln y=ln a1+a2*ln x. В нашем случае уравнение модели записывается в следующем виде: у=1195,7*е0,0154*х. Произведение а2*ln x можно представить в виде временного ряда, т.к. значения х нам известны и для упрощения расчетов. Тогда в ППП Statistica импортируем в качестве первого параметра – ВР, полученный умножением х на 0,0154, а в качестве второго параметра – логарифмированный ряд исходных значений у.Для проверки гипотезы об адекватности модели в целом используется F-статистика (статистика Фишера). Для того, чтобы принять гипотезу об адекватности модели, необходимо, чтобы этот показатель был достаточно высок, а соответствующая ей вероятность р как можно ниже. У нас F=238,82, а р=0,0000, что показывает высокую достоверность данных. Множественная регрессия высоко значима.
Далее можно определить значимость (адекватность) коэффициентов в модели.
Для оценки значимости коэффициентов рассматривается показатель р – level. Значения этого показателя равны нулю и для свободного члена, и для переменной х (Var 1), следовательно, нулевую гипотезу о незначимости коэффициентов можно отвергнуть.
Остатки – это разность между исходными (наблюдаемыми) значениями зависимой переменной и предсказанными значениями. Исследование остатков также показывают степень адекватности модели. По основному предположению МНК в остатках должна отсутствовать автокорреляция.
Получили d=1,96751, что говорит об адекватности нашей модели.
Заключение
В данной курсовой работе рассматривались данные по полугодиям за 20 лет и осуществлялся прогноз на момент времени t=41 и 42, что соответствовало I и II полугодиям 2010 года. Были построены следующие модели прогнозирования потребления мясопродукции на человека:
- с использованием метода наименьших квадратов (линейная, экспоненциальная и полиномиальная, Excel),
- экспоненциальное сглаживание (Excel),
- модель Хольта (Excel),
-модель Бокса и Дженкинса (Excel).
Выбранные модели дают довольно различные результаты, и лучшие результаты были получены при использовании полиномиальной модели метода наименьших квадратов и модели Хольта. Результаты вычислений представлены в таблицах. Рассчитана абсолютная ошибка прогноза и средняя относительная ошибка прогноза, статистика Дарбина-Уотсона. Именно эти показатели рассматривались в качестве критерия для выбора модели, дающей наилучшее прогнозное значение интересующей нас переменной, т.е. общего числа страховых организаций.
Список использованных источников
1. Бабкова Е.В. и др. «Методы прогнозирования показателей развития сложных систем», Уфа 2005.
2. Боровиков В.П., Ивченко Г.И. Прогнозирование в системе STATISTICA в среде Windows. - М. : Финансы и статистика : 2000. – 384 с.
3. www.gks.ru – Росстат.