2 Описание используемого математического аппарата
при проведении расчетов
2.1 Метод наименьших квадратов (МНК)
Метод наименьших квадратов позволяет относительно просто определить аналитическую зависимость одного показателя от другого: y=φ(x). Имея такую функциональную зависимость, легко определить значение Y при любом значении x, т.е. получить прогнозное значение Y при заданном значении х.
Вывод формул МНК. Пусть имеем статистические данные о параметре y в зависимости от х. Эти данные представим в таблице ниже:
х | х1 | х2 | ….. | хi | ….. | хn |
y* | y1* | y2* | ...... | yi* | ….. | yn* |
Метод наименьших квадратов позволяет при заданном типе зависимости y=φ(x) так выбрать ее числовые параметры, чтобы кривая y=φ(x) наилучшим образом отображала экспериментальные данные по заданному критерию. Рассмотрим обоснование с точки зрения теории вероятностей для математического определения параметров, входящих в φ(x).
Предположим, что истинная зависимость y от х в точности выражается формулой y=φ(x). Рассмотрим какое-нибудь значение аргумента хi. Результат опыта есть случайная величина yi,распределенная по нормальному закону с математическим ожиданием φ(xi) и со средним квадратическим отклонением σi, характеризующим ошибку измерения. Пусть точность измерения во всех точках х=(х1, х2, …, хn) одинакова, т.е. σ1=σ2=…=σn=σ. Тогда нормальный закон распределения Yi имеет вид:
(1)
В результате ряда измерений произошло следующее событие: случайные величины (y1*, y2*, …, yn*). Поставим следующую задачу.
Задача МНК. Подобрать математические ожидания φ(x1), φ(x2), …, φ(xn) так, чтобы вероятность этого события была максимальной. Так как величины Yi непрерывны, то говорят не о вероятностях событий Yi=yi*, а о вероятностях того, что Yi примут значения из интервала (yi*,yi*+dyi*), т.е.
Вероятность P того, что система случайных величин (y1, y2, …, yn) примет совокупность значений, лежащих в пределах (yi*,yi*+dyi*), i=1, 2, …, n, с учетом того, что измерения проводятся независимо друг от друга, равна произведению вероятностей Fi(yi)*dyi* для всех значений i:
(2)
Где k – коэффициент, не зависящий от φ(xi).
Требуется выбрать математические ожидания
φ(x1), φ(x2), …, φ(xn) так, чтобы выражение (2) достигало максимума. Это возможно, когда выполнено условие
. (3)
Отсюда получаем требование метода наименьших квадратов: для того чтобы данная совокупность наблюдаемых значений (y1*, y2*, …, yn*) была наивероятнейшей, нужно выбрать функцию φ(x) так, чтобы сумма квадратов отклонений наблюдаемых значений yi* от φ(xi) была наименьшей.
При решении практических задач зависимость y=φ(x) задается в виде y=φ(x,a1, a2, …, am), где a1, a2, …, am – числовые параметры, которые необходимо определить. Учитывая соотношение (3), получим
(4)
Продифференцируем выражение (4) по a1, a2, …, am и прировняем полученные производные нулю. Получим следующую систему уравнений:
, ,… … … … … … … … … … ; (5)
,где
- значения частной производной функции φ по аk в точке хi.Отметим, что в общем случае систему (5) решить нельзя, так как неизвестен вид функции φ(x,a1, a2, …, am). При решении практических задач зависимость y от x ищут в виде линейной комбинации известных функций с коэффициентами a1, a2, …, am, а именно:
. Подставив значение φk(х) в (5), решаем эту систему и находим a1, a2, …, am.Рассмотрим один из частных случаев МНК: пусть зависимость y от х выражается линейной функцией y=a1+a2x. Тогда значения коэффициентов a1 и a2 находятся по следующим формулам:
; (6)
2.2 Экспоненциальное сглаживание
Экспоненциальное сглаживание – один из простейших и распространенных приемов выравнивания ряда. В его основе лежит расчет экспоненциальных средних.
При исследовании временного ряда xt экспоненциальное сглаживание проводится по формуле:
(8)где хt – текущий член временного ряда в момент времени t;
St – значение экспоненциальной средней в момент времени t;
α – параметр адаптации (параметр сглаживания),
0< α<1, β=1-α.
В качестве начальных условий для применения экспоненциального сглаживания рекомендуется выбирать следующие значения:
- среднее арифметическое всех имеющихся значений (или части значений) временного ряда;
- среднее геометрическое всех имеющихся значений временного ряда;
- значения, выбранные из статистики, полученной при наблюдении за аналогами изучаемого явления.
Величина St оказывается взвешенной суммой всех членов ряда. Причем веса падают экспоненциально в зависимости от давности наблюдения.
Экспоненциальная средняя St имеет то же математическое ожидание, что и ряд х, но меньшую дисперсию. Чем меньше α, тем в большей степени сокращается дисперсия экспоненциальной средней.
2.3 Двухпараметрическая модель Хольта
При исследовании численности населения используется двухпараметрическая модель Хольта.
Простейшая модификация двухпараметрической модели Хольта выглядит следующим образом:
где:
- временной ряд; - прогнозное значение врем. ряда в точке t на шагов вперед; - шаг прогноза; - коэффициенты; - параметры адаптации, и ; - ошибка прогноза.2.4 Трехпараметрическая модель Бокса и Дженкинса
Модель Бокса и Дженкинса является одним из вариантов “усовершенствованной” модели Хольта за счет включения в расчетные формулы разности ошибок прогнозов:
(1)
(2)
(3)
(4)
где – ошибка прогноза.
Обобщенная модель Бокса и Дженкинса может применяться для прогнозирования нестационарных временных рядов, так как содержит не только операцию сглаживания скользящим средним, но и элементы авторегрессии.
Модель основывается на гипотезе, что изучаемый процесс является выходом линейного фильтра, на вход которого подан процесс белого шума, т.е. что член ряда
является взвешенной суммой текущего и предыдущих значений входного потока.