C =
, (13)поскольку сомножители в данном выражении не зависят от значений переменной Y, а затем выполнять умножение на матрицу взаимных ковариаций
.Если выполняется прогноз одного значения переменной Y, например на момент t = p,
, то вектор C умножается на вектор-строку ковариаций ,где
, , . (14)Данный метод может быть использован при прогнозировании значений переменных как по пространственным данным (пространственный срез) (cross-sectional data), например, по набору сведений о доходностях разных ценных бумаг (X и Y) за один и тот же период (момент) времени, так и по данным временных рядов (time-series data), например, доходности ценной бумаги данного вида (Y) за несколько лет.
Во втором случае, т.е. в случае, когда прогноз
переменной Y в момент t = p выполняется по данным временного ряда , формула (11) принимает следующий вид , (14')где
– вектор-строка ковариаций, с элементами (i=1, …, m); KYY – автоковариационная матрица вектора Y.При этом формулу для дисперсии ошибки прогноза в момент t = p (с учетом выражения (12)) можно переписать следующим образом
, (15)где Dy – дисперсия случайного процесса Y.
Поскольку ковариационная матрица положительно определена и, следовательно, квадратичная форма
в выражении (15) принимает неотрицательные значения, любой прогноз будет уменьшать исходную дисперсию Dy. В худшем случае, когда точка p, в которой выполняется прогноз, настолько удалена от ординат Yi, i=1, 2, …, m с заданными значениями, что вектор ковариаций является нулевым вектором, дисперсия прогноза будет равна дисперсии исходного процесса Dy:D (P) = Dy.
Если момент t = p, на который выполняется прогноз переменной Y, совпадает с моментом t = i, на который известно ее значение Yi, элементы вектора ковариаций
будут совпадать с элементами i-й строки ' и элементами i-го столбца матрицы автоковариаций KYY. Поэтому в соответствии с (14) значение прогноза будет в точности совпадать с заданным значением переменной , (16)и в соответствии с (15) ошибка дисперсии прогноза D (P) = 0, так как квадратичная форма
при p = i достигает своего максимального значения, равного дисперсии Dy.Формулы (10) и (14) называются средним квадратическим прогнозом или коллокацией [1] и представляют собой аналог формулы прогноза Колмогорова–Винера, известной из теории стохастических процессов. И как показано выше, вся методика линейного прогноза сводится к простейшим матричным операциям.
Используя данные временных рядов по годовым доходностям долгосрочных облигаций корпораций США и доходностям рыночного портфеля (портфеля, включающего акции 500 фирм и выбранного корпорацией Standard & Poor's для характеристики рынка в среднем) за период исследования (с 1984 по 1993 г.) [2], выполним сравнительный анализ результатов прогнозирования, полученных при помощи парной регрессионной модели и модели коллокации (табл. 1).
Таблица 1
t | Год | Долгосрочные облигации корпораций Yt, % | Портфель обыкновенных акций Xt, % |
1 | 1984 | 16,39 | 6,27 |
2 | 1985 | 30,90 | 32,16 |
3 | 1986 | 19,85 | 18,47 |
4 | 1987 | -0,27 | 5,23 |
5 | 1988 | 10,70 | 16,81 |
6 | 1989 | 16,23 | 31,49 |
7 | 1990 | 6,78 | -3,17 |
8 | 1991 | 19,89 | 30,55 |
9 | 1992 | 9,39 | 7,67 |
10 | 1993 | 13,19 | 9,99 |
В качестве исходных данных будем использовать значения доходностей за девять лет (с 1984 по 1992 г. включительно), а последнее значение, соответствующее 1993 г., будем использовать для контроля качества прогноза, поэтому число данных n в обеих моделях будем принимать равным 9.
Регрессионная модель прогноза, с оцененными по методу наименьших квадратов параметрами, имеет вид:
. (17)Для определения точностных характеристик модели (оценка дисперсии параметров модели, дисперсии прогноза и т.д.) вычисляются остатки регрессии
и находится сумма их квадратов (табл. 2).Таблица 2
t | Yt | et | ||
1 | 16,39 | 9,277 | 7,113 | 50,598 |
2 | 30,90 | 22,758 | 8,142 | 66,293 |
3 | 19,85 | 15,629 | 4,221 | 17,813 |
4 | -0,27 | 8,735 | -9,005 | 81,094 |
5 | 10,70 | 14,765 | -4,065 | 16,525 |
6 | 16,23 | 22,409 | -6,179 | 38,181 |
7 | 6,78 | 4,361 | 2,419 | 5,850 |
8 | 19,89 | 21,920 | -2,030 | 4,119 |
9 | 9,39 | 10,006 | -0,616 | 0,379 |
| 280,853 |
Оценка дисперсии ошибок регрессии и оценки дисперсии параметров модели для данных табл. 2 соответственно равны:
40,122; 0,0294; 12,128. Коэффициент детерминации R2, характеризующий качество подгонки регрессионной модели к наблюденным значениям Yt , (t = 1, …, 9) и F – статистика, используемая для проверки его значимости (R2=0,506, F=9,237 > F (k1, k2) = F (1,7) = 5,59, где F – критическое значение критерия при пятипроцентном уровне значимости = 5%, и уровней свободы k1 = 1 и k2 = n–2 = 7), свидетельствуют о том, что есть основания полагать, что между переменными имеется корреляционная зависимость.При помощи регрессии (17) выполним прогноз доходности долгосрочных облигаций корпораций на 1993 г. Y93 по значению доходности рыночного портфеля на этот год X93=9,99:
,и, таким образом, отклонение от истинного значения составляет
Y93 –
= 13,19 – 11,21 = 1,98, (18)а оценка дисперсии прогноза индивидуального значения
= 45,699.Теперь выполним прогноз, используя модель коллокации (11). Для этого необходимо построить модели ковариационных функций: автоковариационной функции вектора X, взаимной ковариационной функции между X и Y, взаимной ковариационной функции между Y и X.
Первым шагом при построении ковариационных функций является вычисление оценок ковариаций по данному динамическому ряду:
, , , ,где
– выборочные средние.Вторым шагом является выбор подходящей аппроксимирующей функции, и если нет каких-либо дополнительных соображений теоретического характера, то в качестве таковых обычно выбирают непрерывные функции вида:
, , (19)где , , K(0) = DY – параметры модели. Поскольку члены последовательностей
, , , ( = 0, ..., k) для данных табл. 1 меняют знак, то в данной работе воспользуемся выражением (19).На третьем шаге выполняется оценка параметров модели ковариационной функции (например, по методу наименьших квадратов). В данной работе воспользуемся методом, основанным на использовании "существенных" параметров:
1) дисперсии процесса K(0) = DY ;
2) радиуса корреляции 0,5 – значение аргумента ковариационной функции, при котором ее значение равно половине дисперсии, т.е.