Смекни!
smekni.com

Исследование алгоритма SSA-метода при анализе временных последовательностей данных с шумом по известному (стр. 5 из 8)

,
. (1)

Эти вектора образуют траекторную матрицу

ряда
, в которой.
, т. е. матрица
имеет одинаковые элементы на диагонали
.

Этап сингулярного разложения. Обозначим

. Матрица
симметричная и неотрицательно определенная, а значит ее собственные числа
вещественны и неотрицательны. Представленные в виде
собственные числа называют сингулярными значениями матрицы А. Пусть
– соответствующие им ортонормированные собственные вектора. Будем называть
порядком сингулярного разложения. Обозначим

. (2)

Тогда сингулярным разложением матрицы A называется ее представление в виде суммы элементарных матриц

. (3)

Каждая из матриц

имеет ранг, равный единице. Поэтому их можно назвать элементарными матрицами. Вектор
называют k-м левым сингулярным вектором или просто k-м собственным вектором, вектор
– правым сингулярным вектором.

Набор

будем называть k-ой собственной тройкой.

Собственные числа

матрицы А в пакете Mathcad представлены вектором d. Вектор d сингулярных значений в Mathcad определяется с использованием функции svds() [6]:

d := svds(A). (4)

Диагональная матрица ds сингулярных значений матрицы А в пакете Mathcad определяется с использованием функции diag():

ds := diag(d). (5)

Объединенная матрица AS с левыми и правыми сингулярными векторами определяется с использованием функции svd ():

AS := svd(A). (6)

Для разделения левых и правых сингулярных векторов из матрицы AS используется функция submatrix() [6].

Этап группировки. Вид левых и правых сингулярных векторов, трактуемых в SSA как временные ряды, является очень важным для следующего шага метода – группировки [3]. При этом для одномерного SSA левые и правые сингулярные вектора обладают определенной симметрией, так как в этих случаях сингулярные разложения траекторных матриц с длиной окна

и
эквивалентны.

Процедура группировки формально одинакова для всех разновидностей SSA. На основе разложения (3) процедура группировки делит все множество индексов

на
непересекающихся подмножеств
.

Пусть

Тогда результирующая матрица
, соответствующая группе
, определяется как
.Такие матрицы вычисляются для
, тем самым разложение (3) может быть записано в сгруппированном виде:

.(7)

Процедура выбора множеств

и называется группировкой собственных троек. Для определения
в MS Excel используется лепестковая диаграмма, которая является аналогом графика в полярной системе координат, отображая распределение значений относительно начала координат. По особенностям представления сингулярных векторов на лепестковой диаграмме принимается решение о принадлежности их одной группе.

Этап диагонального усреднения. На последнем шаге базового алгоритма каждая матрица сгруппированного разложения переводится в новый ряд длины

. Для произвольной матрицы X процедуру приведения ее к ганкелевому виду и последующему преобразованию в ряд (обозначим его как Gв) выразим следующим образом. Пусть
– матрица размера
с элементами
,
,
. Положим
,
и
. Пусть
, если
и
в остальных случаях. Тогда диагональное усреднение переводит матрицу
в ряд
по формуле

(8)

Это выражение соответствует усреднению элементов матрицы вдоль побочных диагоналей

: выбор
дает
, для
получаем
и т. д. Применив диагональное усреднение к матрицам, полученным на этапе группировки, приходим к разложению исходного ряда в сумму
рядов.

Процедуру диагонального усреднения просто и наглядно предложено выполнить в MS Excel. Для этого матрица, подлежащая диагонализации, размещается на рабочем листе. Затем блок матрицы, следующий за первой строкой сдвигается вправо на одну позицию. В сдвинутом блоке также определяется блок, следующий за первой строкой, который сдвигается вправо на одну позицию. Процедура повторяется до тех пор, пока в очередном блоке не останется ни одной строки. Восстановленный ряд Gв определяется аналогично формуле (1) с использованием функции СРЗНАЧ() в MS Excel. Затем исследуется в пакете Statistica.

4. Исследование временных рядов с шумом заданным Pearson Type V законом распределения

4.1 Постановка эксперимента

Для проведения исследований выбрана функция

+rnd, где
– линейная функция, y1(x)= 0.1+0.09x;
– гармоническая функция, y2(x)=3sin(x); rnd – шум. Переменная
принимает значения от 0 до 42 с шагом, равным единице. Таким образом, длина N ряда
, равна 43. При этом длина окна
, число L-мерных векторов
. Отдельно на рабочем листе MS Excel 2003 рассчитаны значения функций
,
, rnd и
. При этом ряду
линейной функции, или тренда, соответствуют значения Gy1={gy10,gy11,…,gy142}={ 0.1, 0.19,..,3.88}. Ряд
гармонической составляющей – Gy2={gy20,gy21,…,gy242}={ 0, 2.524,..,-2.749}, Rnd={1.489, 0.155,..,0.65} и G={1.59, 2.87,..,1.78}. Элементы ряда
копируются в траекторную матрицу A на рабочем листе Mathcad 14.0.