
,

. (1)
Эти вектора образуют траекторную матрицу

ряда

, в которой.

, т. е. матрица

имеет одинаковые элементы на диагонали

.
Этап сингулярного разложения. Обозначим

. Матрица

симметричная и неотрицательно определенная, а значит ее собственные числа

вещественны и неотрицательны. Представленные в виде

собственные числа называют сингулярными значениями матрицы А. Пусть

– соответствующие им ортонормированные собственные вектора. Будем называть

порядком сингулярного разложения. Обозначим

. (2)
Тогда сингулярным разложением матрицы A называется ее представление в виде суммы элементарных матриц

. (3)
Каждая из матриц

имеет ранг, равный единице. Поэтому их можно назвать элементарными матрицами. Вектор

называют k-м левым сингулярным вектором или просто k-м собственным вектором, вектор

– правым сингулярным вектором.
Набор

будем называть k-ой собственной тройкой.
Собственные числа

матрицы А в пакете Mathcad представлены вектором d. Вектор d сингулярных значений в Mathcad определяется с использованием функции svds() [6]:
d := svds(A). (4)
Диагональная матрица ds сингулярных значений матрицы А в пакете Mathcad определяется с использованием функции diag():
ds := diag(d). (5)
Объединенная матрица AS с левыми и правыми сингулярными векторами определяется с использованием функции svd ():
AS := svd(A). (6)
Для разделения левых и правых сингулярных векторов из матрицы AS используется функция submatrix() [6].
Этап группировки. Вид левых и правых сингулярных векторов, трактуемых в SSA как временные ряды, является очень важным для следующего шага метода – группировки [3]. При этом для одномерного SSA левые и правые сингулярные вектора обладают определенной симметрией, так как в этих случаях сингулярные разложения траекторных матриц с длиной окна

и

эквивалентны.
Процедура группировки формально одинакова для всех разновидностей SSA. На основе разложения (3) процедура группировки делит все множество индексов

на

непересекающихся подмножеств

.
Пусть

Тогда результирующая матрица

, соответствующая группе

, определяется как

.Такие матрицы вычисляются для

, тем самым разложение (3) может быть записано в сгруппированном виде:

.(7)
Процедура выбора множеств

и называется группировкой собственных троек. Для определения

в MS Excel используется лепестковая диаграмма, которая является аналогом графика в полярной системе координат, отображая распределение значений относительно начала координат. По особенностям представления сингулярных векторов на лепестковой диаграмме принимается решение о принадлежности их одной группе.
Этап диагонального усреднения. На последнем шаге базового алгоритма каждая матрица сгруппированного разложения переводится в новый ряд длины

. Для произвольной матрицы X процедуру приведения ее к ганкелевому виду и последующему преобразованию в ряд (обозначим его как G
в) выразим следующим образом. Пусть

– матрица размера

с элементами

,

,

. Положим

,

и

. Пусть

, если

и

в остальных случаях. Тогда диагональное усреднение переводит матрицу

в ряд

по формуле

(8)
Это выражение соответствует усреднению элементов матрицы вдоль побочных диагоналей

: выбор

дает

, для

получаем

и т. д. Применив диагональное усреднение к матрицам, полученным на этапе группировки, приходим к разложению исходного ряда в сумму

рядов.
Процедуру диагонального усреднения просто и наглядно предложено выполнить в MS Excel. Для этого матрица, подлежащая диагонализации, размещается на рабочем листе. Затем блок матрицы, следующий за первой строкой сдвигается вправо на одну позицию. В сдвинутом блоке также определяется блок, следующий за первой строкой, который сдвигается вправо на одну позицию. Процедура повторяется до тех пор, пока в очередном блоке не останется ни одной строки. Восстановленный ряд Gв определяется аналогично формуле (1) с использованием функции СРЗНАЧ() в MS Excel. Затем исследуется в пакете Statistica.
4. Исследование временных рядов с шумом заданным Pearson Type V законом распределения
4.1 Постановка эксперимента
Для проведения исследований выбрана функция

+rnd, где

– линейная функция, y1(x)= 0.1+0.09x;

– гармоническая функция, y2(x)=3sin(x); rnd – шум. Переменная

принимает значения от 0 до 42 с шагом, равным единице. Таким образом, длина N ряда

, равна 43. При этом длина окна

, число L-мерных векторов

. Отдельно на рабочем листе MS Excel 2003 рассчитаны значения функций

,

, rnd и

. При этом ряду

линейной функции, или тренда, соответствуют значения Gy1={gy10,gy11,…,gy142}={ 0.1, 0.19,..,3.88}. Ряд

гармонической составляющей – Gy2={gy20,gy21,…,gy242}={ 0, 2.524,..,-2.749}, Rnd={1.489, 0.155,..,0.65} и G={1.59, 2.87,..,1.78}. Элементы ряда

копируются в траекторную матрицу A на рабочем листе Mathcad 14.0.