Смекни!
smekni.com

Исследование алгоритма SSA-метода при анализе временных последовательностей данных с шумом по известному (стр. 2 из 8)

//функция распределения F(x)

static double DistributionFunction(double x, double alpha, double beta)

{if (x > 0)

{return 1 - Gamma::DistributionFunction(1/x, alpha, 1/beta);//F(x)=1-FG(1/x)

}

else {return 0;}

}

virtual double DensityFunction(double x) override

{return Pearson5::DensityFunction(x, m_alpha, m_beta);}

//плотность f(x)

static double DensityFunction(double x, double alpha, double beta)

{if (x > 0)

{return Math::Pow(x, -(alpha + 1)) * Math::Exp(-beta / x) / Math::Pow(beta, -alpha) / Gamma::GammaFunction(alpha);}

else {return 0;}

}

};

}

Полученный по этой функции ряд представлен следующими значениями: (Объем выборки равен 43. Это ограничение обусловлено последующим использованием пакета Mathcad, в котором общее число элементов матрицы не должно превышать числа 600)

1,4898437906868

0,155118334154153

0,61232084606753

2,93030830346735

0,805146083946738

9,56457213164303

1,27783343504077

0,251137603293805

3,5276740403232

1,87120717537695

1,32530533009446

0,580380148657655

2,75653644757967

1,17443969975235

40,4251902165006

0,819370739897353

0,76435890601386

0,294787757136549

7,05592655012343

2,66917981096155

8,79281345418844

0,580093474185326

1,39633930229403

2,53700526140079

0,770494926092603

1,93265448451382

1,18590055703106

1,0792114387216

0,82818491346851

1,7150955462617

2,95934460597946

2,25523634892915

0,235192957404532

1,90816102397495

0,459223533552272

1,2301015212362

0,461599593338555

5,8725267553485

0,405012588940358

0,697295973424586

1,10547514222875

5,24774803293084

0,650277052201361

1.5 Формулировка гипотезы о законе распределения Pearson Type V

Пусть f0(x) – известная плотность вероятности распределения Pearson Type V и fξ(x) – плотность вероятности генеральной совокупности.

Гипотеза вида

{H0 : fξ(x) = f0(x); H1 : fξ(x) ≠ f0(x);}

Является двухальтернативной непараметрической сложной гипотезой о законе распределения. Здесь проверяется утверждение о том, что исследуемая выборка извлечена из распределения f0(x)

Для проверки согласия полученных случайных величин теоретическому распределению используется λ-критерий Колмогорова–Смирнова. Критерий Колмогорова–Смирнова применяется с наибольшей эффективностью, когда есть основание предположить, что частоты каждого из порядковых значений будут располагаться не случайным образом, а в соответствии с некоторой предсказуемой схемой.

Процедура, связанная с вычислением тестовой статистики λ, требует накапливания частот по всем порядковым значениям. Затем сравниваются два распределения накопленных частот – теоретическое распределение, имеющее место при справедливой H0, и наблюдаемое распределение. Таким образом, проверяется гипотеза

H0 : Fξ(x) = F0(x),

против альтернативы

H1 : Fξ(x) ≠ F0(x),

где Fξ(x) – функция распределения генеральной совокупности, F0(x) – непрерывная гипотетическая функция распределения.

Для проверки гипотезы используется статистика

,

где Δ – максимальный модуль отклонения гипотетической функции распределения от эмпирической функции распределения

.

Если гипотеза H0 верна, то статистика λ имеет распределение, приближающееся при

к распределению Колмогорова–Смирнова. Критерий для проверки гипотезы имеет следующий вид:

P(λ > λα) = α,

где α – 100α-процентное отклонение распределения Колмогорова–Смирнова. Например, для α = 0,01 критическое значение статистики λα = 1,627.

Для последовательности (выборки) данные сгруппированы для проведения расчетов по критерию согласия Колмогорова–Смирнова.

Г. Стерджес (Herbert Sturges, 1926) предложил правило для определения числа интервалов k при построении гистограммы распределения случайной величины. При этом i-й интервал является биномиальным коэффициентом

. Общий объем выборки

,

отсюда число интервалов для построения гистограммы с нормальными данными

,

где n – количество значений случайной величины в исследуемой выборке. Полученное значение округляется до целого числа. Правило Г. Стерджеса справедливо для величин, распределенных по нормальному закону. В общем случае оно может быть использовано без корректировки для n < 200 [6]. При использовании десятичного логарифма, соответственно, используется формула

.

Для построения гистограммы и проверки гипотезы о законе распределения Pearson Type V построена таблица 1.

Таблица 1 – Исходные данные для построения гистограммы и проверки гипотезы о законе распределения Pearson Type V

1 2 3 4 5 6 7
ξi 0-5,857 5,857-11,714 11,714-17,571 17,571-23,428 23,428-29,285 29,285-35,142 35,142-41
Fξ 38 4 0 0 0 0 1

1.6 Проверка гипотезы о законе распределения Pearson Type V

Для проверки гипотезы о законе распределения выполняется следующая последовательность шагов.

Шаг 1. Находим ожидаемую частоту ni0 путем вычисления в Mathcad интеграла функции плотности вероятности на каждом из интервалов. Результат представлен на рисунках 1.2, 1.3, 1.4, 1.5, 1.6, 1.7, 1.8.


Рисунок 1.2. Ожидаемая вероятность на интервале 0 - 5,857

Рисунок 1.3. Ожидаемая вероятность на интервале 5,857-11,714

Рисунок 1.4. Ожидаемая вероятность на интервале 11,714-17,571


Рисунок 1.5. Ожидаемая вероятность на интервале 17,571-23,428

Рисунок 1.6. Ожидаемая вероятность на интервале 23,428-29,285

Рисунок 1.7. Ожидаемая вероятность на интервале 29,285-35,142

Рисунок 1.8. Ожидаемая вероятность на интервале 35,142 – 41


Шаг 2. Выражаем каждую наблюдаемую и каждую ожидаемую частоту в виде отношения:

частота клетки

n

Шаг 3. Вычисляем накопленные значения наблюдаемых и ожидаемых отношений путем их суммирования слева направо (суммирование справа налево также приводит к статистике λ).

Шаг 4. Находим абсолютные значения разности между накопленными наблюдаемыми отношениями и накопленными ожидаемыми отношениями.

Шаг 5. Находим наибольшее отношение и выражаем его в виде десятичной дроби. Полученное значение соответствует тестовой статистике λ. В данном примере наибольшее отношение равно Δ =0,058744186.

Шаг 6. В таблице Е [4, с. 141] (критические значения Δα в критерии Колмогорова–Смирнова для одной выборки) при объеме выборки свыше 35 предлагается определять критическое значение Δα при α = 0,01 по формуле

.

Если наблюдаемое значение Δ больше или равно критическому значению, H0 отклоняется. В данном примере критическое значение Δα=0,249. Поскольку наблюдаемое значение Δ меньше критического, H0 принимается.

1.7 Программа для проверки гипотезы о законе распределения

Проверка гипотезы о законе распределения выполнена в электронной таблице MS Excel. Случайные величины эмпирического распределения расположены в ячейках B2:B44. Рабочее поле для выполнения расчетов расположено в ячейках E4:K11.


Рисунок 1.9. Проверка гипотезы о законе распределения, выполненная в электронной таблице MS Excel


2. Распределение Rayleigh

2.1 Формализованное описание закона Rayleigh распределения случайной величины

Плотность вероятности

где a – параметр масштаба, мода (а>0)

Функция распределения

Функция риска

График функции плотностей распределения вероятностей Rayleigh представлен на рисунке 2.1.

Рисунок 2.1. Функции плотностей распределения вероятностей Rayleigh


2.2 Примеры использования закона распределения Rayleigh

Варианты применения: Время выполнения какой-либо задачи.

2.3 Числовые характеристики закона распределения Rayleigh

Математическое ожидание

Медиана

Мода

Дисперсия

Стандартное отклонение

Коэффициент вариации

Асимметрия