Смекни!
smekni.com

Методические указания к выполнению лабораторных работ по дисциплине «Интеллектуальные информационные системы» Санкт-Петербург (стр. 6 из 10)

(напомним, что s–хранимое сингулярное число, а V– это хранимый правый сингулярный вектор обучающей матрицы A).

7. Выбирается ui, которая имеет минимальное расстояние (близость) с энергией связи w:

8. Считать класс ci искомым классом образа Z.

4.4. Замечания

Данное ядро алгоритма распознавания образов использует только максимальное (первое) сингулярное число s и соответствующие ему сингулярные векторы U и V, которые вычисляются на шаге 2 данного алгоритма.

В общем случае, рекомендуется использовать первые три сингулярных числа и соответствующие им сингулярные векторы обучающей матрицы. Они могут быть вычислены по той же итеративной схеме (шаг 2) с использованием вычислительной процедуры метода исчерпывания:

1.Вычислить максимальное сингулярное число s1 и соответствующие ему сингулярные вектора U1 и V1 обучающей матрицы на шаге 2.

2.Сформировать матрицу A2=A‑s1U1V1 и вычислить ее максимальное сингулярное число s2 и соответствующие ему сингулярные векторы U2 и V2 посредством шага 2.

3.Сформировать матрицу A3=A – s2U2V2 и вычислить ее максимальное сингулярное число s3 и соответствующие ему сингулярные векторы U3 и V3 посредством шага 2.

Затем вычислить 3 значения энергии связи с помощью шага 6:

Определить класс ci на шаге 8 посредством определения минимального расстояния в трехмерном Евклидовом пространстве на шаге 7:

,

где

являются i-ми компонентами левых сингулярных векторов U1, U2, U3.

Отметим, что шаги 2 и 3 над матрицами A2 и A3 обеспечивают более точную аппроксимацию обучающей матрицы, согласно следующему свойству сингулярного разложения:

где

– ранг матрицы A.

Следует также отметить, что данный алгоритм иммунокомпьютинга может быть рассмотрен как «иммунный» алгоритм, так как любой образ может быть представлен как частный случай формального протеина и его распознавание основывается на энергии связи с антителом формального протеина.

4.5. Лабораторная работа № 4

Цель работы: создание программного модуля для реализации вычислительной процедуры обучения с экспертом на основе инструментария универсальной системы MATLAB.

4.5.1. Порядок выполнения работы

1. Открыть универсальную систему MATLAB.

2. Задать исходную матрицу А соответствующей размерности и матрицу анализируемого объекта М. Программно реализовать шаги 1-8 алгоритма вычислительной процедуры обучения с экспертом.

3. Сохранить все результаты выполнения работы в файле на диске.

4.5.2. Порядок оформления отчета

Отчетом о лабораторной работе № 4 является файл с именем, совпадающим с фамилией студента с результатами работы в папке Мои документы/номер группы.

4.5.3. Пример выполнения лабораторной работы №4

Рассмотрим решение задачи классификации (задачи обучения с экспертом) на примере классификации легковых автомобилей.

Пусть имеется обучающая выборка в виде матрицы R размерности (3×33). Эта матрица в качестве элементов имеет индикаторы, характеризующие три класса легковых автомобилей (второй, пятый и шестой):

Рисунок 17 Обучающая выборка в виде матрицы R размерности (3×33).

Сингулярное разложение обучающей матрицы R осуществляется c помощью оператора: [U S V]=svd(R).

Ниже представлены матрицы компонент сингулярного разложения:

Рисунок 18 Матрицы компонент сингулярного разложения

Анализируемый объект представляется в виде вектора М:

M=[2000 3 1375 1925 222 10.1 445 4547 1766 1428 2650 1528 106 3 2 1781 9.5 2 20 150 210 2 1 3 2 2 2 2 11.3 6.4 9.2 1 71].

Для этого вектора М вычисляем значения энергии связи и расстояние до соответствующих точек для 2, 5, 6, классов в пространстве ФИС.

Рисунок 19 Результаты вычислений значений энергии

Из полученного множества значений расстояний от точки в пространстве ФИС, характеризуемой анализируемый объект до точек, характеризующих соответственно, классы 2, 5, 6:

d={d2,d5,d6}={1.0090, 0.4082, 1.2202}

выбираем наименьшее значение, которое равно 0.4082. Это значение определяет принадлежность анализируемого объекта к 5 классу.

Вывод: анализируемый объект принадлежит к 5 классу.

4.5.4. Контрольные вопросы

1. Какая норма была использована при проведении классификации?

2. Сущность вычислительной процедуры автоматической классификации.

3. Можно ли назвать рассмотренную процедуру обучения с экспертом интеллектуальной процедурой?

4.

5.

6.

7.

8.

9.

10.

5. ФОРМИРОВАНИЕ ИНДЕКСОВ РИСКА

5.1. Описание задачи формирования индексов

Индексом сложной многомерной системы является общая величина, которая объединяет большое количество особых множителей (факторов) или переменных величин, называемых индикаторами. В некоторых случаях такой индекс является единственным путем представления текущего состояния системы и ее динамики, по которым возможно оценить активность системы и предсказать риски и тенденции. Например, риски деловой активности, такие как Dow-Jones или NASDAQ, широко используются в экономике и финансах. Как правило, такие индексы были введены на основе эмпирических соображений, некоторые из них рассчитываются достаточно легко, как среднее арифметическое последовательностей определенных переменных. К примеру, The Standard and Poor Index применяет стоимость к среднему представлению 500 акций на Нью-Йоркской фондовой бирже в течение дня. The Retail Price Index, как другой пример, измеряет среднее увеличение цены обычной сети продуктов питания в Великобритании.

Аналогичные индексы являются такими же важными, как в экономике, так и в других областях, например, в медицине.

5.2. Базовый алгоритм вычисления индекса

Пусть состояние многомерной системы характеризуется вектором индикаторов X=[x1,…,xn]. Пусть имеется набор из m векторов Xk, k=1,2,…,m, с известными значениями индикаторов. Предлагается следующий базовый алгоритм вычисления индекса данной системы.

1. По исходным данным формируется матрица A=[X1,…,Xm]T размерности n, где m – количество объектов, которые соответствуют строкам матрицы, а n – количество параметров (индикаторов), которые соответствуют столбцам матрицы.

2. Методом сингулярного разложения матрицы A вычисляется k-й правый сингулярный вектор Vk=[ν1,…,νn]k, который соответствует k-му сингулярному числу матрицы sk.

3. Для любого входного (распознаваемого) вектора Z размерности n×1 вычисляется его энергия связи с вектором Vk=[ν1,…,νn]k:

(1)

4. Искомое значение индекса вычисляется по следующей формуле:

Ik(Z)=c0+c1ωk. (2)

Рассмотрим важное математическое свойство базового алгоритма.

Предложение 1. Если входной вектор совпадает со строкой матрицы A:

то значение энергии связи в точности совпадает с соответствующей компонентой левого сингулярного вектора Uk=[u1,….,um]k : ωk(Ai)=uki.

Значения коэффициентов c0 и c1 индекса Ik(Z), а также номер k правого сингулярного вектора в уравнении (2) могут определяться двумя способами:

1) экспериментально (на основе экспертных оценок) в соответствии с особенностью приложения;

2) как решение задачи параметрической оптимизации для определения значений коэффициентов индекса.

Рассмотрим решение второй задачи на основе среднеквадратического критерия качества.

Пусть имеется матрица M=[ωkj] размерности (m), где k=1,…,p и p – количество сингулярных векторов, используемых для расчета индекса, а j=1,…,m и m – количество обучающих векторов. При этом значение элементов данной матрицы вычисляются по формуле (1) базового алгоритма для обучающих векторов.

Представим задачу в векторно-матричном виде:

MC=B, (3)

где C ‑ вектор коэффициентов индекса размерности (m×1):

C=[cm-1,…, c1,c0]T,