По обеим группам это будет выглядеть следующим образом:
В матричной форме это выражение может быть записано так:
где А - вектор коэффициентов дискриминантной функции;
Объединенная ковариационная матрица
Следовательно выражение (8) дает оценку внутригрупповой вариации и его можно записать в виде:
Межгрупповая вариация может быть измерена как
При нахождении коэффициентов дискриминантной функции
В точке, где функция Fдостигает максимума, частные производные по
и приравнять их нулю, то после преобразований получим выражение:
Из этой формулы и определяется вектор коэффициентов дискриминантной функции (А)
Полученные значения коэффициентов подставляют в формулу (1) и для каждого объекта в обеих группах (множествах) вычисляют дискриминантные функции, затем находят среднее значение для каждой группы. Таким образом, каждое i-е наблюдение, которое первоначально описывалось m переменными, будет как бы перемещено в одномерное пространство, т.е. ему будет соответствовать одно значение дискриминантной функции, следовательно, размерность признакового пространства снижается.
3. Классификация при наличии двух обучающих выборок
Перед тем как приступить непосредственно к процедуре классификации, нужно определить границу, разделяющую в частном случае две рассматриваемые группы. Такой величиной может быть значение функции, равноудаленное от
Величина С называется константой дискриминации.
На рис.1 видно, что объекты, расположенные над прямой f(x)=
Рассмотрим пример использования дискриминантного анализа для проведения многомерной классификации объектов. При этом в качестве обучающих будем использовать сначала две выборки, принадлежащие двум классам, а затем обобщим алгоритм классификации на случай k классов.
Пример 1. Имеются данные по двум группам промышленных предприятий машиностроительного комплекса:
Номер | Х1 | Х2 | ХЗ | |
предприятия | ||||
1 | 0,50 | 94,0 | 8,50 | |
l-я группа | 2 | 0,67 | 75,4 | 8,79 |
3 | 0,68 | 85,2 | 9,10 | |
4 | 0,55 | 98,8 | 8,47 | |
5 | 1,52 | 81,5 | 4,95 | |
2-я группа | 6 | 1,20 | 93,8 | 6,95 |
7 | 1,46 | 86,5 | 4,70 |
Необходимо провести классификацию четырех новых предприятий, имеющих следующие значения исходных переменных:
l-е предприятие:
2-е предприятие:
3-е предприятие:
4-е предприятие:
Для удобства запишем значения исходных переменных для каждой группы предприятий в виде матриц
Рассчитаем среднее значение каждой переменной в отдельных группах для определения положения центров этих групп:
I гр.
II гр.
Дискриминантная функция f(x)в данном случае имеет вид:
f(х) =
Коэффициенты
A=
где
Для определения совместной ковариационной матрицы