Имеется некоторое множество наблюдений, которые относятся к p различных классов. Требуется, используя информацию об этих наблюдениях и их классификациях, найти такое правило, с помощью которого можно было бы с минимальным количеством ошибок классифицировать вновь появляющиеся наблюдения.
Наблюдение задается вектором x, а его классификация - числом
Таким образом, требуется, имея последовательность из l наблюдений и классификаций
Для формализации термина «ошибка» принимается предположение о том, что существует некоторое правило
Далее предполагается, что в пространстве векторов x существует неизвестная нам вероятностная мера (обозначаемая плотность
Качество решающего правила
Проблема следовательно заключается в построении решающего правила
Сходной с задачей распознавания образов является задача восстановления регрессии, предпосылки к которой формулируются следующим образом:
Два множества элементов связаны функциональной зависимостью, если каждому элементу x может быть поставлен в соответствие элемент y. Эта зависимость называется функцией, если множество x - векторы, а множество y - скаляры. Однако существуют и такие зависимости, где каждому вектору x ставится в зависимость число y, полученное с помощью случайного испытания, согласно условной плотности
Существование таких связей отражает наличие стохастических зависимостей между вектором x и скаляром и скаляром y. Полное знание стохастической зависимости требует восстановления условной плотности
Строгая постановка задачи такова:
В некоторой среде, характеризующейся плотностью распределения вероятности P(x), случайно и независимо появляются ситуации x. В этой среде функционирует преобразователь, который каждому вектору x ставит в соответствие число y, полученное в результате реализации случайного испытания, согласно закону
Задача восстановления регрессии является одной из основных задач прикладной статистики. К ней приводится проблема интерпретации прямых экспериментов.
Задача решается в следующих предположениях:
–Искомая закономерность связывает функциональной зависимостью величину y с вектором x:
–Целью исследования является определение зависимости
–Ни в одной точке x условия эксперимента не допускают систематической ошибки, то есть математическое ожидание измерения
–Случайные величины
В этих условиях необходимо по конечному числу прямых экспериментов восстановить функцию
Задача восстановления регрессии принято сводить к проблеме минимизации функционала
Как было показано в предыдущем параграфе данной главы, решение основных задач восстановления зависимостей достигается при помощи процедуры оптимизации функционала качества.
Ее решение будет рассмотрено в подходах задачи безусловной минимизации гладкой функции
Данная задача непосредственно связана с условиями существования экстремума в точке:
* Необходимое условие первого порядка. Точка