Смекни!
smekni.com

Исследование методов оптимизации (стр. 2 из 8)

Параметр

обычно принимается равным 1,5.

Полученная точка

заменяет
, если
. В противном случае для замены
используется точка
.

б)

. При этом реализуется отражение. Точка
заменяет
.

в)

. В этом случае осуществляется сжатие и отыскивается точка

Параметр

обычно принимается равным 0,5. Точка
заменяет
.

г)

. При этом осуществляется редукция (уменьшение размера симплекса путем приближения всех его вершин к вершине
). Координаты вершин нового симплекса рассчитываются по формулам

Критерий останова вычислительной процедуры имеет вид :

Критерий останова J является составным. При этом его компоненты имеют различный вес в зависимости от того, каков характер поведения оптимизируемой функции в окрестности экстремума. Если в районе экстремума оптимизируемая функция изменяется по типу «глубокая впадина», то больший вклад в численное значение критерия J вносит первое слагаемое, а второе при этом быстро уменьшается. Напротив, если оптимизируемая функция изменяется по типу «пологое плато», то первое слагаемое быстро становится малым и поэтому второе слагаемое вносит больший вклад в величину критерия J.

Модификация метода

Описанный «классический» вариант построения алгоритма метода Нелдера-Мида обладает конструктивным недостатком, который состоит в следующем. Предположим, что оптимизируемая функция, для простоты, двух переменных имеет вид глубокого оврага с очень пологим дном. Тогда может случиться так, что симплекс, который в рассматриваемом случае представляет собой треугольник, в какой-то момент двумя вершинами ляжет на дно оврага, а третья окажется на его склоне. При этом на очередном шаге произойдет переброс этой вершины на другой склон, а затем редукция или сжатие симплекса. Если склон оврага крутой, то эта процедура повторится много раз, в результате чего симплекс сожмется и может сработать критерий останова, хотя до точки минимума еще может быть очень далеко. Естественное усовершенствование алгоритма состоит в следующем. После срабатывания критерия останова целесообразно построить над центром тяжести сжавшегося симплекса новый, размеры которого соответствуют исходному симплексу. Пусть координаты центра тяжести сжавшегося симплекса образуют вектор

.

Найдем теперь координаты точки

такой, что центр тяжести симплекса с длиной ребра, равной t , использующего вершину
в качестве начальной, совпадал бы с
. Матрица координат указанного симплекса имеет вид

(2.1)

Координаты центра тяжести этого симплекса образуют вектор

Теперь координаты точки

найдем из равенства
=
, откуда

где

Подставляя вычисленные значения

в выражение (2.1) , получим требуемый симплекс, используя который продолжим процедуру поиска минимума. С другой стороны, для продолжения процедуры в качестве начальной точки может быть использован центр тяжести «сжавшегося» симплекса. Возникающее при этом смещение нового симплекса относительно сжавшегося (точки предполагаемого останова) во многих случаях может даже оказаться полезным. Эту процедуру считаем законченной, если после очередного сжатия алгоритм приведет в точку, расстояние от которой до точки предыдущего сжатия
не превосходит некоторого достаточно малого
.

2.2 Градиентный метод с дроблением шага

Большей эффективностью обладают итерационные процедуры, в которых приближение к минимуму осуществляется сразу по всем переменным. При этом задача состоит в нахождении последовательности векторов

таких, что

(2.2)

Методы построения таких последовательностей называют методами спуска. Пусть

Поставим задачу отыскания последовательности
., сходящейся к
.

Выберем произвольным образом точку

, направление
и сконструируем луч

. (2.3)

Рассмотрим вопрос о выборе направления

, обеспечивающего (2.2). Для этого изучим поведение
вдоль луча
. Имеем

Введем

(2.4)

Здесь

В соответствии с (2.3)

Тогда

Вычислим

(2.5)

Теперь, чтобы для любого

обеспечить отрицательность (2.5), достаточно положить
, где
произвольная положительно определенная
матрица. Тогда

При этом

(2.6)

Выбрав каким-либо образом

, получим
Затем аналогично рассчитаем

Общее рекуррентное соотношение имеет вид :

(2.7)

Различные варианты градиентных процедур отличаются друг от друга способом выбора

.

Полученное соотношение (2.7) обеспечивает построение последовательности точек

, сходящейся к точке
, минимизирующей
. Понятно, что каждая из точек этой последовательности может рассматриваться как некоторое приближение к точке минимума
, положение которого, вообще говоря, остается неизвестным в ходе всей процедуры спуска. Поэтому для всех таких процедур принципиальной остается проблема останова. В вычислительной практике часто используются следующие критерии останова: