· метод градиентного спуска;
· метод наискорейшего градиентного спуска;
· метод покоординатного спуска;
· метод Гаусса-Зейделя;
· метод сопряженных градиентов.
- методы второго порядка, использующие для своей реализации информацию о 1-х и 2-х производных функции

:
· метод Ньютона;
· метод Ньютона-Рафсона;
· метод Марквардта
- Методы нулевого порядка, представленные в практикуме, позволяют производить поиск безусловного экстремума функций с помощью заданной последовательности операций. Повторение этих операций производится до тех пор, пока не будет выполнен критерий окончания, определяемый используемым методом.
В практикуме реализованы следующие методы нулевого порядка:
· метод случайного поиска
· метод деформируемого многогранника
· метод конфигураций
1.1.1 Метод градиентного спуска
Алгоритм метода:

,
здесь:
o

- направление антиградиента функции;
o

- шаг выбирается из условия убывания функции в точках последовательности

Геометрическая интерпретация метода:

Рисунок 1.2. Геометрическая интерпретация метода
Основной критерий окончания метода:
Построение последовательности заканчивается в точке, для которой

где

- заданное малое положительное число, здесь

Начальные параметры метода:

.
Изменяемый параметр метода: величина шага

.
Особенности реализации алгоритма. Вопрос о величине шага на каждой итерации решается пользователем, причем шаг может быть, как уменьшен, если не выполняется условие

, так и увеличен, если скорость сходимости алгоритма невысока (по субъективной оценке пользователя).
Рекомендации по выбору параметров метода. Согласно алгоритму метода, каждая последующая точка

в методе градиентного спуска ищется в направлении

направлении антиградиента функции, построенном в текущей точке

. Поэтому, если направление антиградиента в текущей точке приблизительно совпадает с направлением на минимум (согласно чертежу), шаг следует увеличить, чтобы ускорить процесс сходимости, если же направление антиградиента сильно отличается от направления на минимум, шаг уменьшают, в противном случае функция может уменьшиться несущественно или даже возрасти.
1.1.2 Метод градиентного наискорейшего спуска
Алгоритм метода:

,
здесь
·

- направление антиградиента функции
·

- шаг вычисляется из условия наибольшего убывания функции в точках последовательности:
·

Геометрическая интерпретация метода

Рисунок 1.3. Геометрическая интерпретация метода
В методе наискорейшего градиентного спуска последующая точка

минимизирующей последовательности также ищется в направлении

- направлении антиградиента функции, построенном в текущей точке, но условия вычисления шага позволяют определить наилучшее положение точки

на этом направлении. Как видно из чертежа, точка

принимает на направлении спуска

предельное положение, которое характеризуется тем, что линия уровня, проходящая через точку

, касается направления спуска, а, следовательно, в точках минимизирующей последовательности, построенной по методу градиентного наискорейшего спуска, выполняется условие:

Основной критерий окончания метода:

Начальные параметры метода:

Изменяемые параметры метода: отрезок для уточнения шага

.
Особенности реализации алгоритма. При решении задачи поиска оптимального шага

, функция

становится функцией одой переменной

, т.к.

, а

и

известны. Следовательно, задача о поиске оптимального шага

- это задача

, которая в лабораторной работе решается численно методом дихотомии на отрезке

с заданной точностью

. Вопрос о границах отрезка

на каждой итерации решается пользователем.
Рекомендации по выбору параметров метода. При задании на каждой итерации отрезка

для уточнения шага, следует помнить, что искомое решение может лежать как внутри, так и на границе интервала

.
Проиллюстрируем ситуацию, при которой шаг

вычисляется численно методом дихотомии. Для этого построим график функции

, которая в случае если

является квадратичной функцией, имеет вид:

Рисунок 1.4 Метод дихотомии
Для вычислений по методу дихотомии должен быть задан отрезок для уточнения оптимального значения шага.
Как видно из чертежа, если в качестве отрезка будет выбран

, оптимальное значение шага, при котором функция

принимает минимальное значение, окажется внутри отрезка, и метод с заданной точностью

отыщет это значение. Если же отрезок будет

, в качестве результата счета по методу дихотомии будет получено значение

- как дающее наименьшее значение функции

на отрезке, аналогично при выборе отрезка

будет получено значение

.
Таким образом, отрезок для уточнения оптимального шага должен быть достаточно большим, чтобы гарантировано включать искомое значение шага. Признаками неверного задания отрезка

являются: отсутствие касания траектории спуска из точки

и линии уровня функции через точку

, а также равенство величины оптимального шага величине одной из границ отрезка

.