При этом предполагается, что моменты to, Т фиксированы, т. е. рассматривается задача с закрепленным временем; множество U не зависит от времени, фазовые ограничения отсутствуют. Положим
,где
-константа,Функция Н называется функцией Гамильтона.
Система линейных дифференциальных уравнений
>В более подробной покоординатной записи сопряженная система принимает вид
, (2.3)Система (2.3) имеет при любых начальных условиях единственное решение
, определенное и непрерывное на всем отрезке .Следующая теорема выражает необходимые условия оптимальности в задаче (2.1).
Теорема (принцип максимума Понтрягина).
Пусть функции
и, Ф, g1, ..., gm имеют частные производные по переменным х1, ..., Хn и непрерывны вместе с этими производными по совокупности аргументов х , и U, t [to. Т]. Предположим, что (и, х)-решение задачи (2.1). Тогда существует решение сопряженной системы (2.3), соответствующей управлению и и траектории х, и константа такие, что|
| + || (t) || при t [to, Т], и выполняются следующие условия:а) (условие максимума) при каждом t
[to. Т] функция Гамильтона , достигает максимума по при v=u (t), т. е.H(x(t), u(t),
=max H(x(t), v(t), (2.4)б)(условие трансверсальности на левом конце траектории) существуют числа
, такие, что (2.5)в) (условие трансверсальности на правом конце траектории) существуют числа
такие, что (2.6)Центральным в теореме является условие максимума -(2.4).
Если отказаться от предположения о том, что конечный момент времени Т фиксирован, то теорема останется справедливой за исключением условия трансверсальности на правом конце траектории. Условие (2.6) заменим условием
и добавить еще одно условие трансверсальности на правом конце траектории:
Примеры применения принципа максимума.
1. Простейшая задача оптимального быстродействия.
Пусть точка движется по прямой в соответствии с законом
(3.1)где х - координата. Требуется найти управление и, переводящее точку из начального положения в начало координат за минимальное время Т (задача оптимального быстродействия). При этом скорость точки в конце траектории должна быть нулевой, а управление - удовлетворять условию
.Применим к сформулированной задаче принцип максимума Понтрягина . Введем фазовые переменные
. Тогда движение управляемого объекта описывается системой двух дифференциальных уравнений первого порядка: (3.2)Начальное положение
при t0=0 и конечное положение (0, 0) фиксированы, а конечный момент времени Т не фиксирован.
В обозначениях п.п. 1, 2 в данной задаче U ==[-1, 1], f0=1, Ф=0, а функция Гамильтона имеет вид
Общее решение сопряженной системы
легко выписывается в явном виде
где С, D - постоянные.
Очевидно, что максимум функции Н по и U достигается при
Таким образом, оптимальное управление и может принимать лишь два значения +1 .
2.Определить управление u(t) , которое дает минимум интегралу
, в процессе, описываемом уравнением (1).Для этой переменной имеем дифференциальное уравнение
( (3)с начальными условиями, получаемыми из (2), т.е. х2(0)=0. Минимизирующий функционал, используя (2), можно записать в виде I[T]=x2(T).
Построим функцию Гамильтона
Запишем сопряженную систему
(3)Запишем
Y1(Т)=0 (т.к. с1=0)
Y2(Т)=-1
Из
поэтому Y2(е)=-1. Теперь функция Гамильтона запишется в виде H=-aY1x1+Y1u-0,5x12-0,5u2 .По принципу максимума функция Н при фиксированных х1 и Y1 достигает максимума по u :
, , откуда .Осталось решить систему уравнений (2) и (3) при условии
, Y2(Т)=-1, , с граничными условиямиСведем данную систему к одному уравнению относительно U.