Розглянемо неперервну задачу оптимального керування
,(1) ,(2) , , . (3)Виконаємо дискретну апроксимацію даної задачі. Для цього розіб’ємо відрізок
точками , і будемо обчислювати значення цільового функціонала і закону руху тільки в точках розбиття: , , . Закон руху в цьому випадку можна записати у вигляді: .Тепер дискретна задача оптимального керування, що апроксимує неперервну задачу (1) – (3), матиме вигляд:
, , (4) , (5) (6) , . (7)Для пошуку оптимального розв’язку отриманої дискретної задачі може бути застосований метод множників Лагранжа. Функція Лагранжа має вигляд:
, ,(8)де
.Обмеження на керування введемо далі, під час реалізації чисельного методу. Відзначимо, що перед першим доданком стоїть знак «–», оскільки
і якщо не додавати «–», то характер екстремуму початкової функції зміниться.Якщо
– локально-оптимальний процес для задачі (4) – (7), то існують такі нерівні одночасно нулю множники Лагранжа , , , , що матимуть місце наступні умови:1.
або , , . (10)2.
або , . (11)Із (9) одержимо ітераційні співвідношення для спряжених змінних
, а з (10) – співвідношення для : , (12) . (13)Перепишемо співвідношення (12) у вигляді:
.Очевидно, що останнє співвідношення є аналогом спряженої системи для неперервних задач керування. Дійсно,
.Якщо
, то з останнього співвідношення одержимоЗі співвідношення (13) випливає, що
.Сформулюємо критерій оптимальності для задачі (4) – (7). Вважатимемо, що функції
, неперервно-диференційовані за змінними і опуклі за . Тоді для локально-оптимального процесу існують такі множники Лагранжа , , , , не всі рівні нулю одночасно, що матимуть місце необхідні умови екстремуму:1) умови стаціонарності в точці
: ;2)
. (14)Розпишемо (14), використовуючи вираз для функції Лагранжа:
Перетворимо вираз під знаком мінімуму, переходячи до довільного
:Або
Якщо
, то з останнього співвідношення одержимоРозглянемо ітераційний метод пошуку оптимального керування задачі (4) – (7). Суть методу полягає в тому, що на кожній ітерації обчислюються два вектори:
і . Перший із них містить -е наближення для керувань у моменти часу для системи (14), при , а другий – -е наближення для фазових станів системи в ці ж моменти часу. Отже, на кожній ітерації ми одержуємо процес , що є -м наближенням до шуканого оптимального процесу.Контроль у методі подвійного перерахування полягає в повторному перерахуванні результатів задачі і порівнянні отриманих даних для різних значень кроку розбиття. У випадку розбіжності виконується корекція і обчислення повторюються.
Розглянемо алгоритм методу.
1. Задаємо крок розбиття
та точність обчислень .2. Задаємо початкове наближення – припустимий набір керувань на кожному кроці – початкову стратегію керування:
, , ,де
– наближення керування в момент на ітерації .3. За визначеною в п. 2 стратегією керування
будуємо фазову траєкторію процесу , ,