Изменение состояния системы, т. е. процесс в ней, может происходить в результате управляющих воздействий. Будем рассматривать системы, управляющие воздействия в которых моделируются с помощью элементов r-мерного пространства U:
,
.
Управляющие воздействия могут задаваться в виде функций от t, т.е.
.
На допустимые состояния системы и управления
могут быть наложены ограничения. Рассмотрим множество троек
- совокупность
- мерных векторов в пространстве
. Тогда ограничения на состояние системы и управление в самом общем случае могут быть записаны в виде
,
где - некоторая область (подмножество) рассматриваемого
- мерного пространства. Ограничения на величины
,
в каждый фиксированный момент времени t могут быть заданы и в виде
,
где Vt - сечение множества V при заданном значении t.
Пару функций назовем процессом. Между функциями
имеется связь: как только задано управление
системой, последовательность ее состояний (траектория системы)
определяется однозначно. Связь между
и
моделируется по-разному в зависимости от того, является система непрерывной или дискретной.
Для непрерывных систем модели процессов задаются системой дифференциальных уравнений вида
,
или в векторной форме
. (4.2.1)
Пусть задано состояние, в котором система находилась в начальный момент . Для простоты этот момент примем равным нулю, а момент окончания процесса
- равным Т. Тогда аргумент процесса t изменяется в пределах
, а начальным состоянием системы будет вектор
, (4.2.2)
где - начальное значение i-й координаты вектора состояния системы.
Проанализируем, каким образом модель отражает связь между управлениями и состоянием системы, изменяющимся под их воздействием. Пусть на промежутке задано управление
. Подставляя его в правую часть системы (4.2.3), получим
(4.2.3)
Имеем систему дифференциальных уравнений относительно неизвестной функции . Решая ее с учетом начальных условий (4.2.2), получим
. Это решение и есть траектория, отвечающая заданному управлению
.
Модель дискретной управляемой системы имеет вид системы рекуррентных уравнений:
,
.
В векторной форме эту модель можно записать в виде
,
(4.2.4)
Здесь t принимает значение . Начальное значение
будем считать известным.
В дискретной системе, как и в непрерывной, задание управляющих воздействий при
позволяет однозначно определить отвечающую им траекторию системы. При подстановке значения u(t) в правую часть (4.2.4) получаем систему уравнений, которая позволяет при известном значении состояния
в момент времени t определить состояние
в следующий момент времени. Так как в начальный момент
состояние
известно, то, подставив его в правую часть (4.2.4), получим
.
Подставляя затем найденное значение и
в (4.2.4), так же найдем значение
. Продолжая этот процесс, через Т шагов получим последнее искомое значение
.
Таким образом, и в дискретном случае уравнения модели (4.2.4) позволяют однозначно определить траекторию системы , если задано управление
.
Следовательно, процесс должен удовлетворять следующим ограничениям:
1) при всех
;
2) Пара удовлетворяет системе уравнений процесса:
а) системе (4.2.1) в непрерывном случае при ;
б) системе (4.2.4) в дискретном случае при ;
3) Заданы начальные условия (4.2.2);
4) В непрерывном случае на функции ,
накладываются некоторые дополнительные ограничения, связанные с применимостью употребляемых здесь математических записей. Функцию
будем считать кусочно-непрерывной, а вектор-функцию
- непрерывной и кусочно-дифференцируемой.
Процессы , удовлетворяющие условиям 1) – 4), будем называть допустимыми. Таким образом, допустимый процесс - это управляющие воздействия
и соответствующая им траектория системы
, удовлетворяющие перечисленным ограничениям.
Для постановки оптимизационной задачи необходимо ввести в рассмотрение функционал F, заданный на множестве М. Задача оптимального управления будет состоять в выборе элемента множества M, на котором функционал F достигает минимального значения. Такой процесс называют оптимальным процессом, управление
- оптимальным управлением, а траекторию
оптимальной траекторией.