Изменение состояния системы, т. е. процесс в ней, может происходить в результате управляющих воздействий. Будем рассматривать системы, управляющие воздействия в которых моделируются с помощью элементов r-мерного пространства U:
, .
Управляющие воздействия могут задаваться в виде функций от t, т.е. .
На допустимые состояния системы и управления могут быть наложены ограничения. Рассмотрим множество троек - совокупность - мерных векторов в пространстве . Тогда ограничения на состояние системы и управление в самом общем случае могут быть записаны в виде
,
где - некоторая область (подмножество) рассматриваемого - мерного пространства. Ограничения на величины , в каждый фиксированный момент времени t могут быть заданы и в виде
,
где Vt - сечение множества V при заданном значении t.
Пару функций назовем процессом. Между функциями имеется связь: как только задано управление системой, последовательность ее состояний (траектория системы) определяется однозначно. Связь между и моделируется по-разному в зависимости от того, является система непрерывной или дискретной.
Для непрерывных систем модели процессов задаются системой дифференциальных уравнений вида
,
или в векторной форме
. (4.2.1)
Пусть задано состояние, в котором система находилась в начальный момент . Для простоты этот момент примем равным нулю, а момент окончания процесса - равным Т. Тогда аргумент процесса t изменяется в пределах , а начальным состоянием системы будет вектор
, (4.2.2)
где - начальное значение i-й координаты вектора состояния системы.
Проанализируем, каким образом модель отражает связь между управлениями и состоянием системы, изменяющимся под их воздействием. Пусть на промежутке задано управление . Подставляя его в правую часть системы (4.2.3), получим
(4.2.3)
Имеем систему дифференциальных уравнений относительно неизвестной функции . Решая ее с учетом начальных условий (4.2.2), получим . Это решение и есть траектория, отвечающая заданному управлению .
Модель дискретной управляемой системы имеет вид системы рекуррентных уравнений:
, .
В векторной форме эту модель можно записать в виде
, (4.2.4)
Здесь t принимает значение . Начальное значение будем считать известным.
В дискретной системе, как и в непрерывной, задание управляющих воздействий при позволяет однозначно определить отвечающую им траекторию системы. При подстановке значения u(t) в правую часть (4.2.4) получаем систему уравнений, которая позволяет при известном значении состояния в момент времени t определить состояние в следующий момент времени. Так как в начальный момент состояние известно, то, подставив его в правую часть (4.2.4), получим
.
Подставляя затем найденное значение и в (4.2.4), так же найдем значение . Продолжая этот процесс, через Т шагов получим последнее искомое значение .
Таким образом, и в дискретном случае уравнения модели (4.2.4) позволяют однозначно определить траекторию системы , если задано управление .
Следовательно, процесс должен удовлетворять следующим ограничениям:
1) при всех ;
2) Пара удовлетворяет системе уравнений процесса:
а) системе (4.2.1) в непрерывном случае при ;
б) системе (4.2.4) в дискретном случае при ;
3) Заданы начальные условия (4.2.2);
4) В непрерывном случае на функции , накладываются некоторые дополнительные ограничения, связанные с применимостью употребляемых здесь математических записей. Функцию будем считать кусочно-непрерывной, а вектор-функцию - непрерывной и кусочно-дифференцируемой.
Процессы , удовлетворяющие условиям 1) – 4), будем называть допустимыми. Таким образом, допустимый процесс - это управляющие воздействия и соответствующая им траектория системы , удовлетворяющие перечисленным ограничениям.
Для постановки оптимизационной задачи необходимо ввести в рассмотрение функционал F, заданный на множестве М. Задача оптимального управления будет состоять в выборе элемента множества M, на котором функционал F достигает минимального значения. Такой процесс называют оптимальным процессом, управление - оптимальным управлением, а траекторию оптимальной траекторией.