где
Стратегия обозначается через
Обозначим произвольную конечную часть стратегии через . Пусть зафиксированы произвольная стратегия
некоторый момент времени п. Если в этот момент система находилась в состоянии
Таким образом, при фиксированной стратегии получаем цепь Маркова с матрицами перехода
Обозначим
называется оптимальной
Верны следующее утверждения:
Утверждение 1. Для бесконечного времени существует оптимальная стационарная стратегия.
Утверждение 2. Для конечного времени существует оптимальная марковская стратегия.
Таким образом, решение (при бесконечном времени) зависит только от состояния, в котором находится система, и не зависит ни от момента времени, ни от всей предыдущей траектории последовательности состояний и принятых решений). В случае конечного времени оптимальная стратегия является марковской, т. е. может зависеть еще и от момента времени принятия решения.
СПИСОК ИСПОЛЬЗОВАННОЙ ЛИТЕРАТУРЫ:
1. «Теория выбора и принятия решений»: учебное пособие. И.М. Макаров, Т.М.
Виноградская, А.А. Рубчинский, В.Б. Соколов. Москва, изд. «Наука», 1982.
2. «Теория вероятностей» Е.С. Вентцель. Москва, изд. «Наука», 1969.