Курсоваяработа по теорииоптимальногоуправленияэкономическимисистемами.
Тема : Задачадинамическогопрограммирования.
I.Основныепонятия иобозначения.
Динамическоепрограммирование– это математическийметод поискаоптимальногоуправления,специальноприспособленныйк многошаговымпроцессам.Рассмотримпример такогопроцесса.
Пустьпланируетсядеятельностьгруппы предприятийна Nлет. Здесь шагомявляется одингод. В начале1-го года на развитиепредприятийвыделяютсясредства, которыедолжны бытькак-то распределенымежду этимипредприятиями.В процессе ихфункционированиявыделенныесредства частичнорасходуются.Каждое предприятиеза год приноситнекоторыйдоход, зависящийот вложенныхсредств. В началегода имеющиесясредства могутперераспределятьсямежду предприятиями: каждому изних выделяетсякакая-то долясредств.
Ставитсявопрос : как вначале каждогогода распределятьимеющиесясредства междупредприятиями,чтобы суммарныйдоход от всехпредприятийза Nлет былмаксимальным?
Перед намитипичная задачадинамическогопрограммирования,в которойрассматриваетсяуправляемыйпроцесс –функционированиегруппы предприятий.Управлениепроцессомсостоит враспределении(и перераспределении)средств. Управляющимвоздействием(УВ) являетсявыделене каких-тосредств каждомуиз предприятийв начале года.
УВ на каждомшаге должновыбиратьсяс учетом всехего последствийв будущем. УВдолжно бытьдальновидным,с учетом перспективы.Нет смыславыбирать нарассматриваемомшаге наилучшееУВ, если в дальнейшемэто помешаетполучить наилучшиерезультатыдругих шагов.УВ на каждомшаге надо выбирать“cзаглядываниемв будущее”,иначе возможнысерьезныеошибки.
Действительно,предположим,что в рассмотреннойгруппе предприятийодни занятывыпуском предметовпотребления,а другие производятдля этого машины.Причем цельюявляется получениеза Nлет максимальногообъема выпускапредметовпотребления.Пусть планируютсякапиталовложенияна первый год.Исходя их узкихинтересовданного шага(года), мы должныбыли бы всесредства вложитьв производствопредметовпотребления,пустить имеющиесямашины на полнуюмощность идобиться кконцу годамаксимальногообъема продукции.Но правильнымли будет такоерешение в целом?Очевидно, нет.Имея в видубудущее, необходимовыделить какую-тодолю средстви на производствомашин. При этомобъем продукцииза первый год,естественно,снизится, затобудут созданыусловия, позволяющиеувеличиватьее производствов последующиегоды.
В формализмерешения задачметодом динамическогопрограммированиябудут использоватьсяследующиеобозначения:
N– числошагов.
Xk– областьдопустимыхсостояний наk-омшаге.
Uk– областьдопустимыхУВ на k-омшаге.
Wk– величинавыигрыша, полученногов результатереализацииk-гошага.
S –общий выигрышза Nшагов.
Sk+1(
S1(
Методдинамическогопрограммированияопирается наусловие отсутствияпоследействияи условиеаддитивностицелевой функции.
Условиеотсутствияпоследействия.Состояние
Аналогично,величина выигрышаWkзависитот состояния
Условиеаддитивностицелевой функции.Общий выигрышза Nшагов вычисляетсяпо формуле
Определение.Оптимальнойстратегиейуправления
Условиеотсутствияпоследействияпозволяетсформулироватьпринцип оптимальностиБелмана.
Принципоптимальности.Каково бы нибыло допустимоесостояниесистемы
В качествепримера постановкизадачи оптимальногоуправленияпродолжимрассмотрениезадачи управленияфинансированиемгруппы предприятий.Пусть вначале i-гогода группепредприятий
Управлениеможет бытьхорошим илиплохим, эффективнымили неэффективным.Эффективностьуправления
Поставленнаязадача являетсязадачей оптимальногоуправления,а управление,при которомпоказательSдостигаетмаксимума,называетсяоптимальным.Оптимальноеуправление
Таким образом,перед намистоит задача:определитьоптимальноеуправлениена каждом шаге
II.Идеи методадинамическогопрограммирования
Мы отметили,что планируямногошаговыйпроцесс, необходимовыбирать УВна каждом шагес учетом егобудущих последствийна еще предстоящихшагах. Однако,из этого правилаесть исключение.Среди всехшагов существуетодин, которыйможет планироватьсябез "заглядыва-нияв будущее".Какой это шаг?Очевидно, последний— посленего другихшагов нет. Этотшаг, единственныйиз всех, можнопланироватьтак, чтобы онкак таковойпринес наибольшуювыгоду. Спланировавоптимальноэтот последнийшаг, можно кнему пристраиватьпредпоследний,к предпоследнему— предпредпоследнийи т.д.
Поэтому процессдинамическогопрограммированияна 1-м этаперазворачиваетсяот конца к началу,то есть раньшевсех планируетсяпоследний,
N-йшаг. А как егоспланировать,если мы не знаем,чем кончилсяпредпоследний?Очевидно, нужносделать всевозможныепредположенияо том, чем кончилсяпредпоследний,(N— 1)-й шаг, идля каждогоиз них найтитакое управление,при которомвыигрыш (доход)на последнемшаге был бымаксимален.Решив эту задачу,мы найдем условнооптимальноеуправление(УОУ) на N-мшаге, т.е. управление,которое надоприменить, если(N —1)-й шаг закончилсяопределеннымобразом.
Предположим,что эта процедуравыполнена, тоесть для каждогоисхода
(N— 1)-го шагамы знаем УОУна N-мшаге и соответствующийему условнооптимальныйвыигрыш (УОВ).Теперь мы можемоптимизироватьуправлениена предпоследнем,(N— 1)-м шаге. Сделаемвсе возможныепредположенияо том, чем кончилсяпредпредпоследпий,то есть(N— 2)-й шаг, идля каждогоиз этих предположенийнайдем такоеуправлениена (N —1)-м шаге, чтобывыигрыш запоследние двашага (из которыхпоследний ужеоптимизирован)был максимален.Далее оптимизируетсяуправ чениена (N —2)-м шаге, и т.д.
Одним словом,на каждом шагеищется такоеуправление,которое обеспечиваетоптимальноепродолжениепроцесса относительнодостигнутогов данный моментсостояния. Этотпринцип выборауправления, называетсяпринципомоптимальности.Само управление,обеспечивающееоптимальноепродолжениепроцесса относительнозаданногосостояния,называетсяУОУ на данномшаге.
Теперьпредположим,что УОУ на каждомшаге нам известно:мы знаем, чтоделать дальше,в каком бы состояниини был процесск началу каждогошага. Тогдамы можем найтиуже не "условное",а дейсгвительнооптимальноеуправлениена каждом шаге. |
Действительно,пусть нам известноначальноесостояниепроцесса. Теперьмы уже знаем,что делать напервом шаге:надо применитьУОУ, найденноедля первогошага и начальногососюяния. Врезультатеэтого управленияпосле первогошага системаперейдет вдругое состояние;но для этогосостояния мызнаем УОУ и гд. Таким образом,мы найдем оптимальноеуправлениепроцессом,приводящеек максимальновозможномувыигрышу.
Такимобразом, в процессеоптимизацииуправленияметодом динамическогопрограммированиямногошаговыйпроцесс "проходится"дважды:
— первыйраз — от концак началу, врезультатечего находятсяУОУ| на каждомшаге и оптимальныйвыигрыш (тожеусловный) навсех шагах, начиная с данногои до конца процесса;
второйраз — от началак концу, в результатечего находятсяоптимальныеуправленияна всех шагахпроцесса.
Можносказать, чтопроцедурапостроенияоптимальногоуправления
методомдинамическогопрограммированияраспадаетсяна две стадии:
предварительнуюи окончательную.На предварительнойстадии длякаждого шагаопределяетсяУОУ, зависящееот состояниясистемы (достигнутогов результатепредыдущихшагов), и условнооптимальныйвыигрыш навсех оставшихсяшагах, начинаяс данного, такжезависящий отсостояния. Наокончательнойстадии определяется(безусловное)оптимальноеуправлениедля каждогошага. Предварительная(условная)оптимизацияпроизводитсяпо шагам в обратномпорядке: отпоследнегошага к первому;окончательная(безусловная)оптимизация— также по шагам,но в естественномпорядке: отпервого шагак последнему.Из двух стадийоптимизациинесравненноболее важнойи трудоемкойявляется первая.После окончанияпервой стадиивыполнениевторой трудностине представляет:остается только"прочесть"рекомендации,уже заготовленныена первой стадии.
III. Примерзадачи динамическогопрограммирования
Выборсостава оборудованиятехнологическойлинии.
Естьтехнологическаялиния ,то есть цепочка,последовательностьопераций.
На каждуюоперацию можноназначитьоборудованиетолько каго-тоодного вида,а оборудования,способногоработать наданной операции, - нескольковидов.
i | 1 | 2 | 3 | |||
j | 1 | 2 | 1 | 2 | 1 | 2 |
| 10 | 8 | 4 | 5 | 8 | 9 |
| 12 | 8 | 4 | 6 | 9 | 9 |
| 20 | 18 | 6 | 8 | 10 | 12 |
Стоимостьсырья
Расходы, связанныес использованиемединицы оборудованияj-го типана i-ойоперации
Производительности,соответственно,по выходу ивходу
Решение:
Для того,чтобы решитьданную задачуметодом динамическогопрограммированиявведем следующиеобозначения:
N= 3 – числошагов.
Ui– областьдопустимыхУВ на i-мшаге.
Wi– оценкаминимальнойсебестоимости,полученнаяв результатереализацииi-гошага.
S –функцияобщего выигрыша т.е. минимальнаясебестоимость.
Si+1(
S1(
Запишемвекторадопустимыхзначений
Запишемвектора допустимыхуправляющихвоздействий
З
З
1)Обратныйпроход
Д
Учитываято, чтоэтот шаг у наспоследнийи следующейоперации
у
возьмемстоимость сырья
при
при
т.е.
Для i=2
при
при
при
при
т.е.
Д
при
при
п
при
при
при
при
при
т.е.
П
Учитываято,что и
i
Таким образомоптимальныйвыбор составаоборудованиятехнологическойлинии предполагаетследующее:
На 1-уюоперацию назначимоборудование2-го вида
На 2-уюоперацию назначимоборудование1-го вида
На 3-ьюоперацию назначимоборудование2-го вида
Оценкаминимальнойсебестоимостисоставит 105,5.
Разделколлекции :Экономико-математическоемоделирование
Автор: РодионовД.А.
Контактныесведения :dimarik@chel.ru
Наименованияработы :Динамическоепрограммирование
Видработы :курсовая работа
Пожелания: -