Формализация. Первый игрок имеет две чистые стратегии: покупать и не покупать специализированное ремонтное оборудование. У природы - второго игрока - четыре состояния: станок не выйдет из строя, выйдет один раз, сломается два раза и три раза. Функция выигрыша - затраты фирмы на покупку и ремонт станка, задается платежной матрицей:
Выход станка из строя | |||||
Ремонтное оборудование | ни разу | 1 раз | 2 раза | 3 раза | |
не купить | -100 | -140 | -180 | -220 | |
купить | -150 | -160 | -170 | -180 |
Решение. Рассмотрим сначала эту задачу как антагонистическую игру.
В матрице методом минимакса находим седловую точку: (2,4), таким образом, x* = ( 0, 1 ), y* = ( 0, 0, 0, 1 ), v* = - 180 ден.ед.
Ответ: нужно купить специализированное оборудование.
Однако в играх с природой положение коренным образом меняется: уже в условии заложена устойчивая смешанная стратегия природы: у = ( 0,3; 0,4; 0,2; 0,1) и мы знаем, что именно этой стратегии придерживается природа.
Если же человек - первый игрок - будет продолжать играть оптимально, то его выигрыш составит v(x*) = - 150 0,3 - 160 0,4 - 170 0,2 - 180 0,1 = - 161 , а если применит первую, неоптимальную стратегию, то математическое ожидание его выигрыша составит v(x') = - 100 0,3 - 140 0,4 - 180 0,2 - 220 0,1 = - 144 .
Таким образом, первому игроку выгодно играть неоптимально !
Ответ: не покупать специализированное оборудование.
Существенное различие между значениями v(x*) и v(x') обьясняется тем, что смешанная стратегия природы неоптимальна и она, "отклоняясь" от своей оптимальной стратегии "недополучает" 36 ден.единиц выигрыша.
2. Игры с природой в условиях неопределенности.
Если распределение вероятностей будущих состояний природы не известно, вся информация о природе сводится к перечню ее возможных состояний.
Пример. Игра "Поставщик".
Выпуск продукции фирмы существенно зависит от скоропортящегося материала, например, молока или ягод, поставляемого партиями стоимостью 100ед. Если поставка не прибывает в срок, фирма теряет 400 ед. от недовыпуска продукции. Фирма может послать к поставщику свой транспорт (расходы 50 ед.), однако опыт показывает, что в половине случаев транспорт возвращается ни с чем. Можно увеличить вероятность получения материала до 80%, если предварительно послать своего представителя, но расходы увеличатся еще на 50 ед. Существует возможность приобретать более дорогой (на 50%) материал-заменитель у другого, вполне надежного поставщика, однако, кроме расходов на транспорт (50 ед.) возможны дополнительные издержки хранения материала в размере 30 ед., если его количество на складе превысит допустимую норму, равную одной партии.
Какой стратегии должен придерживаться завод в сложившейся ситуации?
Формализация. У природы два состояния: поставщик надежный и поставщик ненадежный. У фирмы - четыре стратегии: 1) не осуществлять никаких дополнительных действий, 2) послать к поставщику свой транстпорт, 3) послать к поставщику представителя и транстпорт, 4) купить и привезти материал-заменитель от другого поставщика.
Составим таблицу расчетов:
Затраты и убытки фирмы-изготовителя | ||||||
Ситуация | Стоимость материала | Недовыпуск продукции | Транспорт | Команди-ровочные расходы | Издержки хранения | Общая сумма |
1 1 | - 100 | 0 | 0 | 0 | 0 | - 100 |
1 2 | 0 | - 400 | 0 | 0 | 0 | - 400 |
2 1 | - 100 | 0 | - 50 | 0 | 0 | - 150 |
2 2 | - 50 | - 200 | - 50 | 0 | 0 | - 300 |
3 1 | - 100 | 0 | - 50 | - 50 | 0 | - 200 |
3 2 | - 80 | - 80 | - 50 | - 50 | 0 | - 260 |
4 1 | - 250 | 0 | - 50 | 0 | - 30 | - 330 |
4 2 | - 150 | 0 | - 50 | 0 | 0 | - 200 |
Решение. На основе полученных результатов вычислений можно составить платежную матрицу:
min | max | ||
- 100 | - 400 | - 400 | |
- 150 | - 300 | - 300 | |
- 200 | - 260 | - 260 | - 260 |
- 330 | - 200 | - 330 |
Ответ. Нужно придерживаться третьей стратегии и затраты не превысят 260 ед., если послать к поставщику представителя и транстпорт.
1. Рассмотренный способ поиска оптимального решения называется критерием Вальда (Максиминный критерий принятия решения). Выбирается решение, гарантирующее получение выигрыша не меньше, чем maxmin:
vW = maxi minj aij = -260 ед.
Применяя этот критерий мы представляем на месте природы активного и злонамеренного противника. Это пессимистичный подход.
2. Максимаксный критерий. Самый благоприятный случай:
vM = maximaxj aij = -100 ед.
Если фирма ничего не предпримет, то потратит не больше 100 единиц. Это критерий абсолютного оптимизма.
3. Критерий пессимизма-оптимизма Гурвица.
Представляется логичным, что при выборе решения вместо двух крайностей в оценке ситуации придерживаться некоторой промежуточной позиции, учитывающей возможность как наихудшего, так и наилучшего, благоприятного поведения природы. Такой компромиссный вариант и был предложен Гурвицем. Согласно этому подходу для каждого решения необходимо определить линейную комбинацию min и max выигрыша и взять ту стратегию, для которой эта величина окажется наибольшей:
vH = maxi [a maxi aij + (1-a) minj aij ], где a - “степень оптимизма” , 0£ a £1.
При a = 0 критерий Гурвица тождественен критерию Вальда, а при a =1 совпадает с максиминным решением.
На выбор значения степени оптимизма оказывает влияние мера ответственности: чем серьезнее последствия ошибочных решений, тем больше желание принимающего решение застраховаться, то есть степень оптимизма a ближе к нулю.
Влияние степени оптимизма на выбор решения в задаче “Поставщик”.
Степень оптимизма | ||||||||||
Решение | 0,1 | 0,2 | 0,3 | 0,4 | 0,5 | 0,6 | 0,7 | 0,8 | 0,9 | |
А1 | 1 стратегия | -370 | -340 | -310 | -280 | -250 | -220 | -190* | -160* | -130* |
А2 | 2 стратегия | -285 | -270 | -255 | -240 | -225* | -210* | -195 | -180 | -165 |
А3 | 3 стратегия | -254* | -248* | -242* | -236* | -230 | -224 | -218 | -212 | -206 |
А4 | 4 стратегия | -317 | -304 | -281 | -278 | -265 | -252 | -239 | -226 | -213 |
Величина vH для каждого значения a отмечена*. При a £ 4/9 критерий Гурвица рекомендует в задаче “Поставщик” решение А3, при 4/9£ a £2/3 - решение А2. В остальных случаях А1. А4 не выгодно во всех случаях.