Смекни!
smekni.com

Сущность теории игр (стр. 3 из 4)

(1.23)

Вычислив g, находим

и
:

a11q1 + a12q2 = g; q1 + q2 = 1; (1.24)

a11q1 + a12 (1 – q1) = g. (1.25)

при a11 ¹a12. (1.26)

Задача решена, так как найдены векторы

и цена игры g. Имея матрицу платежей А, можно решить задачу графически. При этом методе алгоритм решения весьма прост (рис. 2.1).

1. По оси абсцисс откладывается отрезок единичной длины.

2. По оси ординат откладываются выигрыши при стратегии А1.

3. На линии, параллельной оси ординат, в точке 1 откладываются выигрыши при стратегии a2.

4. Концы отрезков обозначаются для a11-b11, a12-b21, a22-b22 , a21-b12 и проводятся две прямые линии b11b12 и b21b22.

5. Определяется ордината точки пересечения с. Она равна g. Абсцисса точки с равна р21 = 1 – р2).

Рис. 1.1. Оптимальная смешанная стратегия

Данный метод имеет достаточно широкую область приложения. Это основано на общем свойстве игр т´п, состоящем в том, что в любой игре т´п каждый игрок имеет оптимальную смешанную стратегию, в которой число чистых стратегий не больше, чем min(m, n). Из этого свойства можно получить известное следствие: в любой игре 2´п и т´2 каждая оптимальная стратегия

и
содержит не более двух активных стратегий. Значит, любая игра 2´п и т´2 может быть сведена к игре 2´2. Следовательно, игры 2´п и т´2 можно решить графически. Если матрица конечной игры имеет раз­мерность т´п, где т > 2 и п > 2, то для определения оптимальных смешанных стратегий используется линейное программирование.

1.2.2 Мажорирование (доминирование) стратегий

Мажорирование представляет отношение между стратегиями, наличие которого во многих практических случаях дает возможность сократить размеры исходной платежной матрицы игры. Рассмотрим это понятие на примере матрицы:

(1.27)

Рассуждая с позиции игрока 2, можно обнаружить преимущество его третьей стратегии перед второй, поскольку при первой стратегии игрока 1 выигрыш игрока 2 равен -3 (вторая стратегия) и 1 (третья стратегия), а при второй стратегии игрока 1 выигрыш игрока 2 равен -2 (вторая стратегия) и -0,5 (третья стратегия). Таким образом, при любой стратегии игрока 1 игроку 2 выгоднее применять свою третью стратегию по сравнению со второй; при наличии третьей стратегии игрок 2, если он стремится играть оптимально, никогда не будет использовать свою вторую стратегию, поэтому ее можно исключить из игры, т.е. в исходной платежной матрице можно вычеркнуть 2-й столбец:

(1.28)

С позиции игрока 1 его первая стратегия оказывается хуже второй, так как по первой стратегии он только проигрывает. Поэтому первую стратегию можно исключить, а матрицу игры преобразовать к виду: (0 0,5).

Учитывая интересы игрока 2, следует оставить только его первую стратегию, поскольку, выбирая вторую стратегию, игрок 2 оказывается в проигрыше (0,5 - выигрыш игрока 1), и матрица игры принимает простейший вид: (0), т.е. имеется седловая точка.

Мажорирование можно распространить и на смешанные стратегии. Если элементы одной строки не все меньше (или равны) соответствующих элементов других строк, но все меньше (или равны) некоторых выпуклых линейных комбинаций соответствующих элементов других строк, то эту стратегию можно исключить, заменив ее смешанной стратегией с соответствующими частотами использования чистых стратегий.

В качестве иллюстрации к сказанному рассмотрим матрицу игры:

(1.29)

Для первых двух чистых стратегий игрока 1 возьмем частоты их применения (вероятности) равными 0,25 и 0,75.

Третья стратегия игрока 1 мажорируется линейной выпуклой комбинацией первой и второй чистых стратегий, взятых с частотами 0,25 и 0,75 соответственно, т.е. смешанной стратегией:

24 × 0,25 + 0 × 0,75 = 6 > 4; (1.30)

0 × 0,25 + 8 × 0,75 = 6 > 5. (1.31)

Поэтому третью стратегию игрока 1 можно исключить, используя вместо нее указанную выше смешанную стратегию.

Аналогично, если каждый элемент некоторого столбца больше или равен некоторой выпуклой линейной комбинации соответствующих элементов некоторых других столбцов, то этот столбец можно исключить из рассмотрения (вычеркнуть из матрицы). Например, для матрицы

(1.32)

третья стратегия игрока 2 мажорируется смешанной стратегией из первой и второй его чистых стратегий, взятых с частотами 0,5 и 0,5:

10 × 0,5 + 0×0,5 = 5 < 6; (1.33)

0 × 0,5 + 10 × 0,5 = 5 < 7. (1.34)

Таким образом, исходная матрица игры эквивалентна матрице следующего вида:

(1.35)

Как видно, возможности мажорирования смешанными страте­гиями в отличие от чистых значительно менее прозрачны (нужно должным образом подобрать частоты применения чистых стратегий), но такие возможности есть, и ими полезно уметь пользоваться.


1.3 Игры с природой

Модели в виде стратегических игр, в экономической практике могут не в полной мере оказаться адекватными действительности, поскольку реализация модели предполагает многократность повторения действий (решений), предпринимаемых в похожих условиях. В реальности количество принимаемых экономических решений в неизменных условиях жестко ограничено. Нередко экономическая ситуация является уникальной, и решение в условиях неопределенности должно приниматься однократно. Это порождает необходимость развития методов моделирования принятия решений в условиях неопределенности и риска.

Традиционно следующим этапом такого развития являются так называемые игры с природой. Формально изучение “игр с природой“, так же как и стратегических, должно начинаться с построения платежной матрицы, что является, по существу, наиболее трудоемким этапом подготовки принятия решения. Ошибки в платежной матрице не могут быть компенсированы никакими вычислительными методами и приведут к неверному итоговому результату.

Отличительная особенность игры с природой состоит в том, что в ней сознательно действует только один из участников, в большинстве случаев называемый игроком 1. Игрок 2 (природа) сознательно против игрока 1 не действует, а выступает как не имеющий конкретной цели и случайным образом выбирающий очередные «ходы» партнер по игре. Поэтому термин «природа» характеризует некую объективную действительность, которую не следует понимать буквально, хотя вполне могут встретиться ситуации, в которых «игроком» 2 действительно может быть природа (например, обстоятельства, связанные с погодными условиями или с природными стихийными силами).


2.ПРАКТИЧЕСКОЕ ИСПОЛЬЗОВАНИЕ СМЕШАННЫХ СТРАТЕГИЙ

2.1 Постановка задачи

Выбрать оптимальный режим работы новой системы ЭВМ, состоящей из двух ЭВМ типов А1 и А2. Известны выигрыши от внедрения каждого типа ЭВМ в зависимости от внешних условий, если сравнить со старой системой.

При использовании ЭВМ типов А1 и А2 в зависимости от харак­тера решаемых задач В1 и В2 (долговременные и краткосрочные) будет разный эффект. Предполагается, что максимальный выигрыш соответствует наибольшему значению критерия эффекта от замены вычислительной техники старого поколения на ЭВМ A1 и А2.

Итак, дана матрица игры (табл. 1), где A1, А2 - стратегии руководителя; В1, В2 - стратегии, отражающие характер решаемых на ЭВМ задач.

Таблица 2.1.

Игрок 2Игрок 1 В1 В2 ai
А1 0,3 0,8 0,3
А2 0,7 0,4 0,4
bj 0,7 0,8

Требуется найти оптимальную смешанную стратегию руководителя и гарантированный средний результат g, т.е. определить, какую долю времени должны использоваться ЭВМ типов A1 и А2.

2.2 Описание алгоритма решения

Запишем условия в принятых обозначениях:

а11 = 0,3; а12 = 0,8; а21 = 0,7; а22 = 0,4.

Определим нижнюю и верхнюю цены игры:

a1 = 0,3; a2 = 0,4; a = 0,4; b1=0,7; b2 = 0,8; b = 0,7.

Получаем игру без седловой точки, так как

(2.1)

(2.2)

Максиминная стратегия руководителя вычислительного центра – А2.

Для этой стратегии гарантированный выигрыш равен a = 0,4 (40%) по сравнению со старой системой.

Определим g, pl и р2 графическим способом (рис. 2.1).

Рис. 2.1. Графическая интерпретация алгоритма решения

Алгоритм решения:

1. По оси абсцисс отложим отрезок единичной длины.