Из всех значений находят минимальное:
,
которое дает минимаксный выигрыш или минимакс.
Такая -стратегия - минимаксная, придерживаясь которой сторона В гарантировано, что в любом случае проиграет не больше . Поэтому называют верхней ценой игры.
Если , то число С называют чистой ценой игры или седловой точкой.
Для игры с седловой точкой нахождение решения состоит в выборе пары максиминной и минимаксной стратегий, которые являются оптимальными, так как любое отклонение от этих стратегий приводит к уменьшению выигрыша первого игрока и увеличению проигрыша второго игрока по сравнению с ценой игры С.
Однако не все матрицы имеют седловую точку. Тогда решение находят, применяя смешанные стратегии, то есть чередуя случайным образом несколько чистых стратегий (гибкая тактика).
Вектор, каждая из компонент которого показывает относительную частоту использования игроком соответствующей чистой стратегии, называют смешанной стратегией данного игрока.
Из этого определения следует, что сумма компонент этого вектора равна единице, а сами компоненты не отрицательны.
Обычно смешанную стратегию первого игрока обозначают как вектор
, а второго игрока - как вектор , где . (5.1.1).
Если u° - оптимальная стратегия первого игрока, z° - оптимальная стратегия второго игрока, то число - называют ценой игры.
Для того чтобы число - было ценой игры, а u° и z° — оптимальными стратегиями, необходимо и достаточно выполнение неравенств:
, (5.1.2)
. (5.1.3)
Если один из игроков применяет оптимальную смешанную стратегию, то его выигрыш равен цене игры и вне зависимости от того, с какими частотами будет применять второй игрок стратегии, вошедшие в оптимальную, в том числе и чистые стратегии
Внимание к седловым точкам в теории игр традиционно. Объясняется это недоверием к максимину, как к принципу оптимального выбора в том случае, когда нет седловой точки. Поэтому естественно стремление заполнить промежуток между максимином и минимаксом путем применения смешанных стратегий.
Однако, не следует забывать, что:
1) применение смешанных стратегий рисковано, когда игра не повторяется;
2) если игра повторяется, надо иметь уверенность, что у противника нет информации о конкретных решениях другого игрока;
3) противник не обязан применять смешанные стратегии, равно как и стремиться к цели, противоположной цели другого игрока.
Обозначим смешанную стратегию первого игрока p = {pi},
где pi - вероятность применения i-й стратегии, , . Пусть смешанная стратегия второго игрока , , qj - вероятность применения j-й стратегии, , . Р и Q определяют математическое ожидание платежа: .Теорема фон Неймана. Любая матричная игра имеет седловую точку в смешанных стратегиях.
Доказательство. Множества M и N ограничены и замкнуты, так как
, , а функция W непрерывна по P и Q . W линейна по P при фиксированных Q, следовательно, вогнута по P при фиксированных Q. Аналогично W выпукла по Q при фиксированных P. M и N выпуклы.Действительно, рассмотрим такие
и , что , , тогда , .Складывая, получим
.Кроме того,
.Следовательно, при
итоже смешанная стратегия.
Применяя фундаментальную теорему, получим то, что требуется доказать:
.Опираясь на доказанную теорему, можно быть уверенным, что решение игры в смешанных стратегиях всегда существует (если только вообще их можно применять). В теории игр доказывается теорема, указывающая на эквивалентность решения матричной игры в смешанных стратегиях и двойственной задачи линейного программирования.
Пусть Po и Qo оптимальные смешанные стратегии, v - цена игры, тогда
Из теорема следует, что
(4) |
(5) |
Обозначим
.Поделим (4) на v , получим
.Из этой задачи линейного программирования можно получить оптимальные стратегии первого игрока (оперирующей стороны).
Аналогично, если
, получится задача линейного программирования для получения оптимальных стратегий второго игрока: .В случае, когда между сторонами (участниками) отсутствует «антагонизм» (например, в процессе работы предприятий и торговых посредников), такие ситуации называют «играми с природой».
Здесь первая сторона принимает решение, а вторая сторона — «природа» не оказывает первой стороне сознательного, агрессивного противодействия, но ее реальное поведение неизвестно.
Пусть торговое предприятие имеет т стратегий: и имеется n возможных состояний природы: . Так как природа не является заинтересованной стороной, исход любого сочетания поведения сторон можно оценить выигрышем первой стороны для каждой пары стратегий и . Все показатели игры заданы платежной матрицей .
По платежной матрице можно принять ряд решений. Например, оценить возможные исходы: минимальный выигрыш