1. Основные понятия теории игр. Классификация игр
2. Игры с противником: формальное представление, выбор оптимальной стратегии
3. Игры с «неживой» природой
7.1 Основные понятия теории игр. Классификация игр
Предметом теории игр являются такие ситуации, в которых важную роль играют конфликты и совместные действия.
Конфликт может возникнуть в результате различия целей которые отражают не только несовпадающие интересы разных сторон, но и многочисленные интересы одного и того же лица. Например, ЛПР, формирующее экономическую политику фирмы, обычно преследует разнообразные цели, выдвигая противоречивые требования, предъявляемые к ситуации (рост объемов производства, повышение доходов, снижение экологической нагрузки и т. п.). Конфликт также может быть результатом действия тех или иных «стихийных сил», то есть внешнего окружения. Поэтому математическая модель, адекватно отражающая: любое социально-экономическое явление, должна отражать присущие ему черты конфликта, то есть описывать:
- множество заинтересованных сторон; в теории игр они называются игроками;
- возможные действия каждой из сторон, которые называются стратегиями, или ходами;
- интересы сторон, представляемые функциями выигрыши платежной матрицей
В теории игр предполагается, что функции выигрыша и множество стратегий, доступных каждому из игроков, общеизвестны то есть каждый игрок знает свою функцию выигрыша и набор I имеющихся в его распоряжении стратегий, а также функции выигрыша и стратегии остальных игроков, и в соответствии с : информацией организовывает свое поведение.
Различные виды игр можно классифицировать по различным признакам. К ним относятся:
- число игроков;
- число стратегий;
- свойства функции выигрыша;
- возможность предварительных переговоров и взаимодействия между игроками в ходе игры.
В зависимости от числа игроков различают игры с двумя, тремя и более участниками. В принципе возможны также игры с бесконечным числом игроков. По количеству стратегий различают конечные и бесконечные игры. В конечных играх игроки располагают конечным числом возможных стратегий (например, игра «орел — решка»). Сами стратегии в конечных играх часто называют чистыми стратегиями. Соответственно, в бесконечных играх игроки имеют бесконечное число возможных стратегий (например, в ситуации продавец-покупатель при установлении цены на товар и его количества).
По свойствам функции выигрыша различают:
- антагонистические игры, или игры с нулевой суммой; в данном случае выигрыш одного игрока равен проигрышу другого, то есть налицо прямой конфликт между игроками;
- игры с постоянной разностью, в которых игроки и выигрывают, и проигрывают одновременно, так что им выгодно действовать сообща;
- игры с ненулевыми суммами, где имеются и конфликты, и согласованные действия.
В зависимости от возможности предварительных переговоров между игроками различают кооперативные и некооперативные игры. Игра называется кооперативной, если до начала игры игроки образуют коалиции и принимают взаимообязывающие соглашения о своих стратегиях. Игра, в которой игроки не могут координировать свои стратегии, называются некооперативной. Очевидно, что все антагонистические игры могут служить примером некооперативных игр. Примером кооперативной игры может служить ситуация образования коалиций в парламенте для принятия решения путем голосования.
2.Игры с противником: формальное представление, выбор оптимальной стратегии
Любая игра задается функцией выигрыша, или платежной матрицей, которая в играх партнеров имеет следующий вид:
где i — стратегии строчного игрока;
j — стратегии столбцевого игрока;
aij — платежи столбцевого игрока при выборе им j-той стратегии строчному, если последний выбирает i-тую стратегию.
Если а,} > О, то столбцевой игрок платит строчному; если аij < о то строчный игрок платит столбцевому; если аij = О, никто никому не платит.
В качестве основного допущения в теории игр предполагается, что каждый игрок стремится обеспечить себе максимально возможный выигрыш при любых действиях партнера. Пусть имеется конечная антагонистическая игра с матрицей выигрышей строчного и столбцевого игроков. Строчный игрок считает, что какую бы стратегию он ни выбрал, столбцевой игрок выберет стратегию, максимизирующую свой выигрыш и тем самым минимизирующую выигрыш первого игрока. Поэтому для выбора оптимальной стратегии строчный игрок сначала в каждой выбирает минимальный элемент:
Затем, среди полученного столбца значений выбирав большее значение а, то есть
а считается нижней ценой игры, а стратегия, которую строчный игрок, — максиминной стратегией.
Аналогично, столбцевой игрок сначала в каждом столбце, выбирает наибольшее число
и оптимальной стратегией считает
βсчитается верхней ценой игры, стратегия, которую выбрал столбцевой игрок, называется минимаксной и, следовательно, а>β
Если а = β, то игра называется игрой с седловой точкой. Элемент, для которого выполняется условие аij = а = β, называется седловым элементом. Не всякая игра имеет седловую точку, но если она имеется, то стратегии игроков определяются однозначно.
3. Игры с «неживой» природой
Пусть в матрице игры строки означают возможные варианты решений, принимаемых игроком (им могут быть менеджер-руководитель и т. п.), столбцы — возможные состояния природы (Т. е. хозяйственной среды). Элемент матрицы аij, означает сумму платежа в ситуации, когда игрок принимает решение i , то есть выбирает стратегию iпри состоянии природы j. В этом случае платежная матрица игры будет иметь вид:
Стратегия игрока | Состояния природы | |||||
П1 | П2 | … | Пj | … | Пn | |
А1 | A11 | A12 | … | A1j | … | A1n |
А2 | A21 | A22 | … | A2j | … | A2n |
… | … | … | … | … | … | … |
Аi | Ai1 | Ai2 | … | Aij | … | Ain |
... | … | … | … | … | … | … |
Аm | Am1 | Am2 | … | Amj | … | Amn |
Введем число, которое характеризовало бы не только выигрыши игроков, но и удачность выбора стратегии.
Риском rij игрока при пользовании стратегией Аj, в условиях Пjназывается разность между выигрышем, который он может получить, зная условия Пj, и выигрышем, который он получает, не зная их и выбирая стратегию Аj:
Рассмотрим основные критерии, применяемые для выбора оптимального управленческого решения.
Критерий Байеса. Если имеется некоторая статистическая Неопределенность, то есть известны вероятности р1’, р2’ р3’..., рn наступления состояний природы П1’П2’ П3’..., Пп’, то оптимальной считается стратегия для которой:
а) максимально среднее значение выигрыша по строке
б) минимально среднее значение риска по строке
Критерий Лапласа. Если вероятности неизвестны, то можно считать все состояния природы равновероятными, то есть рj=1/п. В этом случае критерий Байеса преобразуется в критерий Лапласа, который определяется по формуле
Применение этого критерия целесообразно в тех случаях, да велики различия между отдельными состояниями природы, т. е. велика дисперсия значений а... Это очень удобный критерий, но его недостаток заключается в том, что теряется структура игры.
Критерий Вальда. Данный критерий иногда называют критерием крайнего пессимизма, так как оптимальную страте выбирают по нижней цене игры
Достоинством критерия Вальда, как отмечают Льюис и Раис является то, что он предельно консервативен, то есть его применяют в той ситуации, в которой нерезонно рисковать.
Критерий Сэвиджа работает только с матрицей риска называется критерием крайнего пессимизма по риску, так как пытается минимизировать «упущенную выгоду». Оптимальная стратегия выбирается исходя из следующей зависимости:
Данный критерий был разработан в 1951 году и часто используется для выбора долгосрочных стратегических решений, которые должны быть минимально рисковыми.
Критерий Гурвица предлагает компромиссное правило выбора наиболее предпочтительного варианта. Оптимальная стратег определяется по формуле
Число К задается исследователем, изменяется от 0 до 1 и называется параметром оптимизма. Применение этого критерия осложняется, когда нет обоснованного представления о величине параметра К.
Можно отметить, что критерий Вальда является частным случаем критерия Гурвица, если К = 0. Если К = 1, то мы имеем дело с крайне оптимистической точкой зрения, которая называется максимаксной стратегией. Недостатком критерия Гурвица (кроме того, что /с трудно определимый, субъективный параметр) является то, что он охватывает не всю структуру игры целиком, а только одну или два ее элемента, остальная же информация не используется.