Из этого следует, что от увеличения всех элементов матрицы A =
Для определения среднего оптимального выигрыша игрока 1, соответствующего первоначальной платежной матрице, необходимо из найденной цены игры вычесть величину а.
Рассмотрим теперь пару двойственных задач линейного программирования с матрицей условий A =
где Х- вектор искомых переменных задачи (П1). То же в скалярной форме:
Двойственная задача к задаче линейного программирования (П1) может быть записана следующим образом:
где Y - вектор искомых переменных задачи (П2).
То же в скалярной форме:
Все элементы матрицы А по предположению положительны, поэтому многогранные множества задач (П1) и (П2) ограничены. Многогранник задачи (П1) не пуст, так как Х = 0 является допустимым планом. Следовательно, задача (П1), а с ней (по первой теореме двойственности) и задача (П2) разрешимы, и их функционалы в оптимальных планах совпадают (вторая теорема двойственности):
(С, X*) = (У* В).
С учетом выбранных единичных векторов С и В получаем следующее соотношение:
Из условия YA ³ С следует, что Y*¹ 0, поэтому
Положительность значения v обеспечивается положительностью всех значений элементов платежной матрицы А.
Обозначим U* = vY*, W* = vX*. Поскольку v, X*, Y* неотрицательны, то U* ³ 0, W* ³ 0.
Кроме того,
или
Умножим обе части неравенства (ПЗ) слева на произвольный w-мерный вектор U ³ 0, для которого справедливо
где В - единичный вектор.
Получим:
UAM* ³ v(U,B) = v,
т.е. имеет место неравенство
UAM* ³ v. (П5)
Также умножим обе части неравенства (П4) справа на произвольный n-мерный вектор W > 0 , для которого справедливо
где С - единичный вектор.
Получим:
U*AM ³ v(C,W) = v,
т.е. справедливо неравенство
U*AM ³ v. (П6)
Сравнивая неравенства (П5) и (П6), приходим к соотношению
UAW* £ v £ U*AW,
т.е. U* и W* - оптимальные стратегии, а v - цена игры с платежной матрицей А, что и требовалось доказать.
Следствие (С1). В процессе доказательства основной теоремы теории игр с платежной матрицей A =
Составляющие оптимальных стратегий
Цена игры
Следствие (С2). Вместо приведенной выше пары двойственных задач линейного программирования (П7) иногда удобнее рассматривать другую пару задач, имеющих более ясный содержательный экономический смысл:
1. Прямая задача. Игрок 1 стремится увеличить цену игры:
v ® mах (П8)
при условиях:
т. е. игрок 1 действует так, чтобы его средний выигрыш при использовании его стратегий с частотами ui для любой j-й стратегии игрока 2 был не меньше величины v, которую он стремится увеличить;
т. е. сумма частот применения стратегий игрока 1 равна единице.
2. Двойственная задача. Игрок 2 стремится уменьшить свой проигрыш:
v ® min (П9)
при условиях:
т. е. игрок 2 действует так, чтобы его средний проигрыш при использовании его стратегий с частотами wj для любой i-й стратегии игрока 1 не превышал величины v, которую он стремится уменьшить;
т. е. сумма частот применения стратегий игрока 2 равна единице.
В такой постановке каждая из задач (П8) и (П9) содержит на одно переменное (v) и на одно ограничение (
Пример решения задачи. Решить аналитически (используя мажорирование) игру с платежной матрицей
Решение. Если для первых двух строк матрицы взять весовые коэффициенты соответственно 0,25 и 0,75, то получим:
0,25 * 24 + 0,75 * 0 + 6 > 4;
0,25 * 0 + 0,75 * 8 = 6 > 4.
В итоге третья строка матрицы мажорируется выпуклой линейной комбинацией первой и второй строк, поэтому третья строка вычеркивается, а матрица преобразуется к следующему виду:
В матрице есть два нуля. Для того чтобы все элементы матрицы стали больше нуля, прибавим к каждому элементу по единице. Матрица примет вид:
Далее ставим и решаем пару задач (двойственных) линейного программирования:
Для первой задачи (игрока 2) из условия угловой точки следует:
25x1 + x2 = 1;
х1 + 9x2 = 1,
откуда получаем оптимальное решение:
Находим оптимальные смешанные стратегии игрока 2:
Для второй задачи (игрока 1) из условия угловой точки следует:
25y1 + y2 = 1;
y1 + 9 y2 = 1,
откуда оптимальное решение равно:
Оптимальными смешанными стратегиями игрока 1 будут:
Цена игры рассчитывается с учетом ее поправки на единицу:
v = 1:0,1427-1=6,008.
Ознакомившись теперь с основной теоремой теории игр, методом их сведения к паре двойственных задач линейного программирования, мы видим, что, если в исходной матрице игры А в силу любых причин не произведены все возможные мажорирования строк и столбцов, это не скажется на результатах решения игры, но задачи линейного программирования получатся большей размерности, чем потенциально они могли быть. Соответственно в составе оптимальных смешанных стратегий игроков окажутся неактивные чистые стратегии.