Если принятое решение провести трассу не будет удовлетворять нужды жителей микрорайона, то транспортное предприятие понесет потери. Потери будут максимальными при ошибочном решении проложить трассу к пункту А3 вместо А1 или наоборот.
Решение. Функция L(Q, а) потерь характеризуется матрицей (табл. 8.1).
Таблица 8.1
Преобразуем стратегическую игру (W, A, L) в статистическую (W, D, R) при учете информации о действительном состоянии природы. Для этого проводится выборочный опрос жителей микрорайона. Результаты этого опроса образуют вектор
где x1, х2, х3, - доля от общего числа опрошенных (не менее 50 %), которые предлагают строительство трассы до пунктов А1, А2, A3 соответственно;
x4 — любое из трех направлений не получило решающего количества голосов.
Действительные данные результата опроса показали следующие вероятности рекомендаций жителей (табл. 8.2) в зависимости от состояний природы Q.
Таблица 8.2
В результате опроса получаем условные вероятности P(x1|Q1) = P(x2|Q2) = P(x3|Q3) = 0,7. Пусть d(x) = а - нерандомизированная функция решения, преобразующая множество Х результатов эксперимента в множество решений. Множество D нерандомизированных решений при наличии четырех результатов эксперимента и трех возможных решений будет иметь 34 = 81 различную функцию решений статистика в статистической игре с природой (W, D, R}. Из них мы ограничимся шестью допустимыми функциями: d1, d2, ... , d6 (табл. 8.3).
Таблица 8.3
Какие же решения не вошли в допустимые? Недопустимые функции решения — это все функции dÎD, которые не ставят в соответствие хотя бы одному из результатов x1, x2, x3 решение а1, а2, a3 потому, что для этих функции значение риска R(Q, d) будет всюду большим по сравнению с другими функциями решений. Результат х4 при этом во внимание не принимается, поскольку он не отражает конструктивного предложения.
Учтем полученные условные вероятности и, зная значения функций потерь, вычислим математические ожидания функций потерь, т. е. получим функции риска для допустимых функций решений:
Из табл. 8.3 видно, что вне зависимости от х1, х2 х3, х4 решение d4 будет соответствовать решению а1, d5®a2, d6®a3.
Объединим все полученные решения в табл. 8.4 и выпишем минимальные значения функции риска по строке и максимальные значения - по столбцу.
Таблица 8.4
Таким образом, как показывает табл. 8.4, среди нерандомизированных функций решений нет минимаксной функции: v1=0<v2=1,75. Следовательно, минимаксную функцию решения надо искать во множестве D* рандомизированных функций d.
В данной статистической игре (W, D, R) в качестве оптимальной нужно принять минимаксную функцию решения.
Для того чтобы найти рандомизированную минимаксную функцию решения d0, следует обратиться к линейному программированию (см. приложение).
Пусть d - распределение вероятностей на множестве нерандомизированных функций решения d. Обозначим это распределение h1 = P(d1), h2 = P(d2), ... , h6 = P(d6). Теперь обозначим через u цену расширенной статистической игры (W, D*, R) при рандомизации функций решений и запишем в терминах линейного программирования задачу статистика, который решает ее в интересах транспортного предприятия.
Для этого воспользуемся данными табл. 8.4:
Преобразуем переменные, разделив h на цену игры u> 0, и введем дополнительные переменные q7, q8, q9. В результате перейдем от неравенств к равенствам:
при qj> 0, j =
.Решим эту задачу линейного программирования симплексным методом (техника решения известна и здесь не излагается) и получим базисное оптимальное решение:
q1 = q3 = 2/7; q2 = q4 = q5 = qб = 0.
Значит, Zmax = q1 + q3 = 2/7 +2/7 = 4/7.
Отсюда u = l/Zmax = 2/7 = 1,75.
Перейдем к исходным переменным hi = qi u; i =
, где hi - вероятности, с которыми следует сочетать соответствующие нерандомизированные функции решения di (i = ). После перемножения получим рандомизированные функции d:Итак, получена минимаксная рандомизированная функция решения d0 с распределением вероятностей: P(d1) = 1/2; P(d3) = 1/2. Как ее охарактеризовать? Это смешанная стратегия d0 с одинаковыми вероятностями чистых функций решения d1 и d3. Они различаются только результатом статистического эксперимента.
Вывод. В задаче выбора транспортным предприятием наилучшей трассы маршрута новой автобусной линии получена оптимальная минимаксная функция решения:
• если по эксперименту с анкетами получен результат х1, или x2, или x3, то следует принять решение а1 или а2, или a3 соответственно;
• если получен результат х4, то нужно использовать механизм случайного выбора между решениями а1 (трассу вести до А1) и a3 (трассу вести до А3) с одинаковыми вероятностями, равными 0,5. Следует сделать одно важное замечание: в данном случае мы из расчетов получили одинаковые вероятности. (Это решение не имеет ничего общего с принципом равновероятности, который иногда необоснованно применяется при отсутствии информации о возможных вероятностях событии.)
8.2. ПРИНЯТИЕ РЕШЕНИЙ В СЕЛЬСКОМ ХОЗЯЙСТВЕ
Задача 8.2. Планирование участков земли под картофель, проводимое методом Байеса. При наличии больших массивов земли в хозяйстве можно сознательно выбирать наиболее выгодные для урожая участки с учетом их влажности.
В период вегетации требуется определенное количество влаги. Если влажность будет излишняя, то часть посадочного материала начнет гнить, урожай будет плохим.
Картофель в средней полосе сажают обычно в апреле. В это время трудно предвидеть, каким будет лето - сухим или влажным. Фактически создается ситуация, которую можно считать игрой с природой. Мы должны принять решение, на каких участках сажать картофель: на сухих или на тех, которые сами по себе являются влажными.
Введем условные обозначения:
W = {Q1, Q2} - множество состояний природы;
Q1 - осадки выше нормы;
Q2 – сухое лето (осадки не выше нормы);
А = {а1, a2} - множество решений статистика;
а1 - посадку производить на участках с большой влажностью почвы;
a2 - посадку производить на сухих участках, так как ожидается влажное лето.
Известны средние урожаи в зависимости от принятого решения и состояния природы. При этом наименьшие урожаи бывают, если осадки выше нормы (Q1), и принимается решение а1 -сажать картофель на влажных участках.
Наибольшие урожаи в среднем бывают при решении а2 -сажать картофель на сухих участках и при состояниях природы Q1 - влажное лето.
Прибыль на 1 га в тыс. руб. в среднем известна по многолетним результатам (табл. 8.5).
Таблица 8.5
Итак, мы получили значения прибыли, а нас интересуют потери.
Решение. Представим функцию потерь L(Q, a) в виде разности между наибольшей прибылью и прибылью, которая может быть получена во всех остальных случаях (табл. 8.6).
Статистик должен получить дополнительную информацию о состояниях природы при наблюдениях погоды в апреле, когда проводится посадка.
Таблица 8.6
Пусть X = {x1, x2} - множество наблюдений, где х1 и х2 - наблюдается большое и малое количество осадков соответственно.
В зависимости от состояния природы Qj и наблюдения погоды хi получим следующие значения условных распределений:
По двум решениям статистика а1 и а2 и результатам наблюдения получаем четыре нерандомизированные функции решения d Î D (табл. 8.7).
Таблица 8.7