В нашем примере, задержка поставок сырья не означает, что точно произойдет срыв программы выпуска продукта А, но есть некоторая вероятность этого события. В БС можно смоделировать эту ситуацию с помощью таблиц вероятности для каждой вершины.
124
Таблица 2.6.1. Таблица вероятностей для вершины «Срыв выпуска продукта А»
Срыв выпуска продукта А
Задержка поставок сырья
Правда
Ложь
Правда
0.8
0,1
Ложь
0,2
0,9
В табл.2.6.1 представлены условные вероятности переменной «Срыв выпуска продукта А» по отношению к переменной «Задержка поставок сырья». Теперь предположим, что предприятие также выпускает продукт Б, производство которого менее зависит от данного вида сырья. Добавим в БС новую вершину «Срыв выпуска продукта Б» и стрелку к ней от вершины «Задержка поставок сырья». Задержка поставок сырья тоже может послужить причиной срыва выпуска продукта Б, но таблица вероятностей уже будет выглядеть по-другому (табл.2.6.2).
Таблица 2.6.2. Таблица вероятностей для вершины «Срыв выпуска продукта Б»
Срыв выпуска продукта Б
Задержка поставки сырья
Правда
Ложь
Правда
0,6
0,5
Ложь
0,4
0,5
Таблица вероятностей для вершины «Задержка поставки сырья» выглядит несколько иначе (табл.2.6.3). Это вершина-корень, у нее нет вершин-родителей.
Таблица 2.6.3. Таблица вероятностей для вершины «Задержка поставки сырья»
Задержка поставки сырья
Вероятность
Правда
0,1
Ложь
0,9
125
Есть несколько способов определения значений вероятностей в любой из таблиц. Например, можно было использовать вероятности, основанные на исторических наблюдениях. Другой способ - использование оценок экспертов. В этом преимущество БС - возможность использования одновременно субъективных вероятностей и вероятностей, основанных на объективных данных.
Анализ БС: введение предположении и прогнозов.
После введения всех вероятностей можно использовать георему Байеса для различных видов анализа. Например, можно рассчитать (безусловную) вероятность того, чю произойдет срыв выпуска продукта А:
р(срыв А) = 0,8*0,1 + 0,1 *0,9 = 0,17.
Это есть предельная вероятность. Подобно, предельная вероятность того, что произойдет срыв выпуска продукта Б: р(срыв Б) = 0,51.
Одно из наиболее важных преимуществ БС - это возможность пересмотра вероятностей событий после получения дополнительной информации. Предположим, что мы точно знаем, что произойдет задержка поставок сырья. В этом случае мы можем ввести предположение, что «задержка поставок сырья» = «правда». По таблице вероятностей мы уже знаем, что вероятность, что произойдет срыв выпуска продукта А, будет 0,8, а того, что произойдет срыв выпуска продукта Б - 0,6.
Теперь предположим, что мы не знаем, произойдет задержка поставок сырья или нет, но точно знаем, что произошел срыв выпуска продукта А. Теперь мы можем определить:
а) новую вероятность того, что произошла задержка поставок сырья;
б) новую вероятность того, что произойдет срыв выпуска продукта Б.
Для расчета (а) используем правило Байеса:
р(Т | А) = р(А I Т)*р(Т) / р(А) = (0,8*0,1) / 0,17 = 0,47.
Таким образом, поступившая информация о том, что произошел срыв выпуска продукта А, значительно увеличила вероятность того, что была задержка
126
поставок сырья (от 0,1 до 0,47). Теперь эту вероятность можно использовать для расчета (б): р(срыв Б) = 0,6*0,47+0,5*0,53 = 0,55.
Информация о срыве выпуска продукта А немного увеличила и вероятность того, что произойдет срыв выпуска продукта Б. Это и есть прогноз, когда мы используем явное предположение для пересчета других вероятностей.
С помощью БС можно выразить зависимости между различными переменными. В общем случае может быть относительно немного прямых зависимостей между отдельными переменными (они будут выражены стрелками на графе), а это означает, что многие неременные будут условно независимыми. В нашем примере «срыв выпуска продукта А» и «срыв выпуска продукта Б» - относительно независимые переменные (нет стрелок между ними).
Существование несвязанных (условно независимых) вершин в сети значительно сокращает объем расчетов, необходимый для определения всех вероятностей в сети. В общем случае, все вероятности могут быть рассчитаны, исходя из совместного распределения вероятностей. А это совместное распределение вероятностей намного проще рассчитать, когда есть условно независимые вершины.
Предположим, что есть сеть, состоящая из пяти вершин (переменных): А, В, С, D, Е. Предположим, что все переменные зависят друг от друга. Правило цепочки позволяет нам рассчитать совместное распределение вероятностей:
p(A,B,C,D,E) = p(A/B,C,D,E)*p(B/C,D,E)*p(C/D,E)*p(D/E)*p(E).
Теперь предположим, что явные зависимости между переменными отражает БС, изображенная на рис.2.6.2:
D pJ С ?( В
Рис.2.6.2. Байесова сеть.
127
Теперь совместное распределение вероятностей можно записать гораздо проще:
p(A,B,C,D,E) = р(А/В) * р(В/С,Е) * p(C/D) * p(D) * р(Е).
Совместное распределение вероятности) в БС
Предположим, что БС содержит п переменных {Аь А2, ..., А,,}. Вершины, оказывающие влияние на вершину А, называют ее родителями. Тогда совместное распределение вероятностей для [Л|, Л:, ..., А„) будет:
п
р(А|, А,, ..., Ап) = П р(А, / родители (А,))
Если БС содержит множество переменных, каждая из которых может принимать более двух значений, то строить прогноз в таком случае становится очень сложно. На самом деле нет универсального эффективного алгоритма для проведения расчетов в таких условиях. До недавнего времени это означало, что БС не пригодны для решения сложных реалистичных проблем. Однако в восьмидесятые годы двадцатого века были открыты прогнозные алгоритмы, которые позволили эффективно использовать многие виды БС. Вместе с появлением программного обеспечения, которое использует эти алгоритмы, стало возможным использовать БС для решения сложных проблем. Это одна из основных причин, почему значительно возрос интерес к применению БС в последние годы. Уже есть подтверждение практической полезности применения БС для решения проблем в области медицинской диагностики, диагностики механических поломок, адаптации интерфейса для компьютерного программного обеспечения.
БС сами по себе позволяют моделировать неопределенные события и анализировать их. Интуитивно понятная визуальная репрезентация может быть очень полезна для прояснения предположений и аргументации разных экспертов. С помощью БС можно явно выразить мнение экспертов по поводу зависимости между отдельными переменными. Однако реальное преимущество БС проявляется, когда мы применяем правило Байеса для построения прогноза
128
влияния явных предположений на вероятности получения неопределенных результатов.
Как ЕС имеют дело с предположениями.
Рассмотрим два типа предположений:
- строгое предположение (приписанное значение) для вершины X - это предположение, что состояние вершины X имеет строго определенное значение (например, точно известно - матч выигран); нестрогое предположение для вершины X — это любое предположение, которое позволяет пересмотреть предыдущее значение вероятности для вершины X (известно, что первая половина матча закончилась со счетом 3:0, это значит, что вероятность того, что матч будет выигран намного выше вероятности других исходов).
Различают три типа связей в ВС.
1. Последовательное соединение. В последовательном соединении любое
предположение, введенное вначале, может быть передано далее при ус
ловии, что нет промежуточной вершины с приписанным значением (ко
торое может блокировать дальнейшую передачу).
2. Разделяющее соединение. Предположение может быть передано между
вершинами-детьми при условии, что вершина-родитель не имеет пред
писанного значения.
3. Объединяющее соединение. Предположение может быть передано
только между двумя родителями, если вершина-ребенок имеет предпо
ложение (строгое или нестрогое).
Правила передачи предположений для последовательных, разделяющих и объединяющих связей достаточны в случае описания полной общей процедуры, с помощью которой можно определить, связаны любые две вершины друг с другом или нет. Это формальное определение d-разделения. Это определение очень важно для понимания того, как на самом деле работает алгоритм вероятностного прогноза в БС.
129
Последовательное соединение. Рассмотрим БС, изображенную на рис.2.6.3:
Срыв программы выпуска продук та Л
Изменение
таможенного законодательства
Рис.2.6.3. Байесова сеть.
Пусть у нас есть предположение, что изменилось таможенное законодательство (А). Тогда это знание увеличивает наши ожидания по поводу того, что произойдет задержка поставок сырья из-за рубежа (В), а это увеличит наши ожидания по поводу того, что произойдет срыв программы выпуска продукта А (С). Таким образом, любое предположение по поводу А будет передано через В к С.
Однако если предположить, что мы знаем действительный статус В, т.е. у нас есть строгое предположение. В этом случае знание по поводу А не повлияет на С, поскольку знание по поводу В перекроет его. Другими словами, предположение по поводу А не может быть передано к С, потому что предположение по поводу В блокирует канал. В общем случае, при последовательном соединении предположение может быть передано от А к С, если В явно не выражено. Формально можно сказать, что А и С d-разделены вершиной В.
Разделяющее соединение.
Рассмотрим БС, изображенную на рис.2.6.4:
А ^
Срыв выпуска поолукта Б
Срыв выпуска поолукта А
— i
Рис.2.6.4. Разъединяющее соединение.
Задержка поставок сыпья
130
Любое предположение по поводу А передается и к В и к С. Более интересен случай, будет ли передано предположение от В к С и наоборот. Предположим, что у нас нет строгого предположения по поводу А (т.е. мы не знаем определенно, будет задержка в поставке сырья или нет). Если у нас есть предположение, что произошел срыв выпуска продукта А, это увеличит наши ожидания по поводу А. А это, в свою очередь, увеличит наши ожидания по поводу С. Другими словами, предположение по поводу В будет передано через А к С.