Раздел 4. Принятие решения в условиях противодействия
Поможем в ✍️ написании учебной работы
Поможем с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой

 

Матричные игры

Раздел "Теории принятия решений" в условиях противодействия называется теорией игр. А так как в основном условия задач в "Теории принятия решений" задаются в виде матриц, то рассматриваемые конфликтные ситуации называются матричными играми. В матричных играх состояниями В1, В2, …, Вn управляет не беспристрастная природа, а активный противник, преследующий сугубо свои цели.

ЛПР, управляющий своими стратегиями (ходами) А1, А2, …, Аn, и его противник, управляющий стратегиями (ходами) В1, В2, …, Вn в данной ситуации называются игроками.

Элементы матрицы аij , заданной в условии, называются выигрышами(платежами) игрока А. А вся матрица называется матрицей платежей.

Далее возможны два случая. Если в матричной игре задана одна платежная матрица, то естественно предположить, что выигрыши первого игрока будут являться проигрышами второго игрока. Такая антагонистическая ситуация называется матричной игрой с нулевой суммой. Цель игры для первого игрока (ЛПР) – побольше выиграть, а для второго игрока – поменьше проиграть. Иными словами, целью игры является определение оптимальной стратегии для каждого игрока – такой стратегии, при которой выигрыш первого игрока будет максимальным, а проигрыш второго игрока будет минимальным.

Однако, такая ситуация бывает не всегда. Зачастую в жизни ваш противник преследует сугубо свои цели, определенные своими выигрышами. В этом случае матричная игра задается двумя платежными матрицами. Или для краткости элементы одной платежной матрицы состоят из двух чисел: (аij, bij). Такая ситуация называется матричной игрой с ненулевой суммой. И для первого и для второго игроков цель игры – побольше выиграть.

Очевидно, что рассмотренная матричная игра предполагает, что каждый игрок делает только по одному ходу. Естественно, что многие конфликтные ситуации предполагают по нескольку ходов каждого игрока. Такие игры рассматриваются пошагово и решаются методами динамического программирования. На каждом отдельном шаге такая игра рассматривается как игра с одним ходом.

Матричные игры для двух игроков с нулевой и ненулевой суммой достаточно хорошо изучены и для них разработана теория оптимального поведения игроков.

Однако в жизненной практике в конфликтных ситуациях зачастую участвуют более чем две стороны. Чем больше игроков – тем больше проблем. Такие игры менее изучены и здесь есть просторное поле для новых фундаментальных научных исследований.

Несмотря на несколько легкомысленное звучание основных терминов, теория игр является строго научной дисциплиной с точными математическими выкладками.

На протяжении всего своего исторического пути развития человечество ежедневно сталкивается с конфликтными ситуациями: политическими, военными, экономическими, социальными и прочими, которые проявляются как в глобальных, так и в малых (вплоть до личных) формах. И если бы Человеку хватило бы ума в конфликтных ситуациях пользоваться не силой, не надеждой на "авось", а математикой, то жизнь наверняка была бы другой. Будем надеяться, что новое поколение, усвоив курс "Исследование операций" J, изменит жизнь к лучшему!

Итак, рассмотрим игру, в которой ЛПР противостоит "думающий" противник.

Возможны такие случаи:

1) Ходы игроками делаются одновременно.

2) Первым ходит игрок 2 – противник, но игрок 1 – ЛПР, не имеет информации о ходе противника.

3) Первым ходит игрок 2 – противник, но игрок 1 – ЛПР, знает о ходе противника.

4) Первым ходит игрок 1, но игрок 2 не имеет информации о ходе противника.

5) Первым ходит игрок 1, но игрок 2 знает о ходе противника.

Очевидно, что случаи 1), 2) и 4) идентичны – никто из игроков не знает о ходе противника ничего.

Рассмотрим случай 3). Так как ЛПР имеет полную информацию о ходе противника, то мы имеем ситуацию принятия решения в условиях полной определенности. Как уже отмечалось выше, такими задачами занимается математическое программирование.

Рассмотрим случай 5). Так как ЛПР ходит первым, то его противник наверняка выберет самую худшую для ЛПР стратегию. Поэтому в такой ситуации ЛПР необходимо принимать решение о своем ходе согласно принципу наибольшей осторожности, т.е. согласно принципу максимина. Это утверждение однозначно, легко математически доказывается и не должно подвергаться сомнению ни в каких жизненных ситуациях.

Итак, содержательны по своей сути только случаи 1), 2) и 4), которые сводятся к одному случаю. Это как мы видим, принятие решения в условиях неопределенности.

 

Дата: 2019-07-31, просмотров: 162.