Матричные игры, разрешимые в смешанных стратегиях
Поможем в ✍️ написании учебной работы
Поможем с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой

Постановка задачи

Если платежная матрица не имеет седловой точки, то  . А значит  . Такая игра в чистых стратегиях не разрешима. Первый игрок в таком случае будет стремиться увеличить свой выигрыш, а второй – уменьшить свой проигрыш. Поиск такого решения приводит к применению сложной стратегии, состоящей в случайном применении двух и более чистых стратегий с определенными вероятностями:

PA = (p1, p2, …, pm) где pi – это вероятности применения чистых стратегий игроком А;

QB = (q1, q2, …, qn) где qj – это вероятности применения чистых стратегий игроком B;

при этом  и  .

Такие наборы вероятностей применения чистых стратегий игроками А и В называются смешанными стратегиями.

Заметим, что чистые стратегии – это частный случай смешанных стратегий. Например, чистая стратегия первого игрока – это смешанная стратегия, у которой все вероятности pi = 0 , кроме соответствующего номера k чистой стратегии: pk = 1 .

Основная теорема теории игр (Теорема фон-Неймана): любая конечная игра двух лиц с нулевой суммой разрешима в смешанных стратегиях.

Как же искать смешанные стратегии? Их можно найти точно – алгебраическим способом (в частности, с помощью симплекс-метода) или графическим способом (для игры размерности 2 х n или m х 2 ).

Для того чтобы точно найти решение матричной игры в смешанных стратегиях, нужно представить заданную матричную игру в виде задачи линейного программирования и решить её симплекс-методом.

Рассмотрим матричную игру, не разрешимую в чистых стратегиях, в общем виде:

Заметим, что в матричной игре, разрешимой в чистых стратегиях, элементы платежной матрицы могут быть как положительными, так и отрицательными. Для симплекс-метода, которым будем решать игру, не разрешимую в чистых стратегиях, необходимо, чтобы элементы платежной матрицы были неотрицательными. Для этого, если в платежной матрице будут отрицательные элементы, нужно ко всем элементам платежной матрицы прибавить достаточно большое число с . При этом решение задачи не изменится, а цена игры увеличится на с.#

PA = (p1, p2, …, pm)– это оптимальная смешанная стратегия первого игрока. Её применение гарантирует первому игроку выигрыш не меньший, чем цена игры n . Если при этом второй игрок выберет стратегию В1, математически все вышесказанное будет иметь вид:

 

а11р1 + а21р2 + … + am1pm ≥ n

 

Таких неравенств будет столько, сколько есть возможных альтернатив у второго игрока, т.е. столбцов платежной матрицы – n штук:

 

а11р1 + а21р2 + … + am1pm ≥ n

а12р1 + а22р2 + … + am2pm ≥ n

а1nр1 + а2nр2 + … + amnpm ≥ n


Разделив все неравенства на n , получим (в общем виде):

 

а1j  + а2j  + … + amj  ≥ 1

 

Обозначим:  = xi, . С помощью таких новых переменных вышеуказанные неравенства запишутся в виде:

 

а11 x1 + а21 x2 + … + am1 xm ≥ 1

а12 x1 + а22 x2 + … + am2 xm ≥ 1

а1n x1 + а2n x2 + … + amn xm ≥ 1

 

Просуммируем новые переменные:

 

 = x1 + x2 + … + xm =  +  + … +  =  =

 

PA = (p1, p2, …, pm)– это оптимальная смешанная стратегия первого игрока. То есть нужно так подобрать (p1, p2, …, pm) , чтобы n была как можно большей. Или же, что то же самое, чтобы  была как можно меньшей.

Таким образом, используя новые переменные и учитывая всё вышесказанное, исходную матричную игру можно представить в виде задачи линейного программирования:

найти вектор переменных Х = {x1, x2, … , xm}, такой что:

целевая функция f =  min

при множестве ограничений:

 


АТХ ≥ Е

 

гдеА – матрица коэффициентов (платежная матрица), заданная в условии;

Е – единичный вектор

Х – вектор неизвестных переменных, такой что xi =  ;

n – это цена игры:n =  =  ;

рi – это коэффициенты вектора смешанной стратегии первого игрока.

 



Дата: 2019-07-31, просмотров: 204.