Оптимальное решение игры двух лиц с нулевой суммой
Поможем в ✍️ написании учебной работы
Поможем с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой

Поскольку игры берут свое начало в конфликте интересов, оптимальным решением игры является одна или несколько таких стратегий для каждого из игроков, при этом любое отклонение от данных стратегий не улучшает плату тому или другому игроку. Эти решения могут быть в виде единственной чистой стратегии или нескольких стратегий, которые являются смешанными в соответствии с заданными вероятностями. Рассматриваемые ниже примеры демонстрируют перечисленные случаи.

Пример 3.6-1

Две компании А и В продают два вида лекарств против гриппа; Компания А рекламирует продукцию на радио (A1), телевидении (А2) и в газетах (А3) – Компания В, в дополнение к использованию радио (B1), телевидения (В2) и газет (В3), рассылает также по почте брошюры (B4). В зависимости от умения и интенсивности проведения рекламной кампании, каждая из компаний может привлечь на свою сторону часть клиентов конкурирующей компании. Приведенная ниже матрица характеризует процент клиентов, привлеченных или потерянных компанией А.

 

  B1 B2 B3 B4 Минимумы строк
A1 –2 –3 –3
A2 5← Максимин
A3 –2 –9 –9
Максимумы столбцов  
Минимакс    

 

Решение игры основано на обеспечении наилучшего результата из наихудших для каждого игрока. Если компания А выбирает стратегию А1, то, независимо от того, что предпринимает компания В, наихудшим результатом является потеря компанией А 3%рынка в пользу компании В. Это определяется минимумом элементов первой строки матрицы платежей. Аналогично при выборе стратегии А2 наихудшим исходом для компании А является увеличение рынка на 5% за cчет компании В. Наконец, наихудшим исходом при выборе стратегии А3является потеря компанией А 9%рынка в пользу компании В. Эти результаты содержатся в столбце "Минимумы строк". Чтобы достичь наилучшего результата из наихудших, компания А выбирает стратегию А2, так как она соответствует наибольшему элементу столбца "Минимумы строк".

Рассмотрим теперь стратегии компании В. Так как элементы матрицы являются платежами компании А, критерий наилучшего результата из наихудших для компании В соответствует выбору минимаксного значения. В результате приходим к выводу, что выбором компании В является стратегия В2.

Оптимальным решением игры является выбор стратегий А2 и В2, т.е. обеим компаниям следует проводить рекламу на телевидении. При этом выигрыш будет в пользу компании А, так как ее рынок увеличится на 5%. В этом случае говорят, что цена игрыравна 5% и что компании А и В используют стратегии, соответствующие седловой точке.

Решение, соответствующее седловой точке, гарантирует, что ни одной компании нет смысла пытаться выбрать другую стратегию. Действительно, если компания В переходит к другой стратегий (Bl, B3 или В4), то компания А может сохранить свой выбор стратегии А2, что приведет к большей потере рынка компанией В (6% или 8%). По тем же причинам компании А нет резона использовать другую стратегию, ибо если она применит, например, стратегию А3, то компания В может использовать свою стратегию В3 и увеличить свой рынок на 9%. Аналогичные выводы имеют место, если компания А будет использовать стратегию А1.

Оптимальное решение игры, соответствующее седловой точке, не обязательными должно характеризоваться чистыми стратегиями. Вместо этого оптимальное решение может требовать смешивания случайным образом двух или более стратегий, как это сделано в следующем примере.

Пример 3.6-2

Два игрока А и В играют в игру, основанную на подбрасывании монеты. Игроки одновременно и независимо друг от друга выбирают герб (Г) или решку (Р). Если результаты двух подбрасываний монеты совпадают (т.е. ГГ или РР),то игрок А получает один доллар от игрока В. Иначе игрок А платит один доллар игроку В.

Следующая матрица платежей игроку А показывает величины минимальных элементов строк и максимальных элементов столбцов, соответствующих стратегиям обоих игроков.

Максиминная и минимаксная величины (цены) для этой игры равны – 1 доллар и 1 доллар соответственно. Так как эти величины не равны между собой, игра не имеет решения в чистых стратегиях; В частности, если игрок А использует стратегию АГ, игрок В выберет стратегию ВР, чтобы получить от игрока А один доллар. Если это случится, игрок А может перейти к стратегии АР, чтобы изменить исход игры и получить один доллар от игрока В. Постоянное искушение каждого игрока перейти к другой стратегии указывает на то, что решение в виде чистой стратегии неприемлемо. Вместо этого оба игрока должны использовать надлежащую случайную комбинацию своих стратегий. В рассматриваемом примере оптимальное значение цены игры находится где-то между максиминной и минимаксной ценами для этой игры:

 

максиминная (нижняя) цена ≤ цена игры ≤ минимаксная (верхняя) цена.

 

Следовательно, в данном случае цена игры должна лежать в интервале [–1,1], измеряемом в долларах.

Упражнения 3.6,а

1. Определите решение, определяемое седловой точкой, соответствующие чистые стратегии и цену игры для следующих игр, в которых платежи заданы для игрока А.

а)

 

  B1 B2 B3 B4
A1
A2
A3

 

b)

  B1 B2 B3 B4
A1 –4 –5
A2 –3 –4 –9 –2
A3 –8 –9
A4 –9

 

2. В следующих играх заданы платежи игроку А. Укажите область значений для параметров р и q, при которых пара (2, 2) будет седловой точкой в каждой игре.

а)

 

  B1 B2 B3
A1 q
A2 p
A3

b)

 

  B1 B2 B3
A1
A2 q
A3 p

 

3. Укажите область, которой принадлежит цена игры в каждом из следующих случаев, предполагая, что платежи заданы для игрока A.

а)

 

  B1 B2 B3 B4
A1
A2
A3 –5 –2 –3
A4 –2 –5

b)

 

  B1 B2 B3 B4
A1 –1
A2 –2
A3
A4 –2

 

c)

 

  B1 B2 B3
A1
A2
A3 –5

d)

 

  B1 B2 B3 B4
A1
A2 –6
A3 –9 –2

 

4. Две фирмы производят два конкурирующих товара. Каждый товар в настоящее время контролирует 50% рынка. Улучшив качество товаров, обе фирмы собираются развернуть рекламные кампании. Если они не будут этого делать, то существующее состояние рынка не изменится. Однако если какая-либо фирма будет более активно рекламировать свои товары, то другая фирма потеряет соответствующий процент своих потребителей. Исследование рынка показывает, что 50% потенциальных потребителей получают информацию посредством телевидения 30% – через газеты и 20% – посредством радио.

а) Сформулируйте задачу в виде игры двух лиц с нулевой суммой и выберите подходящие средства рекламы для каждой фирмы.

b) Укажите интервал значений, которому принадлежит цена игры. Может ли каждая фирма действовать с единственной чистой стратегией?

 

5. Пусть aij – (i, j)-й элемент платежной матрицы с m стратегиями игрока A и n стратегиями игрока В. Элементы платежной матрицы представляют собой платежи игроку А. Докажите, что

 

.

 

Дата: 2016-10-02, просмотров: 251.