Игры с природой. Критерий Вальда. Критерий минимального риска Севиджа
Поможем в ✍️ написании учебной работы
Поможем с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой

Игры с природой. Критерий Вальда. Критерий минимального риска Севиджа.

Критерий Сэвиджа. Суть его заключается в выборе стратегии, не допускающей слишком высоких потерь. Для этого используется матрица рисков, элементы которой отражают убытки, которые понесет игрок в том случае, если для каждого состояния природы не будет выбрано наилучшей стратегии.

Элементы этой матрицы находятся по формуле: rij = maxi aij – aij, где maxi aij – максимальный элемент в столбце исходной матрицы.

Оптимальная стратегия определяется выражением mini(maxj rij).

Критерий Вальда. Стратегия выбирается из условия maxi(minj aij) и совпадает с нижней ценой игры. Игрок исходит из предположения о том, что природа будет действовать наихудшим для него образом, поэтому данный критерий считается пессимистическим.

Игры с природой. Критерий Гурвица.

λ - коэффициент пессимизма-оптимизма

0 ≤ λ ≤ 1

Пример:

|3 2 1|

|4 6 8| λ=0,5

|9 1 4|

1)Находим MAX и MIN в каждой строке;

МАХ  MIN

3     1

8          4

9          1

Е1 = 1*0,5+3(1-0,5)=2

Е2 = 4*0,5+8(1-0,5)=6 - оптимальное

Е3 = 1*0,5+9(1-05)=5

 

Биматричные игровые задачи.

В этих играх интересы игроков разные, они не совпадают, но не обязательно противоположные.

Принимают участие два игрока, каждый из которых имеет конечное число стратегий. Такие игры можно описать с помощью двух матриц, поэтому они называются биматричными.

Пример:

Рассмотрим следующую ситуацию. Студент (игрок А) готовится к зачету, который принимает преподаватель (игрок В). Можно счи­тать, что у студента две стратегии – подготовиться к сдаче зачета (+) и не подготовиться (–). У преподавателя также две стратегии — поставить зачет [+] и не поставить зачета [–]. В основу значений функций выигрыша игроков положим следующие соображения:

Выигрыш студента Выигрыш преподавателя

(+) [+] Оценка заслужена [–] Очень обидно   (+) [+] Все нормально [–] Был неправ
(–) Удалось обмануть Оценка заслужена   (–) Дал себя обмануть Опять придет

 

Количественно это можно выразить, например, так

  [+] [–] [+] [–]
(+) (–) 2 –1 (+) 1 0 (–) 1 –3 –2 –1

 

 

Биматричные игры: оптимальность по Нэшу и по Парето.

Равновесие Нэша - так в теории игр называется тип решений игры двух и более игроков, в котором ни один участник не может увеличить выигрыш, изменив своё решение в одностороннем порядке, когда другие участники не меняют решения. Такая совокупность стратегий выбранных участниками и их выигрыши называются равновесием Нэша. Игра может иметь равновесие Нэша в чистых стратегиях или в смешанных (то есть при выборе чистой стратегии стохастически с фиксированной частотой). Нэш доказал, что если разрешить смешанные стратегии, тогда в каждой игре n игроков будет хотя бы одно равновесие Нэша.

Оптимальность по Парето— такое состояние системы, при котором значение каждого частного критерия, описывающего состояние системы, не может быть улучшено без ухудшения положения других элементов.

Приведенное выше определение можно формализовать следующим утверждением: состояние экономики S* считается лучшим по Парето, чем другое состояние S1, если хотя бы один экономический субъект предпочитает S*, а все остальные по меньшей мере не делают различий между этими состояниями, но в то же время нет таких, кто предпочитает S1 состоянию S*. Состояние экономики S* безразлично по Парето относительно состояния S1, если все экономические субъекты не делают между ними различий; наконец, оно оптимально по Парето, если не существует такого допустимого состояния экономики, которое было бы лучше, чем это.

 

Аукцион Викри.

Аукцион Викри — это алгоритм проведения однораундного закрытого аукциона (участники которого не знают ставок друг друга), при котором право на покупку получает участник, предложивший максимальную ставку, но покупка осуществляется по второй максимальной ставке.

Аукцион был предложен Уильямом Викри. Этот тип аукциона стратегически схож с английским аукционом, стимулируя участников делать ставки по истинной оценке ими ценности товара.

Аукцион Викри — закрытый однораундовый аукцион при котором право на покупку получает участник сделавший наибольшую ставку, но товар достается ему по второй наибольшей ставке.

Механизм аукциона Викри вынуждает участников раскрыть истинную ценность товара для них и сделать ставку, равную цене спроса (цена спроса это денежное выражение реальной полезности товара для экономического субъекта).

Если наивысшая ставка других участников будет меньше вашей цены спроса, то для вас оптимальной будет любая ставка выше этой ставки. Ведь все равно платить придется вторую по величине ставку. То есть, скрывать свои намерения и делать ставку ниже цены спроса бессмысленно. Денег вы не сэкономите, а победу в аукционе можете упустить.

Если наивысшая ставка других участников будет больше вашей цены спроса, то для вас оптимальной будет любая ставка, которая меньше или равна вашей цене спроса. Если вы поставите цену выше, то рискуете купить товар по слишком высокой цене.

Отсюда видно, что оптимальной стратегией будет сделать ставку, соответствующей вашей цене спроса, то есть сказать правду о ценности товара для вас.

Недостатков аукциона Викри является недополучение прибыли продавцом, так как товар достается победителю по цене ниже его цены спроса. Тем не менее, механизм аукциона Викри используется в сетях контекстной рекламы Google и Яндекс, поскольку он гораздо экономичней для проведения чем английский аукцион (требует меньше времени для проведения).

 

Игры с природой. Критерий Вальда. Критерий минимального риска Севиджа.

Критерий Сэвиджа. Суть его заключается в выборе стратегии, не допускающей слишком высоких потерь. Для этого используется матрица рисков, элементы которой отражают убытки, которые понесет игрок в том случае, если для каждого состояния природы не будет выбрано наилучшей стратегии.

Элементы этой матрицы находятся по формуле: rij = maxi aij – aij, где maxi aij – максимальный элемент в столбце исходной матрицы.

Оптимальная стратегия определяется выражением mini(maxj rij).

Критерий Вальда. Стратегия выбирается из условия maxi(minj aij) и совпадает с нижней ценой игры. Игрок исходит из предположения о том, что природа будет действовать наихудшим для него образом, поэтому данный критерий считается пессимистическим.

Дата: 2019-03-05, просмотров: 265.