Принятие решений в условии неопределенности

Количественные методы выбора наилучших альтернатив в условиях неопределенности и риска, методы теории игр часто могут служить хорошей основой для выработки стратегии компании в условиях быстро меняющейся окружающей среды.

 

Поиск оптимального решения в антогонистических играх

Интересы участников игры (игроков) могут оказаться несовпадающими и даже противоположными. В последнем случае игра называется антагонистической.

Система правил, однозначно определяющая выбор хода игрока в зависимости от сложившейся ситуации, называется стратегией.

Каждая фиксированная стратегия игрока, где любой ситуации сопоставлен конкретный выбор, называется чистой. В реальности чаще используются т.н. смешанные стратегии, где чистые стратегии смешиваются с некоторыми вероятностями.

Простейшими являются игры 2 лиц с нулевой суммой.

Пусть в такой игре игрок 1 имеет m выборов и игрок 2 - n выборов. Если игрок 1 делает свой i-й выбор, а игрок 2-свой j-й выбор, то выигрыш игрока 1 (проигрыш игрока 2) равен Rij. Такая игра называется матричной и матрица R = [ Rij/ i=1..m , j=1..n ] называется матрицей выигрышей (платежной матрицей).

При ведении игры игрок должен ориентироваться на оптимальную политику партнера и наказывать его за отступления от таковой. Проведем рассуждения за игрока 1. Если Я воспользуюсь i-м выбором, мой противник для минимизации моего выигрыша сделает тот из своих выборов, который даст min Rij. Соответственно, Я должен использовать тот выбор, который гарантирует мне выигрыш, не меньший

Противник, рассуждая аналогично, приходит к выводу о гарантированном проигрыше.

Если в матрице выигрышей существует элемент Rkl= V1= V2, то говорят о наличии оптимальной политики "в пространстве чистых стратегий" и оптимальными выборами для игроков соответственно являются выборы k и l. Пару (k, l) называют седловой точкой.

Если седловой точки нет – решение находится в смешанных стратегиях.

Игры с природой

К играм с природой относятся ситуации, в которых второй игрок принимает решение о выборе своей стратегии неосознанно, случайным образом.

Собираясь в туристический поход, мы укладываем вещи в рюкзак с учетом неизвестной погоды и преследуем цель получить максимум удовольствий, не превращаясь в рекордсмена по переноске тяжестей. Создавая систему профилактических и аварийных ремонтов, мы преследуем цель, не зная в точности времени возникновения аварий.

Пример выбора оптимальной стратегии

Планируется выпуск новой продукции, для чего необходимо закупить станки. Система оптовой торговли может поставить не более 50 станков; комплект поставки - 10 станков. Минимальный объем поставок - 20 станков. Соответственно, вектор решений об объеме поставок X = (20,30,40,50).

Ежегодный доход от продукции, снимаемой с одного станка, cоставляет 21.9 тыс.руб. Оптовая цена одного станка 4.775 тыс.руб., эксплуатационные расходы - 3.6 тыс. руб. Затраты на подготовку производства составляют 25.5 тыс.руб. и не зависят от числа станков и объема выпуска.

Решение. Пусть спрос пропорционален количеству продукции, снимаемой с S работающих станков, вектор состояния спроса S = (0,10,20,30,40,50).

Элементы платежной матрицы:

Wij = (21.9 - 3.6) * min( Xi, Sj) - 4.775 Xi - 25.5

 
-121 62 245 245 245 245
-168,75 14,25 197,25 280,25 380,35 380,25
-216,5 -33,5 149,5 332,5 515,5 515,5
-264,25 -81,25 101,75 284,75 467,75 650,75

Например,

W11 = -(4.775 20+25.5) = -121,
W12 = (21.9-3.6) * 10-(4.775 20+25.5) = 62,
W13 = (21.9-3.6) * 20-(4.775 20+25.5) = 245,
W14 = W15 = 245 (спрос останется неудовлетворенным).

Предположим, что в нашем распоряжении имеются статистические данные, позволяющие оценить вероятность того или иного спроса, и этот опыт может быть использован для оценки будущего. При известных вероятностях Pj для спроса Sj можно найти математическое ожидание W(X,S,P) и определить вектор X*, дающий

Если для вышеприведенного примера задать вектор P = (0.01, 0.09, 0.2, 0.3, 0.3, 0.1), то математические ожидания прибыли при разных выборах:

W1 =-121*0.01 + 62*0.09 + 245*0.2 + 245*0.3 + 245*0.3 + 245*0.1 = 224.87,

W2 = 305.22, W3 = 330.675, W4 = 301.12

и выбор максимального значения обнаруживает оптимальность варианта 40 станков с ожидаемой прибылью 330.675 тыс.руб.

 




Критерий Лапласа

Если нет достаточных оснований считать, что вероятности того или иного спроса имеют неравномерное распределение, то они принимаются одинаковыми и задача сводится к поиску варианта, дающего

Для нашего примера

W1 = (-121 + 62 + 245 + 245 + 245 + 245)/6 = 153.5,
W2 = 197.25, W3 =210.5, W4 = 193.5

и выбор максимального значения обнаруживает оптимальность выбора варианта 40 станков с ожидаемой прибылью 210.5 тыс.руб.

 


Критерий Вальда

Критерий Вальда обеспечивает выбор осторожной, пессимистической стратегии. Для каждого решения Xi выбирается самая худшая ситуация (наименьшее из Wij) и среди них отыскивается гарантированный максимальный эффект.

В нашем примере W = max(-121, -168.75, -216.5, -264.25) = -121, т.е. по этому критерию следует закупить 20 станков и максимальный возможный убыток не превысит 121 тыс.руб.

 

Критерий Гурвица

Критерий Гурвица предлагает некоторый компромисс:      

, где параметр α принимает значение от 0 до 1 и выступает как коэффициент оптимизма. Так в нашем примере значения W рассчитаны для различных α:

 
-84,4 -47,0 62 171 206,4
-113,85 -58,95 105,75 270,45 325,35
-140,4 -70,1 149,5 369,1 442,3
-172,75 -81,25 193,25 467,75 559,25

 

При α=0.5 (равновероятных шансах на успех и неудачу) следует закупить 50 станков и ожидать прибыль порядка 193.25 тыс. руб.

При вероятности успеха 0.2 не следует закупать более 20 станков с надеждой, что убытки не превысят 47 тыс.руб.

 

Критерий Сэвиджа

Суть этого критерия заключается в нахождении минимального риска. При выборе решения по этому критерию сначала матрице функции полезности (эффективности) сопоставляется матрица сожалений:

элементы которой отражают выгоду, упущенную в результате принятия i-го решения в j-м состоянии. Затем по матрице D выбирается решение по пессимистическому критерию Вальда, дающее наименьшее значение максимального сожаления.

Для нашего примера отыскиваем матрицу D, вычитая (-121) из первого столбца матрицы полезности, 62 из второго и т.д.

 
0 0 0 -135,25 -270,5 -405,75
-47,75 -47,75 -47,75 0 -135,25 -270,5
-95,5 -95,5 -95,5 -47,75 0 -135,25
-143,25 -143,25 -143,25 -95,5 -47,75 0

Наибольшее значение среди минимальных элементов строк здесь равно max[-405.75, -270.5, -135.25, -143.25]=-135.25 и, покупая 40 станков, мы уверены, что в худшем случае убытки не превысят 135.25 тыс.руб.

Выбор критерия нахождения оптимального решения осуществляется с учетом имеющейся информации о втором игроке и реальной ситуации.

Различные критерии приводят к различным выводам:

Возможность выбора критерия дает свободу лицам, принимающим экономические решения, при условии, что они располагают достаточными средствами для постановки подобной задачи.

Дата: 2018-12-28, просмотров: 188.