Матричные игры с неопределенностью

Основные понятия

Неопределенность - это когда противник не имеет противоположных интересов, но выигрыш действующего игрока во многом зависит от неизвестного заранее состояния противника.

Природа - это обобщенное понятие противника, не преследующего собственных целей в данном конфликте, хотя такую ситуацию конфликтом можно назвать лишь условно.

Игра с природой - игра в которой осознанно действует только один из игроков.

Природа может принимать одно из своих возможных состояний и не имеет целью получения выигрыша.

Игра с природой представляется в виде платежной матрицы, элементы которой - выигрыши игрока A, но не являются проигрышами природы П.

Каждый элемент платежной матрицы aij - выигрыш игрока A, при стратегии Ai в состоянии природы Пj.

Выигрыш игрока A[a11a12a1na21a22a2nam1am2amn]

Принятие решений в условиях неопределенности

Предположим, что лицо принимающее решение, может выбрать одну из возможных альтернатив, обозначенных номерами i=1,2,,m.

Ситуация является полностью неопределенной, т.е. известен лишь набор возможных вариантов состояний внешней (по отношению к лицу, принимающему решение) среды, обозначенных номерами j=1,2,,n.

Если будет принято не решение, а состояние внешней среды соответствует j-й ситуации, то лицо, принимающее решение, получит доход.

Необходимо провести оценку риска в условиях, когда реальная ситуация неизвестна. Если игрока знает, что осуществляется j-е состояние природы, то выбрал бы наилучшее решение, то есть то, которое принесет наибольший выигрыш.

При решении Задачи о принятии решений в условиях неопределенности для отбора вариантов стратегии применяют так называемые критерии оптимальности (альтернативные критерии оптимальности).

Критерий Лапласа

Критерий Лапласа - принцип недостаточного обоснования

P(s1)=P(s2)==P(si)=1n

Если величина v(ai,sj) представляет собой расходы лица, принимающего решение, то оператор max заменяется на min

maxai(1nj=1mv(ai,sj))

Минимаксный (максиминный) критерий

Минимаксный (максиминный) критерий - сводится к выбору наилучшей альтернативы из наихудших или наоборот из наихудших альтернатив наилучшую.

Если величина v(ai,sj) представляет получаемую прибыль, то в соответствии с максиминным критерием, в качестве оптимального выбирается решение обеспечивающее

maxai{minsjv(ai,sj)}

Если величина v(ai,sj) представляет потери, используется минимаксный критерий, который определяется следующим соотношением

minai{maxsjv(ai,sj)}

Критерий Сэвиджа

Критэрий Сэвиджа - принцип замены матрицы платежей (выигрышей или проигрышей) v(ai,sj) матрицей потерь v(ai,sj), которая определяется следующим образом:

V(ai,sj)=[maxai(v(ai,sj))v(ai,sj), если v - доходv(ai,sj)minai{v(ai,sj)}, если v - потери]

Критерий Гурвица

Критерий Гурвица - критерий для принятия решений от оптимистичного до песимистичного.

maxai{αmaxsjv(ai,sj)+(1α)minsjv(ai,sj)} minai{αminsjv(ai,sj)+(1α)maxsjv(ai,sj)}

Пример составления платежной матрицы

Затраты на производство: 115 руб.
Доход: 115+75=190 руб.
Реализация произведенной продукции по формуле:

Прибыль=ЦенаОбъем продажСебестоимостьОбъем производства[S1(15)S2(16)S3(17)a1(15)112511251125a2(16)101012001200a3(17)89510851275]

1125=1519015115
1010=1519016115
895=1519017115

1200=1619016115
1085=1619017115

1275=1719017115

Критерий Лапласа: если вероятности состояний природы правдоподобны, то их оценки используют принцип недостаточного основания Лапласа, согласно которого все состояния природы полагаются равновероятными т.е.:

q1=q2==qn=1nqi=13[S1S2S3k=0na(ij)A11125  0.333=3751125  0.333=3751125  0.333=3751125A21010  0.333=336.6671200  0.333=4001200  0.333=4001136.667A3895  0.333=296.3331085  0.333=361.6671275  0.333=4251085pj0.3330.3330.333]

Вывод: наибольший уровень прибыли с учетом вероятности был получен при использовании альтернативы 2, организаторы решают производить 15 упаковок косметической продукции.