Как найти оптимальную стратегию в матричной игре

Методические указания

Задача 1.
Графическое
решение матричных игр.

1. Найдем оптимальные
стратегии игроков в игре, заданной
платежной матрицей

.

Сначала проверим,
есть ли в данной игре седловая точка.

Нижняя цена игры
равна
max
{4, 3} = 4.

Верхняя цена этой
игры равна
min
{7, 9, 9, 9} = 7.

Поскольку
,
то седловой точки у данной игры нет, и
решение нужно искать в смешанных
стратегиях.

Графически решаются
те матричные игры, в которых хотя бы у
одного из игроков есть лишь две чистые
стратегии. Задача именно этого игрока
и решается графически. В задаче 1 у
первого игрока две чистых стратегии, а
у второго − четыре, поэтому будем решать
графически задачу первого игрока.

Смешанная стратегия
первого игрока задается вектором
.
Построения осуществляются следующим
образом. На горизонтальной прямой
откладывается отрезок единичной длины,
характеризующий вероятность применения
чистых стратегий первым игроком. Каждой
точке этого отрезка сопоставляется
смешанная стратегия первого игрока по
следующему правилу: расстояние от точки
до правого конца отрезка задает величину,
а расстояние до левого его конца −
величину(см. рисунок 1.1). Для определенных таким
образом величинивыполняются соотношения,,
поэтому, согласно (5), векторзадает смешанные стратегии первого
игрока.

Тогда точка 0 задает
вектор (1, 0), т. е. первую чистую стратегию
первого игрока, а точка 1 задает вектор
(0, 1), т. е. вторую чистую стратегию первого
игрока. Далее через концы единичного
отрезка проводятся вертикальные линии.
На этих линиях откладываются выигрыши
первого игрока при применении вторым
игроком его различных чистых стратегий.
При этом выигрыши в случае применения
первым игроком его первой чистой
стратегии располагаются на левой
вертикальной линии, а соответствующие
второй чистой стратегии первого игрока
− на правой вертикали. Точки левой и
правой вертикали, соответствующие одной
и той же чистой стратегии второго игрока,
соединяются отрезками. На рисунке 1.2
изображены выигрыши первого игрока при
применении вторым игроком первой чистой
стратегии. Римскими цифрами указано,
что второй игрок применяет именно первую
чистую стратегию.

Любая точка K
этого отрезка с координатами
ипоказывает, что если первый игрок будет
применять свою смешанную стратегию,
а второй игрок − свою первую чистую
стратегию, то средний выигрыш первого
игрока будет равен.

Аналогичные
построения выполняются для остальных
чистых стратегий второго игрока (рисунок
1.3). Римские цифры указывают на номер
его чистой стратегии.

Жирным шрифтом
выделена ломаная, соответствующая
нижней границе выигрыша первого игрока,
т.е. дающая его средний гарантированный
выигрыш. В точке М находится наибольший
гарантированный выигрыш первого игрока
(так как М − наивысшая точка ломаной).
Эта точка является пересечением
отрезков, соответствующих первой и
второй чистым стратегиям второго
игрока. Эти стратегии называются
активными.
Второй игрок будет использовать их в
своей оптимальной смешанной стратегии
с ненулевой вероятностью. Отрезки,
соответствующие третьей и четвертой
чистым стратегиям второго игрока, не
проходят через точку М, поэтому эти
стратегии в оптимальную смешанную
стратегию второго игрока войдут с
нулевыми вероятностями, так как их
реализация приведет к большему проигрышу
второго игрока. Такие стратегии называют
пассивными.

При определении
оптимальной смешанной стратегии первого
игрока и цены игры используется следующее
утверждение:

Утверждение 3.
Если один
из игроков применяет свои оптимальные
смешанные стратегии, то его выигрыш
будет равен цене игры, независимо от
того, с какими вероятностями применяет
другой игрок свои стратегии, вошедшие
в оптимальную смешанную стратегию.

Выпишем соотношения
для нахождения оптимальной смешанной
стратегии первого игрока, основываясь
на утверждении 3. В нашем примере платежная
функция, согласно (7), имеет вид:

Пусть оптимальная
смешанная стратегия первого игрока
равна
.
По утверждению 3 он получит выигрыш,
равный цене игры,
с какими бы вероятностями не применял
второй игрок свои активные стратегии.
Мы рассмотрим случаи, когда второй игрок
применяет свои активные чистые стратегии,
т.е. либо первую, либо вторую.

Итак, пусть
,.
Тогда.

Пусть
,.
Тогда.
Приравняем эти значения к цене игрыи добавим уравнение,
получим систему уравнений:

(9)

Решив эту систему,
получаем

Теперь найдем
оптимальную смешанную стратегию второго
игрока. Пусть она задается вектором
.
Здесь мы учли тот факт, что третья и
четвертая чистые стратегии второго
игрока являются пассивными. Выпишем
величину проигрыша второго игрока, если
он применяет свою оптимальную смешанную
стратегию, а первый игрок − свои чистые
стратегии.

Пусть
.
Тогда.

Пусть
.
Тогда.

Применяем утверждение
3, учитывая, что цена игры найдена и равна
получим систему уравнений:

Решив эту систему,
получаем
.
Итак, оптимальная смешанная стратегия
второго игрока задается вектором.

Ответ к данной
задаче запишем в виде:

,
.

2. Рассмотрим теперь
матричную игру, платежная матрица
которой является транспонированной к
матрице задачи 1, т.е. игра задается
матрицей

В новой игре первый
игрок имеет четыре чистые стратегии, а
второй − две. Нижняя цена игры
а верхняя цена игры.

Так как
,
то у этой игры нет седловой точки, поэтому
нужно искать ее решение в смешанных
стратегиях. Пусть− вектор смешанных стратегий первого
игрока, а
вектор смешанных стратегий второго
игрока. Платежная функция данной игры
равна:

Второй игрок имеет
две чистые стратегии, поэтому графически
будет решаться задача второго игрока.
Построения выполняются аналогично п.1,
если поменять местами первого и второго
игроков (см. рисунок 1.4). Цель второго
игрока, согласно его осторожному
поведению, состоит в минимизации его
возможного риска. Риск второго игрока
(т.е. максимально возможный проигрыш
второго игрока при применении им той
или иной смешанной стратегии) на рисунке
1.4 показан жирной линией. Точка M
обозначает минимальный риск второго
игрока. Она лежит на пересечении отрезков,
соответствующих второй и четвертой
чистым стратегиям первого игрока.

Обозначим оптимальную
смешанную стратегию второго игрока
.
Для нахождения значенийивоспользуемся утверждением 3. Активными
стратегиями первого игрока являются
вторая и четвертая. Тогда

1)
,=>.

2)
,=>.

Приравняем эти
значения к цене игры
и добавим уравнение,
получим систему уравнений:

Решив
эту систему, получаем

Теперь найдем
оптимальную смешанную стратегию первого
игрока,
.
Так как его активные стратегии − вторая
и четвертая, а первая и третья пассивные,
то.
Следовательно,.
Применяя утверждение 3 и учитывая, что
цена игры уже найдена, получим систему
уравнений:

Решая эту систему,
получаем

Итак, решение
матричной игры задается векторами
и ценой игры:

,
.

Задача 2. Об
оптовой закупке при неопределенности
розничной продажи.

1. Составим платежную
матрицу игры, описывающей предложенную
в задаче ситуацию. Эта задача является
примером так называемых «игр с природой».
Торговая фирма выступает в качестве
первого игрока. У нее есть две чистые
стратегии: делать закупки, рассчитывая
на холодную и дождливую погоду (первая
стратегия) или на жаркую солнечную
(вторая стратегия). Вторым игроком
является природа. У нее также две чистые
стратегии. Первая стратегия − установить
холодную и дождливую погоду, вторая
стратегия − установить жаркую солнечную
погоду. Элементы платежной матрицы −
это прибыль, которую будет получать
фирма в той или иной ситуации. Прибыль
рассчитывается как разница между
выручкой фирмы от розничной реализации
продукции и ежедневными затратами
фирмы. Затраты в свою очередь есть сумма
средств, направленных на оптовую закупку
товаров, и издержек на розничную
реализацию продукции.

Рассмотрим первую
чистую стратегию фирмы. Пусть фирма
планирует закупить товары А и В в
количествах kA
и kB
соответственно. Предполагается, что
завтра будет холодная погода. Исходя
из статистических данных, на каждые 2
ед. товара А реализуется 3 ед. товара В.
Следовательно, фирма должна закупить
продукты таким образом, чтобы выполнялось
соотношение на их количество. Это значит,
что должно выполняться соотношение:

На закупки фирма
предполагает тратить 9775 руб. ежедневно.
Поэтому, исходя из оптовых цен продуктов,
она может купить продукты в количествах,
для которых выполнено:

Итак, для нахождения
количеств закупаемых в расчете на
холодную погоду продуктов, необходимо
решить следующую систему уравнений:

Отсюда получаем:
kA
=
1150 kB
= 1725, т.е.
необходимо закупить 1150 ед. товара А и
1725 ед. товара В.

Пусть фирма
применяет свою вторую чистую стратегию,
т.е. делает покупки в расчете на солнечную
погоду. Это значит, что фирма предполагает
на каждые 5 ед. товара А продать 1 ед.
товара В. Следовательно, для количеств
nA
и nB
закупаемых
товаров должно выполняться соотношение:

Учитывая оптовые
цены товаров и планируемую сумму трат
на их закупку, получаем систему уравнений:

Решение этой
системы: kA
=
2125, kB
= 425. Итак,
при второй своей чистой стратегии фирма
должна закупить 2125 ед. товара А и 425 ед.
товара В.

Теперь рассчитаем
ожидаемую прибыль фирмы при различных
погодных условиях. Может быть четыре
ситуации:

  1. фирма применяла
    свою первую чистую стратегию, т.е. делала
    закупки в расчете на холодную погоду
    и угадала;

  2. фирма делала
    закупки в расчете на холодную погоду
    (применяла первую чистую стратегию), а
    погода была жаркой;

  3. фирма применяла
    свою вторую чистую стратегию, т.е. делала
    закупки в расчете на жаркую погоду, а
    погода была холодной;

  4. фирма применяла
    свою вторую чистую стратегию, т.е. делала
    закупки в расчете на жаркую погоду, и
    погода была действительно жаркой.

Рассмотрим отдельно
каждую из этих ситуаций.

1) Фирма совершает
покупки в расчете на холодную погоду,
т.е. закупает 1150 ед. товара А и 1725 ед.
товара В. При холодной погоде (т.е. первой
чистой стратегии природы) продукты
продаются в выбранном фирмой соотношении,

т. е. фирма продаст
все продукты, которые закупила (т.е.
товар А в количестве 1150 ед., а товар В в
количестве 1725 ед.). Учитывая издержки,
связанные с розничной продажей, прибыль
П фирмы в данном случае равна:

П = 1150*7 + 1725*6 –
1150*4 – 1725*3 – 1900 = 6725 (руб.).

2) Фирма по-прежнему
закупает 1150 ед. товара А и 1725 ед. товара
В, рассчитывая на холодную погоду. При
жаркой погоде товара А можно было бы
продать 2125 ед., но фирма купила только
1150. Товара В фирма купила 1725 ед., но при
жаркой погоде можно продать только 425
ед. Излишек товара В в количестве 1725 –
425 = 1300 ед. можно сдать на пищевую
переработку по цене на 75 % меньше оптовой,
т.е. по 0,25*3 = 0,75 (руб.). Итого, прибыль фирмы
в данной ситуации равна

П = 1150*7 + 425*6 – 1150*4
– 1725*3 + 1300*0,75 – 1900 = – 100 (руб.).

Заметим, что
отрицательная прибыль фирмы означает,
что фирма несет убытки, если не угадала
погоду на завтра.

3) Фирма применяет
свою вторую чистую стратегию, т.е.
закупает 2125 ед. товара А и 425 ед. товара
В, рассчитывая на жаркую погоду. Если
в действительности погода оказалась
холодной, то фирма сможет продать только
1150 ед. товара А. Остаток в 2125 – 1150 = 975 ед.
можно будет сдать на пищевую переработку
по цене на 75% меньше оптовой, т.е. по 0,25*
4 = 1 руб.

Товара В фирма
сможет продать только 425 ед. вместо
возможных 1725 ед. Итак, если фирма применит
свою вторую чистую стратегию против
первой стратегии природы, то прибыль
ожидается равной

П = 1150*7 + 425*6 – 2125*4
– 425*3 + 975*1 – 1900 = – 100 (руб.).

4) Фирма совершает
покупки в расчете на жаркую погоду, т.е.
закупает 2125 ед. товара А и 425 ед. товара
В. Если погода угадана, то фирма продаст
все продукты, которые закупила (т.е.
товар А в количестве 2125 ед., а товар В в
количестве 425 ед.). Данная ситуация
соответствует второй чистой стратегии
природы. Учитывая издержки, связанные
с розничной продажей, прибыль П фирмы
в данном случае равна:

П = 2125*7 + 425*6 – 2125*4
– 425*3 – 1900 = 5750 (руб.).

Таким образом,
платежная матрица игры имеет вид:

Найдем решение
полученной матричной игры графическим
способом. Пусть вектор
− вектор смешанных стратегий фирмы, а− вектор смешанных стратегий природы.
Тогда платежная функция игры имеет вид:

(10)

Оптимальной
смешанной стратегии фирмы на рисунке
2.1 соответствует точка K.

Применим к данной
игре утверждение 3. Обе чистые стратегии
природы являются активными. Обозначим
оптимальную смешанную стратегию фирмы
.

Итак, пусть
,.
Тогда.

Пусть
,.
Тогда.
Приравняем эти значения к цене игрыи добавим уравнение,
получим систему уравнений:

Решением этой
системы будет
.

Итак, оптимальная
стратегия фирмы состоит в том, чтобы
делать закупки, рассчитывая на завтрашний
дождь в 46% случаев, а в 54% случаев − на
солнечную погоду. Средняя ожидаемая
выручка фирмы при этом должна составить
3050 руб. ежедневно.

Снова применяя
утверждение 3, составим систему для
нахождения оптимальной смешанной
стратегии природы.

Отсюда

  1. Предположим, что
    вероятность завтрашнего дождя известна
    и составляет 40%. Тогда смешанная стратегия
    природы оказывается равной
    .
    Найдем ожидаемую прибыль фирмы с учетом
    этой информации, если применяется
    оптимальная смешанная стратегия фирмы.
    Подставим оптимальную смешанную
    стратегию фирмыив выражение для платежной функции (10):

(руб.).

Заметим, что
согласно теореме 3, ожидаемая прибыль
фирмы должна была оказаться равной цене
игры, т.е. 3050 руб. Отклонение рассчитанной
величины от данного значения вызвано
погрешностью вычисления оптимальной
смешанной стратегии фирмы.

Найдем оптимальную
стратегию фирмы на завтрашний день,
если администрации известна вероятность
завтрашнего дождя, равная 40%. Возможные
стратегии фирмы на завтрашний день −
это делать закупки в расчете либо на
дождливую, либо на солнечную погоду.
Смешанная стратегия природы равна
.

Если фирма будет
делать закупки в расчете на дождливую
погоду, т.е. применять свою первую чистую
стратегию
,
то ее ожидаемая выручка, согласно (10),
составит:

(руб.).

Если фирма будет
делать закупки в расчете на жаркую
погоду, т.е. применять свою вторую чистую
стратегию
,
то ее ожидаемая выручка составит:

(руб.).

Итак, поскольку
,
то оптимальной стратегией фирмы на
следующий день является ее вторая чистая
стратегия, т.е. выполнение закупок в
количествах ед. товара А и ед. товара В
соответственно. При этом на следующий
день ожидается прибыль, равная 3410 руб.

Задача 3. Задача
о структуре посевов.

  1. Составим платежную
    матрицу игры, которая описывается
    заданной ситуацией. В данной игре
    принимают участие два игрока. Первый
    игрок − агрофирма. У нее две чистые
    стратегии: засеять всю площадь культурой
    А или всю площадь культурой В. Второй
    игрок − природа. У нее три чистые
    стратегии: установить засушливое,
    нормальное или дождливое лето. Поэтому
    у платежной матрицы
    будет две строки и три столбца. Выигрыш
    агрофирмы − это ее выручка, полученная
    с 1 га от продажи выращенных культур.
    Умножив урожайность культуры А в тех
    или иных условиях на ожидаемую цену 1
    ц данной культуры, получим ожидаемую
    выручку агрофирмы с 1 га пашни, засеянного
    культурой А. В случае засушливого лета
    ожидаемая выручка составит 1 тыс.
    руб./ц*18 ц/га = 18 тыс. руб./га, в случае
    нормального лета ожидаемая выручка
    составит 1 тыс. руб./ц *12 ц/га = 12 тыс.
    руб./га, случае дождливого лета − 1 тыс.
    руб./ц*32 ц/га = 32 тыс. руб./га. Аналогично
    рассчитывается ожидаемая выручка в
    случае применения агрофирмой ее второй
    чистой стратегии. Итак, игра задается
    следующей платежной матрицей:

(11)

2. Пусть

доля имеющейся у агрофирмы пашни,
засеянная культурой А, а
доля имеющейся у агрофирмы пашни,
засеянная культурой В. Если считать,
что будет засеяна вся площадь, то,,
т.е. векторзадает смешанную стратегию агрофирмы.
Пусть
вероятность засушливого лета,
вероятность нормального лета,
вероятность дождливого лета. Тогда
векторзадает смешанную стратегию природы.
Обозначим черезожидаемую выручку агрофирмы с одного
га пашни при применении ей своей смешанной
стратегии. Найдем оптимальные смешанные
стратегии агрофирмы и природы и цену
игры. В отличие от задач 1 и 2 рассмотрим
еще один способ решения матричных игр
− сведение задач теории игр к задачам
линейного программирования. Опишем
сначала процедуру сведения в общем
виде.

Рассмотрим игру,
определяемую матрицей

Утверждение 4.
Для того,
чтобы число
было ценой игры, а векторыи− оптимальными смешанными стратегиями
первого и второго игроков соответственно
необходимо и достаточно выполнение
неравенств

,
(12)

.
(13)

Согласно утверждению
4 для оптимальной стратегии первого
игрока должно выполняться неравенство
(12). Предположим для определенности, что

.
Этого всегда можно добиться, прибавив
ко всем элементам матрицыодно и то же число.
Подобная операция не изменит оптимальных
стратегий игроков, а только увеличит
цену игры на.

Разделим обе части
неравенства (12) на
(так как,
то знак неравенства сохраняется):

,

.

Положим
,
тогда

,

.
(14)

Кроме того, так
как по определению смешанных стратегий
,,
то и,.
Сумма компонент вектора смешанных
стратегий, согласно (5), должна быть равна
1:

Так как первый
игрок стремится получить максимальный
в среднем выигрыш, то он должен
минимизировать величину
.
Учитывая это, а также (14), получаем, что
для нахождения оптимальной смешанной
стратегии первого игрока необходимо
решить задачу линейного программирования:

,

(15)

,

.

Аналогично можно
показать, что для нахождения оптимальной
смешанной стратегии второго игрока
необходимо решить задачу линейного
программирования:

,

(16)

,

.

Здесь
,,
где− вектор смешанных стратегий второго
игрока.

Заметим, что задача
(15) является двойственной к задаче (16).
Поэтому для того, чтобы найти решение
матричной игры, необходимо найти
оптимальное решение пары двойственных
задач (15) и (16). Пусть
− оптимальное решение задачи (16),− оптимальное решение задачи (15),
оптимальные значения целевых функций.
Формулы для определения оптимальных
стратегий и цены игры имеют вид:

,

,,,.
(17)

Теперь выпишем
задачи линейного программирования,
соответствующие игре, описываемой
матрицей (11).

Задача
агрофирмы

Задача
природы

Найдем оптимальное
решение каждой из этих задач. Задача
агрофирмы имеет две переменные, поэтому
ее можно решить графически. На рисунке
3.1 представлено графическое решение
задачи агрофирмы.

Область допустимых
решений задачи на рисунке 3.1 представлена
неограниченным четырехугольником ABCD,
вектор
дает направление вектора-градиента
целевой функции, линияизображает линию уровня целевой функции.
Точкой минимума является точкаC,
лежащая на пересечении первой и второй
граничной прямых. Ее координаты найдем,
решив систему уравнений:

Отсюда
,.
Тогда.

Оптимальное решение
задачи природы найдем, используя условия
«дополняющей нежесткости».

Первая группа
условий: xjvj=0,
,
где

v1
=,

v2
=,

v3
=.

Тогда

,

,

.

Вторая
группа
условий:
где

Тогда

,

.

Отсюда получаем

Решение этой
системы:
.

Далее,
используя найденные оптимальные решения
пары двойственных задач, по формулам
(17) найдем цену игры и оптимальные
смешанные стратегии игроков.

Таким образом,
оптимальная смешанная стратегия
агрофирмы равна
.
Это означает, что для получения
максимальной ожидаемой выручки агрофирме
необходимо 80% площади имеющейся пашни
засеять культурой А и 20 % пашни засеять
культурой В. Ожидаемая выручка при этом
должна составить 21,2 тыс. руб./га.

Оптимальная
смешанная стратегия природы
т. е. наиболее неблагоприятной для фирмы
погодой будет − с вероятностью 20%
засушливое лето, с вероятностью 80%
нормальное лето, а дождливое лето − с
вероятностью 0.

Соседние файлы в папке Все ИДЗ 2 курс(Задания)

  • #

    20.06.201540.45 Кб196Задача 1.xls

  • #

    20.06.201539.42 Кб132Задача 2.xls

  • #

    20.06.2015155.65 Кб108Задача 4.xls

  • #
  • #
  • #
  • #
  • #

    20.06.201552.74 Кб61Назначение_напарников.xls

  • #
  • #

    20.06.201540.45 Кб67ПОСЕВ2007.xls

  • #

    20.06.201562.98 Кб81РаспредСырья 2007.xls

Решение матричной игры в смешанных стратегиях

Краткая теория


Для игры без седловой точки оптимальные стратегии игроков
находятся в области смешанных стратегий. Смешанной стратегией игрока

 называют вектор

,
компоненты которого удовлетворяют условиям

Смешанной стратегией игрока

 называют вектор

 где

 и

 – вероятности, с которыми игроки

 и

 выбирают свои чистые стратегии

 и

.
При использовании смешанных стратегий игра приобретает случайный характер,
случайной становится и величина выигрыша игрока

 (проигрыша игрока

).
Эта величина является функцией смешанных стратегий

 и

 и определяется по формуле:

Функцию

 называют платежной или функцией выигрыша.

Смешанные стратегии

 и

 называются оптимальными, если они образуют
седловую точку для платежной функции

,
то есть удовлетворяют неравенству

.
Пользуются и другим определением оптимальных смешанных стратегий; стратегии

 и

 называют оптимальными, если

Величину

 называют ценой игры.

Поиск оптимальных стратегий начинают с
упрощения платежной матрицы. Если в платежной матрице элементы


строки не меньше соответствующих элементов


строки, то есть

,
то говорят, что стратегия

 доминирует над стратегией

.
Аналогично, если элементы

-го
столбца не превосходят элементы

-го
столбца, то есть

,
то говорят, что стратегия

 доминирует над стратегией

.
Частным случаем доминирования является дублирование стратегий, когда

 или

.
Исключение из платежной матрицы заведомо доминируемых стратегий (ими игрокам
пользоваться заведомо невыгодно) позволяет уменьшить ее размерность, а это
упрощает решение игры. Вероятность применения доминируемых стратегий равна
нулю.

Оптимальные смешанные стратегии

 в игре с платежной матрицей

 и ценой

 остаются оптимальными и для игры с платежной
матрицей

 (где

)
и ценой

.
На этом основании платежную матрицу можно всегда преобразовать так, что ее
элементы будут целыми неотрицательными числами, а это упрощает расчеты.

Решение матричной игры сведением к
задаче линейного программирования

Пусть имеем игру размерности

  с матрицей:

Обозначим через

 оптимальные смешанные стратегии игроков

 к

.
Стратегия

 игрока

 гарантирует ему выигрыш не меньше

,
независимо от выбора стратегии

,
игроком

.
Это можно записать так:

где

.

Аналогично стратегия

 игрока

 гарантирует ему проигрыш не больше

,
независимо от выбора стратегии

,
игроком

,
т. е.:

где

.

Поскольку элементы платежной матрицы на
основании  всегда можно сделать
положительными, то и цена игры

  (оптимальные смешанные стратегии

 и

 соответственно игроков

 и

 в матричной игре  

  с ценой

 будут оптимальными и в матричной игре 

    с ценой  

,
где

).

Преобразуем системы неравенств, разделив обе части
каждого неравенства на положительное число

,
и введем новые обозначения  

.
Получим:

где:

 и

где

Так как игрок А стремится максимизировать цену игры

,
то обратная величина

 будет минимизироваться, поэтому оптимальная
стратегия игрока А определится из задачи линейного программирования следующего
вида:

найти минимальное значение функции

 при 
ограничениях (1) и (2).

Оптимальная смешанная стратегия игрока

 определится решением задачи следующего вида:

найти максимальное значение функции

 при 
ограничениях (3) и (4).

Решив пару двойственных задач графическим (для
случая двух переменных) или симплексным методом, далее определим:

Поскольку задачи (1)(2) и (3)(4) образуют пару
симметричных двойственных задач линейного программирования, нет необходимости
решать обе задачи. Получив решение одной из них, достаточно воспользоваться
соответствием между переменными в канонических записях задач.

и из строки целевой функции последней
симплекс-таблицы, содержащей компоненты оптимального вектора, выписать значения
компонент оптимального вектора двойственной задачи.

При поиске оптимальных стратегий в
матричных играх размерностей

 и

 целесообразно
использовать графический метод решения ЗЛП и свойства оптимальных планов пары
двойственных задач: если в оптимальном плане задачи переменная положительна, то
соответствующее ограничение двойственной задачи ее оптимальным планом
обращается в равенство; если оптимальным планом задачи ограничение обращается в
строгое неравенство, то в оптимальном плане двойственной задачи соответствующая
переменная равна нулю.

Пример решения задачи


Задача

Отрасли

 и

 осуществляют капитальные вложения в четыре
объекта. С учетом особенностей вкладов и местных условий прибыль отрасли

 в зависимости от объема финансирования
выражается элементами платежной матрицы

. Для упрощения
задачи принять, что убыток отрасли

 равен прибыли отрасли

. Найти
оптимальные стратегии отраслей.

Требуется:

1)
свести исходные данные в таблицу и найти решение матричной игры в чистых
стратегиях, если оно существует (противном случае см. следующий пункт 2);

2)
упростить платежную матрицу;

3)
составить пару взаимно двойственных задач, эквивалентную данной матричной игре;

4)
найти оптимальное решение прямой задачи (для отрасли

)
симплекс-методом;

5)
используя соответствие переменных, выписать оптимальное решение двойственной
задачи (для отрасли

.

6)
используя соотношение между оптимальными решениями пары двойственных задач,
оптимальными стратегиями и ценой игры, найти решение в смешанных стратегиях;

7)
дать рекомендации по каждой отрасли.

Решение

1)
Сведем исходные данные в таблицу:

Так
как

, то седловая
точка отсутствует, и оптимальное решение следует искать в смешанных стратегиях
игроков:

 и

На сайте можно заказать решение контрольной или самостоятельной работы, домашнего задания, отдельных задач. Для этого вам нужно только связаться со мной:

ВКонтакте
WhatsApp
Telegram

Мгновенная связь в любое время и на любом этапе заказа. Общение без посредников. Удобная и быстрая оплата переводом на карту СберБанка. Опыт работы более 25 лет.

Подробное решение в электронном виде (docx, pdf) получите точно в срок или раньше.

2)
Упростим платежную матрицу, отбросив стратегии, заведомо невыгодные или
дублирующие.

2-я
стратегия (2-й столбец) является невыгодной для игрока

 – элементы 2-го столбца не меньше элементов
3-го.

4-я
стратегия (4-й столбец) является невыгодной для игрока

 – элементы 4-го столбца не меньше элементов
3-го.

2-я
стратегия (2-я строка) является невыгодной для игрока

 – элементы 2-й строки не больше элементов 1-й

4-я
стратегия (4-я строка) является невыгодной для игрока

 – элементы 4-й строки не больше элементов 1-й

Получили
матрицу размером 2х2

3)  Составим пару взаимно двойственных задач, эквивалентных
данной матричной игре.

Так
как платёжная матрица содержит отрицательные числа, то лучше перейти к новой
матрице с неотрицательными элементами; для этого к элементам платёжной матрицы
достаточно добавить соответствующее положительное число, в данном случае 2.
Решение игры при этом не изменится, а цена игры увеличится на 2. Платёжная матрица примет вид:

Обозначив

  и

,

 составим две взаимно двойственные задачи
линейного программирования:

4)
Найдем оптимальное решение задачи для отрасли

 симплекс-методом.
На другой странице сайта есть задача, решенная симплекс-методом очень подробно, а в этом примере, для краткости, из расчетов приведены только симплексные таблицы.

Приведем
задачу к каноническому виду.

Заполняем
симплексную таблицу 0-й итерации.

Получаем таблицу 1-й итерации:

Получаем таблицу 2-й итерации:

В
индексной строке все члены неотрицательные, поэтому получено следующее решение
задачи линейного программирования (выписываем из столбца свободных членов):

5)
Соответствие между переменными исходной и двойственной задачи:

На
основании симплексной таблицы получено следующее решение 1-й задачи:

6)
Найдем решение игры в смешанных стратегиях.

Цена
игры:

Находим
оптимальную стратегию 

Учтем,
что 2-я и 4-я строка матрицы были отброшенные, как невыгодные для игрока

:

Находим
оптимальную стратегию 

Учтем,
что 2-й и 4-й столбец матрицы были отброшенные, как невыгодные для игрока

:

Цена
игры

7) Дадим рекомендации по каждой отрасли.

Отрасли

 необходимо вложить 37,5%  средств в 1-й объект и 62,5% средств во 3-й
объект. Во 2-й и 4-й объект капитальные вложения осуществлять невыгодно.

 Отрасли

 необходимо вложить 25%  средств в 1-й объект и 75% средств во 3-й
объект. Во 2-й и 4-й объект капитальные вложения осуществлять невыгодно.

Теория игр. Матричные игры. Онлайн калькулятор

С помощю этого онлайн калькулятора можно решить задачу теории игр. Для решения задачи теории игр задайте количество строк и количество столбцов матрицы. Затем введите данные в ячейки и нажимайте на кнопку “Вычислить”. Теоретическую часть смотрите ниже.

Теория игр − теоретическая часть

Бывают ситуации, в которых сталкиваются интересы двух и более сторон. При этом эффективность принимаемого решения одной стороны зависит от действий другой стороны. Такие ситуации называются конфликтными. Конфликтная ситуация называется антагонистической, если увеличение выигрыша одной стороны на определенную величину приводит к уменьшению выигрыша другой стороны на такую же величину. Математическая модель таких ситуаций описывается матричной игрой. Участники игры (т.е. лица, принимающие решение) называются игроками. Принятие игроком того или иного решения в процессе игры и его реализация называется ходом. Ходы могут быть личными (т.е. сознательными) и случайными. Стратегия игрока − осознанный выбор одного из множества вариантов его действий. Стратегия называется чистой, если выбор игрока неизменен от партии к партии. У первого игрока есть m чистых стратегий, а у второго игрока n чистых стратегий. Если множество стратегий игроков конечный, то игра называется конечной, а если хотя бы у одного игрока множество стратегий бесконечно, то игра называется бесконечной. Стратегия игрока называется оптимальной, если она обеспечивает данному игроку (при многократном повторении) максимально возможный средний выигрыш или минимально возможный средний проигрыш.

Игры, в которых учавствуют 2 игрока, называются парными, а игры с большим числом участников − множественными. Если в парной игре выигрыш одной стороны точностью совпадает с проигрышем другой стороны, то игра называется игрой с нулевой суммой.

В зависимости от вида функций выигрышей, игры бывают матричные, биматричные, непрерывные, выпуклые и др.

Рассмотрим матричную игру двух участников с нулевой суммой и конечным числом возможных ходов.

Решение матричной игры в чистых стратегиях

Пусть игроки A и B распологают конечным числом возможных действий (чистых стратегий). Обозначим их через и , соответственно. Игрок A может выбрать чистую стратегию . В ответ на этот выбор, игрок B может выбрать чистую стратегию . Выбор стратегии первого игрока и ответный выбор стратегии игрока B единственным образом определяет результат aij выигрыш игрока A или проигрыш игрока B.

Таким образом игра с нулевой суммой однозначно определяется матрицей

которая называется платежной матрицей или матрицей выигрышей. Строки матрицы (1) определяют стратегии первого игрока (), а столбцы соответствуют стратегиям второго игрока ().

Игра проходит партиями. Партия начинается с первого игрока. Он выбирает некоторую строку i матрицы. В ответ на это второй игрок выбирает некоторый столбец j. На этом заканчивается партия и второй игрок платит первому сумму aij, если aij>0 или первый игрок платит сумму aij второму игроку, если aij<0. Цель каждого игрока − выиграть как можно большую (или проиграть как можно меньшую) сумму в результате большого числа партий.

Чтобы определить наилучшие стратегии игроков, мы предполагаем, что участники разумны, т.е. делают все, чтобы добится наилучшего результата для себя. Методом логических рассуждений найдем наилучшую стратегию игрока A. Для этого проанализируем по шагам все его стратегии. Выбирая стратегию Ai (строка i) игрок A должен рассчитывать, что игрок B должен ответить такой стратегией Bj (столбец j), чтобы выигрыш первого игрока был бы минимальным. Поэтому найдем для каждой строки минимальное число:

Зная для каждой строки число αi (i=1,2,…m) игрок A должен выбрать ту стратегию, при котором его выигрыш будет максимальным:

Величина α называется минимальным гарантированным выигрышем, к которому может достигнуть игрок A, при любых стратегиях игрока B. α называется нижней ценой игры или максимином.

Рассмотрим, теперь, игру со стороны игрока B. Игрок B заинтересован уменьшить свой проигрыш (или минимизировать выигрыш игрока A. Поэтому для каждого столбца он оценивает свой максимальный проигрыш в связи с тем, какую стратегию i выберет игрок A:

Зная для каждого столбца число βj (j=1,2,…n), игрок B должен выбирать ту стратегию, при котором его проигрыш будет минимальным:

Величину β называют верхней ценой игры или максимином, к которому может достигнуть игрок A, при любых стратегиях игрока B. α называется нижней ценой игры или максимином. Она показывает максимальный проигрыш, которого может достигать игрок B при любых стратегиях игрока A.

Теорема 1. В матричной игре нижняя цена игры не превосходит верхней цены, т.е. α ≤ β.

Действительно:

Если для чистых стратегий Ak и Bl игроков A и B имеет место равенство α = β, то пару чистых стратегий (Ak,Bl) называют седловой точкой матричной игры а γ=α = β чистой ценой игры. Элемент akl называют седловым элементом платежной матрицы.

Заметим, что отклонение игрока A от максимальной стратегии Ak ведет к уменьшению его выигрыша, а отклонение игрока B от минимальной стратегии Bl ведет к увеличению его проигрыша. Поэтому Ak и Bl являются оптимальными чистыми стратегиями игроков A и B, соответственно.

Тройку (Ak, Bl, γ) называют решением матричной игры. Если игра имеет седловую точку, то говорят, что она решается в чистых стратегиях.

Решение матричной игры в смешанных стратегиях

Если матричная игра не имеет седловой точки, то α ≠ β, и, Теорему 1, получим: α < β. Получается, что применение минимаксных стратегий приводит к тому, что выигрыш игрока A не больше α, а проигрыш игрока B не больше β. В этом случае решение матричных игр находят в смешанных стратегиях.

Смешанной стратегией игрока A называется вектор , где

pi− вероятность, с которой игрок A выбирает свою чистую стратегию Ai.

Смешанной стратегией игрока B называется вектор , где

qj− вероятность, с которой игрок B выбирает свою чистую стратегию Bj.

Замемим, что чистые стратегии являются частным случаем смешанных стратегий. Если, например игрок A выбрал чистую стратегию A3, то это означает, что вероятность ее выбора равна 1, т.е. . Средняя величина выигрыша игрока A (или проигрыша игрока B) определяется по формуле математического ожидания:

Функция M(p,q) называется платежной функцией матричной игры с матрицей. Смешанные стратегии p* и q* называются оптимальными, если они образуют седловую точку для платежной функции M(p,q), т.е.

Значение платежной функции при оптимальных смешанных стратегиях p* и q* называют ценой игры:

Теорема 2 (Основная теорема теории матричных игр). В любой матричной игре у игроков есть оптимальные смешанные стратегии.

Доказательство. Пусть игра имеет платежную матрицу

где все элементы положительны.

Пусть и − смешанные стратегии игроков A и B , соотвестстенно.

Математическое ожидание выигрыша игрока A равна:

При любом выборе игроками своих смешанных стратегий p и q, математическое ожидание будет положительным, так как все элементы aij платежной матрицы положительны, pi неотрицательные числа и среди них есть хотя бы одно положительное число, qj неотрицательные числа и среди них есть хотя бы одно положительное число.

Нижняя цена игры

так как aij >0, i=1,2,…m, j=1,2,…n. Поскольку α>0 и γ не может быть меньше нижней цены игры, то γ ≥ α, а так как α>0, то γ >0.

Пусть игрок A выбирает такую стратегию p, что математическое ожидание его выигрыша независимо от того, какую стратегию выбирает игрок B было не меньше некоторой величины γ:

где pi >0, i=1,2,…m, . Каждая строка в системе линейных неравенств (3) соотвесттвует определенной стратегии игрока B.

Преобразуем систему нерравенств (3), введя новые обозначения:

Разделим все неравенства системы (3) на положительное число γ. Тогда имеем:

yi >0, i=1,2,…m.

При этом

Цель игрока A − максимизировать свой гарантированный выигрыш γ или минимизировать величину

Таким образом, приходим к следующей задаче линейного программирования:

Сделав аналогичные рассуждения с позиции игрока B, получим следующую задачу линейного программирования:

Покажем, что задачи линейного программирования (4) и (5) имеют допустимые решения. Так как aij >0, то можно подобрать достаточно большие положительные числа yi, i=1,2,…m так, чтобы выполнялись неравенства (4b). Значит задача линейного программирования (4) имеет допустимое решение.

Допустимое решение задачи линейного программирования (5) является нулевой вектор. Таким образом, пары двойственных задач линейного программирования (4) и (5) имеют допустимые решения. Тогда, согласно теории двойственных задач линейного программирования, обе эти задачи имеют оптимальные планы , , при этом оптимальные значения целевых функций данных задач равны:

Цена игры равна:

Найдем оптимальные смешанные стратегии игроков:

Тогда

Пара образует седловую точку данной матричной игры в смешанных стратегиях.

Если в матрице есть отрицательные элементы или нули, то можно сделать матрицу положительным, добавив к каждому элементу матрицы достаточно большое положительное число r. Тогда получим следующую матрицу A’(aij+r).

Математическое ожидание выигрыша игрока A с платежной матрицей A(aij):

Математическое ожидание игрока A с платежной матрицей A’(aij+r):

Тогда

Игра с платежной матрицей A’ имеет седловую точку в смешанных стратегиях:

Следовательно, игра с платежной матрицей A также имеет седловую точку в смешанных стратегиях а цена игры с платежной матрицей A равна:

Для рассмотрения численного примера матричной игры, введите в калькуляторе в начале страницы элементы матрицы и нажмите на кнопку вычислить. Онлайн калькулятор выдаст подробное рашение задачи.

Добавить комментарий