Порталы:

Биология Война География Информатика Искусство История Культура Лингвистика Математика Медицина Охрана труда Политика Право Психология Религия Техника Физика Философия Экономика

Мы поможем в написании ваших работ!

Глава II. Транспортная задача

Читайте также:

В предыдущих разделах мы рассматривали симплекс-метод решения задачи линейного программирования. Однако для ряда задач матрица, используемая в симплекс-методе, имеет специальный вид. Поэтому для таких задач разработаны специальные методы решения, позволяющие быстрее найти решение. В этой главе мы разберем одну из таких задач - транспортную задачу.

2.1. Замкнутая модель транспортной задачи.

Пусть в пунктах A₁,…,A_m производится некоторый продукт в количествах a₁,…,a_m> 0. Этот продукт перевозится в пункты B₁,…,B_n, где он полностью потребляется в количествах b₁,…,b_n> 0. Для каждой пары индексов i,j задана стоимость c_ij0 перевозок единицы продукта из пункта производства A_iв пункт потребления B_j. Необходимо перевезти весь произведенный продукт из пунктов A₁,…,A_m в пункты потребления B₁,…,B_n. При этом требуется, чтобы потребности каждого из пунктов B₁,…,B_n полностью удовлетворялись.

Сформулируем эту задачу как задачу линейного программирования.

Назовем планом перевозок неотрицательную матрицу X = (x_ij) размера m×n, в которой число x_ij≥ 0 указывает количество продукта, перевозимого из пункта A_i в пункт B_j, 1 ≤ i ≤ m, 1 ≤ j ≤ n.

Стоимость z(X) перевозок является линейной функцией от X, именно, z(X) = ∑_i_,_j c_ijx_ij, x_ij ≥ 0.

В задаче требуется найти такой план перевозок X, чтобы его стоимость была бы минимальной, причем весь продукт был бы вывезен из пунктов производства, доставлен в пункты потребления, и все потребности были бы полностью удовлетворены. Отсюда следует, что транспортная задача является задачей линейного программирования. Действительно то, что весь продукт, производимый в A_i вывозится записывается в виде уравнения

∑_jx_ij= a_i, ( i = 1, …, m )

Аналогично, условие того, что потребности пункта B_jполностью удовлетворены, записывается в виде уравнения

∑_i x_ij = b_j, ( j = 1, …, n ).

Таким образом, транспортная задача следующим образом записывается как задача линейного программирования

(1)

x_ij ≥ 0;

z(X) = ∑_i_,_j c_ijx_ij → min.

Сформулированная в (1) транспортная задача называется замкнутой моделью.

Другие модели транспортной задачи будут рассмотрены позднее.

Назовем план перевозок X допустимым, если выполнены все ограничения из (1). Укажем способ построения допустимого решения методом минимального элемента.

Этот способ возможен, если ∑_i a_i = ∑_j b_j. Для этого выберем клетку с индексами (i,j), в которой стоит минимальное из чисел c_ij. В эту клетку помещаем число x_ij = min(a_i ,b_j ). Если a_i < b_j, то все остальные элементы i-ой строки полагаем равными нулю, число b_j заменяем на b_j – a_i, а a_i на 0. Если же a_i ≥ b_j, то все остальные элементы j-ого столбца полагаем равными нулю, число a_i заменяем на a_i – b_j, а b_j на 0. В результате число пустых строк или столбцов уменьшается на единицу. Продолжая этот процесс, получаем первоначальный план.

Продемонстрируем этот метод на конкретном примере. Пусть a₁= 18, a₂= 10, a₃= 12, b₁= 16, b₂= 9, b₃= 15, а матрица C имеет вид

Построим вспомогательную таблицу

	b₁= 16	b₂= 9	b₃= 15
a₁= 18		с₁₁=1		с₁₂=3	с₁₃=4

a₃= 10		с₂₁=2		с₂₂=5	с₂₃=3

a₃= 12		c₃₁=6		c₃₂=7	c₃₃=5

Минимальный элемент с₁₁=1. В клетку (1,1) помещаем min(18,16)=16. В соответствии с изложенным правилом получаем таблицу

	b₁= 0	b₂= 9	b₃= 15
a₁= 2		с₁₁=1		с₁₂=3	с₁₃=4

a₃= 10		с₂₁=2		с₂₂=5	с₂₃=3

a₃= 12		c₃₁=6		c₃₂=7	c₃₃=5

Далее из всех незаполненных клеток, находящихся в двух последних столбцах выбираем ту, в которой число c_ij минимально. Это, например, с₂₃=3. Применяя общее правило, получаем новую таблицу

	b₁= 0	b₂= 9	b₃= 5
a₁= 2		с₁₁=1		с₁₂=3	с₁₃=4

a₃= 0		с₂₁=2		с₂₂=5	с₂₃=3

a₃= 12		c₃₁=6		c₃₂=7	c₃₃=5

Далее выбираем клетку (1,2) с с₁₂=3. Получаем новую таблицу

	b₁= 0	b₂= 7	b₃= 5
A₁= 0		с₁₁=1		с₁₂=3	с₁₃=4

A₃= 0		с₂₁=2		с₂₂=5	с₂₃=3

A₃= 12		c₃₁=6		c₃₂=7	c₃₃=5

Наконец завершаем процесс и получаем первоначальный план. При этом можно отбросить первую строку и первый столбец. Получаем

с₁₁=1	с₁₂=3	с₁₃=4

с₂₁=2	с₂₂=5	с₂₃=3

c₃₁=6	c₃₂=7	c₃₃=5

Теорема 1. Транспортная задача (1) имеет решение тогда и только тогда, когда

∑_i a_i = ∑_j b_j.

Доказательство. Пусть решение X существует. Тогда из (1) вытекает, что

∑_i a_i = ∑_i ∑_j x_ij = ∑_j ∑_i x_ij = ∑_j b_j.

Обратно, пусть выполнено равенство из условия теоремы. Тогда можно построить хотя бы одно допустимое решение, например, методом минимального элемента.

Из ограничений видно, что все элементы допустимой матрицы неотрицательны и потому ограничены. Следовательно, функция z(X) достигает минимума на некотором допустимом плане, т.е. транспортная задача всегда имеет решение.

Рассмотрим двойственную задачу линейного программирования к транспортной задаче (1). В соответствии с общим правилом запишем (1) в виде

∑_jx_ij≤ a_i, i = 1, …, m;

- ∑_jx_ij≤ - a_i, i = 1, …, m;

∑_ix_ij ≤ b_j, j = 1, …, n; (2)

- ∑_ix_ij ≤ - b_j, j = 1, …, n

x_ij ≥ 0;

- z(X) = - ∑_i,j c_ijx_ij→ max.

Тогда двойственная задача имеет вид

a_i’ - a_i’’ + β_j’ - β_j’’ ≥ - c_ij , i = 1, …, m, j = 1, …, n;

a_i’,a_i’’,β_j’, β_j’’ ≥ 0, i = 1, …, m, j = 1, …, n; (3)

T’= a₁’a₁– a₁’’a₁+ … + a_m’a_m– a_m’’a_m+ β₁’b₁– β₁’’b₁ + … + β_m’b_m– β_m’’b_m → min

Положим T = -T’ и a_i = a_i’’ - a_i’, β_j = β_j’’ - β_j’, i = 1, …, m, j = 1, …, n.

Тогда (3) имеет вид

a_i+ β_j ≤ c_ij, i = 1, …, m, j = 1, …, n; (4)

T = a₁a₁+ … + a_ma_m+ β₁b₁ + … + β_mb_m→ max.

Теорема 2. Для того, чтобы допустимый план перевозок X был оптимальным необходимо и достаточно, чтобы существовали такие числа (потенциалы) a₁, … , a_m,β₁, … , β_n, для которых

1) a_i + β_j ≤ c_ij при всех i,j;

2) a_i + β_j = c_ij, если x_ij > 0.

Доказательство. Проверим достаточность. Пусть задан допустимый план X = (x_ij), и a₁, … , a_m,β₁, … , β_n из условий теоремы. Предположим, что Y = (y_ij) - произвольный допустимый план. В силу ограничений (1) и свойств 1), 2) из условия теоремы получаем

z(Y) = ∑_i,j c_ijy_ij≥ ∑_i,j (a_i+ β_j)y_ij= ∑_i a_i ∑_j y_ij + ∑_j β_j ∑_i y_ij = ∑_i a_i a_i+ ∑_j β_j b_j= ∑_i a_i ∑_j x_ij + ∑_j β_j ∑_i x_ij= ∑_i_,_j (a_i + β_j)x_ij = ∑_i,j c_ijx_ij= z(X).

Проверим теперь необходимость. Пусть X ⁰= (x_ij⁰) – оптимальный план и a₁, … , a_m,β₁, … , β_n – оптимальное решение двойственной задачи. По (4) выполнено неравенство 1) из условия теоремы. Кроме того, по теореме о равновесии получаем (a_i+ β_j - c_ij) x_ij⁰= 0. Поэтому если x_ij⁰ > 0, то выполнено равенство 2) из условия теоремы.

Перейдем к изложению алгоритма решения транспортной задачи при некоторых ограничениях. Транспортная задача называется вырожденной, если существуют такие подмножества индексов

G Í {1, … ,m }, H Í {1, … ,n},

что одно из них собственное и

å_i_Î_G a_i = å_j_Î_H b_j

Другими словами, суммарный запас продукта в пунктах A_i, i Î G, совпадает с потреблением в пунктах B_j, j Î H.

Далее мы будет предполагать, что рассматриваемая транспортная задача невырождена. Изложим метод потенциалов решения невырожденной транспортной задачи, опирающийся на теорему 2. Мы уже имеем допустимый первоначальный план, построенный методом минимального элемента. Из этого построения видно, что число ненулевых элементов в первоначальном плане равно n + m – 1. Найдем первоначальную систему потенциалов. Для этого в соответствии с условием 2) из теоремы 2 составим систему из n + m – 1 линейного уравнения

a_i+ β_j= c_ij.

В этой системе число неизвестных a_i,β_j равно n + m. Можно показать, что ранг этой матрицы равен n + m – 1. Поэтому одно из неизвестных является свободным. Полагаем его равным нулю и далее находим частное решение системы. Продемонстрируем этот шаг на рассмотренном выше примере. Имеем системы линейных уравнений

Положим a₁= 0. Тогда β₁= 1, β₂= 3. Далее a₃= 4, β₃= 1, a₂= 2.

Для полученной системы потенциалов проверяем выполняется ли условие 1) из теоремы 2. Для этого составляем вспомогательную матрицу D, в которой на месте (i,j) стоит d_ij = a_i + β_j . Если d_ij £ c_ij для всех (i,j), то построенный план по теореме 2 является оптимальным. Далее вычисляем значение целевой функции z(X) для этого плана. В нашем примере

Мы видим, что условие 1) нарушается в клетке (1,2).

Опишем основной шаг алгоритма, состоящий в улучшении плана. Выберем клетку (p,q), в которой a_p + β_q > c_pq. По построению x_pq = 0. Нам потребуется

Предложение. Пусть план X = (x_ij) допустим, и x_pq = 0 для некоторой пары индексов (p,q). Тогда существует и единственная такая последовательность различных строк p = i(0), i(1), … , i(k) и различных столбцов j(1), … , j(k-1), j(k) = q в матрице X, что элементы этой матрицы, стоящие в клетках (i(0), j(1)), (i(1), j(1)), (i(1), j(2)), (i(2), j(2)), … , (i(k), j(k-1)), (i(k), j(k)), отличны от нуля.

Заметим, что если мы начнем движение по матрице X с клетки (p,q), двигаясь далее по клеткам (i(0), j(1)), (i(1), j(1)), (i(1), j(2)), (i(2), j(2)), … , (i(k), j(k-1)), (i(k), j(k)) из предложения, то мы сначала идем по строке, далее по столбцу, затем снова по строке и т. д. На последнем шаге мы идем по строке и попадаем в исходный столбец с номером q.

Расставим во всех выбранных клетках чередующиеся метки +, - , начиная с + в начальной выбранной клетке (p,q). Пусть q - минимальный среди элементов x_ij, стоящих в выбранных клетках с меткой -. В клетках с меткой + число x_ij увеличиваем на q, а в клетках с меткой - уменьшаем на q. Все остальные элементы матрицы X не меняем. Получаем новый допустимый план X’ = (x_ij’). Сравним значения целевых функций для планов X и X’. Имеем

z(X') - z(X) = å_i,j c_ij(x'_ij- x_ij) = å_s=0^k-1c_i(s)j(s)(x'_i(s)j(s)- x_i(s)j(s)) +

å_s=0^kc_i(s)j(s+1)(x'_i(s)j(s+1)- x_i(s)j(s+1)) = å_s=0^k-1c_i(s)j(s)q - å_s=0^kc_i(s)j(s+1)q = q[ c_i(0)j(0) + (a_i(1)+ b_j(1)) + ¼ + (a_i(k-1)+ b_j(k-1)) - (a_i(0)+ b_j(1)) - … - (a_i(k-1)+ b_j(k))] = q[ c_i(0)j(0) - (a_i(0 + b_j(k))] < 0.

Итак, план улучшился. Для нового плана снова находим систему потенциалов и с помощью теоремы 2 проверяем его оптимальность и т. д. В результате через конечное число шагов в результате работы этого алгоритма получаем оптимальный план.

Продемонстрируем работу этого алгоритма на рассмотренному выше примере. Мы выбрали клетку (2,1). Выбираем путь (2,3), (3,4), (3,2), (1,2), (1,1). Расставляем метки + для клеток (2,1), (3,4), (1,2), и метки – для клеток (2,3), (3,2), (1,1). Минимальный элемент q стоящий в клетках с меткой – равен 7. Изменяем матрицу и получаем новую таблицу

с₁₁=1	с₁₂=3	с₁₃=4

с₂₁=2	с₂₂=5	с₂₃=3

c₃₁=6	c₃₂=7	c₃₃=5

Для новой таблицы пишем систему уравнений для нахождения потенциалов:

Полагаем a₁ = 0. Тогда β₁= 1, и поэтому β₂= 3, a₂= 1. Далее β₃= 2, a₃= 3. Таким образом, матрица D имеет вид

В соответствии с теоремой 2 построенный план

оптимален. Поэтому ответом является

z(X) = 9´1 + 9´3 + 7´2 + 3´3 + 12´5 = 9 + 27 + 14 + 9 + 60 =119.

2.2. Другие модели транспортной задачи.

1. Открытая модель. Пусть производится больше продукта, чем потребляется, т. е. ∑_i a_i > ∑_j b_j. Тогда вводится фиктивный пункт B_n₊₁, с потреблением b_n₊₁= ∑_i a_i - ∑_j b_j, причем стоимость перевозки в него всегда равна 0. Тогда возникает замкнутая модель и ее решение будет оптимальным решением для исходной модели.

Аналогично, если ∑_i a_i < ∑_j b_j, то вводится фиктивный производитель A_n₊₁, с производством a_n₊₁= ∑_j b_j - ∑_i a_i, причем стоимость перевозки из него нулевая. Тогда снова возникает замкнутая модель и ее решение будет оптимальным решением для исходной модели.

2. Блокирование перевозок. Если по пути (i,j) перевозки запрещены, то полагаем, что c_ij = M – достаточно большое число, которое «не меняется при всех наших преобразованиях», т. е. при прибавлении к нему конечных чисел. Тогда перевозки по этому пути не могут быть осуществлены ввиду большой их стоимости.

3. Фиксированные перевозки. Пусть по пути (i,j) перевозки имеют фиксированное значение r_ij. В этом случае из a_i и b_j вычитается r_ij. Далее применяется модель с запретом перевозки по этому пути.

4. Дополнительные требования. Пусть по пути (i,j) перевозки должны иметь значение x_ij ³ r_ij. Тогда из a_i и b_j вычитается r_ij и далее решается обычная транспортная задача. Если же дано ограничение x_ij £ r_ij, то заявку b_j заменяется на r_ij и вводится новый потребитель с потреблением b_j - r_ij. Тарифы перевозок в новый пункт те же, что и в B_j, за исключением тарифа из A_i, который становится равным достаточно большому числу M.

Глава III. Игровые методы и модели.

3.1. Понятие об игровых моделях.

Необходимость использования математических моделей в коммерческой деятельности связана с количественным обоснованием решений. В зависимости от степени определенности возможных исходов, с которыми сталкивается лицо, принимающее решение, встречаются три типа моделей:

1) выбор решений в условиях определенности, когда относительно каждого действия известно к какому конкретному исходу оно приведет;

2) выбор решения в условиях риска, когда каждое действие приводит к одному из множества исходов, причем известна вероятность появления каждого исхода;

3) выбор решений в условиях неопределенности, когда действия стороны имеют своим следствием множество исходов, вероятности которых вообще неизвестны.

В экономике при решении практических задач приходится анализировать ситуации, где налицо две (или более) конкурирующие стороны, преследуют противоположные цели, причем результат каждой из сторон зависит от того, какой образ действий выбирает противоположная сторона.

В коммерческой деятельности часто возникают конфликтные ситуации, где в качестве противоположных сторон выступают торговые фирмы, промышленные предприятия, продавцы, покупатели и т.д.

Теория игр представляет собой математическую теорию конфликтных ситуаций. Ее задача заключается в выработке рекомендаций по рациональному поведению участников конфликта.

Каждая конфликтная ситуация в коммерческой деятельности сложна, и ее анализ затруднен наличием многих влияющих факторов. Чтобы сделать возможным проведение математического анализа ситуации, необходимо выделить существенные факторы и построить схематизированную модель, которую называют игрой. Стороны, участвующие в конфликтных ситуациях, называются игроками (отдельные лица или коллективы). Исход игры (конфликта) называется выигрышем или проигрышем.

Развитие игры во времени происходит последовательно, по этапам или ходам. Ходом в теории игр называют выбор одного из предусмотренных правилами игры действия. Они бывают личные и случайные. Личным ходом называют сознательный выбор игроком одного из возможных вариантов действия и его реализация. Случайным ходом называют выбор, осуществляемый не волевым решением игрока, а каким-либо механизмом случайного выбора (бросание монеты, пасовка, сдача карт и т.п.).

Одним из основных понятий теории игр является стратегия. Стратегий игрока называется совокупность правил, определяющих выбор варианта действий при каждом личном ходе этого игрока в зависимости от ситуации, сложившейся в процессе игры.

Оптимальной стратегией игрока называется такая стратегия, которая при многократном повторении игры обеспечивает данному игроку максимально возможный средний выигрыш (или, что-то же самое, минимально возможный средний проигрыш). Выбор этой стратегии основан на предположении, что противная сторона по меньшей мере так же разумна, как и мы сами, и делает все для того, чтобы помешать нам добиться поставленной цели.

В большинстве конфликтных ситуаций при выборе разумной стратегии приходится принимать во внимание не один, а несколько показателей. Причем стратегия, оптимальная по одному показателю, необязательно будет оптимальной и по другим.

В зависимости от причин, вызывающих неопределенность исходов, игры можно разделить на следующие основные группы.

Комбинаторные игры. Комбинаторными называются игры, в которых правила дают, в принципе, возможность каждому игроку проанализировать все разнообразные варианты своего поведения и, сравнив эти варианты, выбрать тот из них, который ведет к наилучшему для этого игрока исходу. Неопределенность исхода связана обычно с тем, что количество возможных вариантов поведения (ходов) слишком велико и практически игрок не в состоянии их всех перебрать и проанализировать.

Азартные игры. Азартныминазываются игры, исход которых оказывается неопределенным в силу влияния различных случайных факторов. Азартные игры состоят только из случайных возможных ходов, при анализе которых применяется теория вероятностей.

Стратегические игры. Стратегическими называются игры, в которых неопределенность исхода вызвана тем, что каждый из игроков, принимая решение о выборе предстоящего хода, не знает, какой стратегии будут придерживаться другие участники игры, причем незнание игрока о поведении и намерениях партнеров носит принципиальный характер, так как отсутствует информация о последующих действиях противника (партнера).

Существуют игры, сочетающие в себе свойства комбинаторных и азартных игр, стратегичность игр может сочетаться с комбинаторностью и т.д.

В игре могут сталкиваться интересы двух или более игроков.

Если в игре участвуют два игрока — игра называется парной, если число игроков больше двух — множественной. Участники множественной игры могут образовывать коалиции (постоянные или временные). Множественная игра с двумя коалициями превращается в парную. Парные игры получили наибольшее распространение в практике анализа игровых ситуаций.

Различают игры также и по сумме выигрыша. Игра называется игрой с нулевой суммой, если один игрок выигрывает ровно столько, сколько проигрывает другой, т.е. сумма выигрыша и проигрыша сторон равна нулю. В парной игре с нулевой суммой интересы игроков прямо противоположны. Парная игра с нулевой суммой называется антагонистической игрой. Игры, в которых выигрыш одного игрока и проигрыш другого не равны между собой, называются играми с ненулевой суммой.

В зависимости от числа возможных стратегий игры делятся на конечные и бесконечные.

Игра называется конечной, если у каждого игрока имеется только конечное число стратегий. Игра называется бесконечной, если хотя бы у одного игрока имеется бесконечное число стратегий.

По количеству ходов, которые делают игроки для достижения своих целей, игры бывают одношаговые и многошаговые. Одношаговые игры заключаются в том, что игрок выбирает одну из доступных ему стратегий и делает всего один единственный ход. Многошаговые игры заключаются в том, что игроки для достижения своих целей делают последовательно ряд ходов, которые могут ограничиваться правилами игры, либо могут продолжаться до тех пор, пока у одного из игроков не останется ресурсов для продолжения игры.

В последнее время получили большое распространение так называемые деловые игры. Деловая игра имитирует взаимодействие людей в виде упражнения в цепочечке принятия решений, основанной на модели - содержания коммерческой деятельности и на исполнении участниками игры соответствующих должностей – долей.

Деловые игры предназначены для воспроизведения и согласования коммерческих интересов. В основе конструкции игры лежит взаимосвязь ресурсов и использование знаний об их возможностях. Деловые игры имитируют организационно-экономические взаимодействия в различных звеньях коммерческих организаций и предприятий. Элементами игровой модели являются: участники игры; правила игры; информационный массив, отражающий состояние и движение ресурсов моделируемой хозяйственной системы. Преимущества игровой имитации перед реальным объектом таковы: наглядность последствий принимаемых решений, переменный масштаб времени; повторение имеющегося опыта с изменением установок; переменный масштаб охвата торговых явлений и объектов. Основными направлениями использования деловых игр являются следующие — в учебном процессе, например, обучение моделированию; для торговых работников, проверке их компетентности; в научных исследованиях; в разработке планов коммерческой деятельности.

В деловых играх игрокам обычно задаются начальные условия, в которых они находятся, сообщаются правила проведения игры, представляются варианты возможных решений и оценка их последствий. В иге обязательно присутствует «ведущий», который руководит игрой, оценивает принятые игроками решения, состояния, в которых они могут находиться в процессе игры, и определяет выигрыши и проигрыши по исходам игры.

Основными вопросами теории игр, которые возникают в коммерческой деятельности, являются:

1. В чем состоит оптимальность поведения каждого из игроков в игре?

2. Существуют ли стратегии игроков, которые обладали бы атрибутами оптимальности?

3. Если существуют оптимальные стратегии, то как их найти?

На практике, если у игрока нет точного представления о том, что такое оптимум, то вопрос о его поисках оказывается беспредметным, и все усилия по его нахождению могут оказаться напрасной тратой времени.

3.2. Постановка игровых задач.

Формальное описание задачи принятия решения можно представить в виде математической модели, задав множество , элементы которого в теории игр называют альтернативами, множество , элементы которого называются исходами и множество , элементы которого называются показателями среды, характеризующие условия коммерческой деятельности.

При анализе ситуаций, возникающих в коммерческой практике, множество X описывает набор принимаемых решений одной стороны, множество Y — возможные варианты поведения противоположной стороны, а множество A — тот выигрыш (или проигрыш), который получит игрок.

Если каждая альтернатива может привести к одному из исходов, каждый из которых имеет определенную вероятность появления, то считается, что принятие решения происходит в условиях риска.

Если каждая альтернатива может привести к одному из нескольких исходов, причем отсутствует даже стохастическая зависимость исходов от альтернатив, то считается, что принятие решения происходит в условиях неопределенности.

Каждый исход a Î A является функцией двух аргументов: , где x Î X, y Î Y. Функция F называется функцией реализации и она сопоставляется исход по каждой паре - «альтернатива - состояние среды».

Функцию реализации удобно представить в виде так называемой платежной таблицы.

y₁ ... y_j ... y_m

x₁ F(x₁, y₁) ... F(x₁, y_j) ... F(x₁, y_m)

... ... ... ... ... ...

x_i F(x_i, y₁) ... F(x_i, y_j) ... F(x_i, y_m)

... ... ... ... ... ...

x_n F(x_n, y₁) ... F(x_n, y_j) ... F(x_n, y_m)

3.3. Методы и модели решения игровых задач.

Принцип минимакса.

Рассмотрим методы и модели решения игровых задач.

Рассмотрим конечную парную игру с нулевой суммой. Игрок I имеет m стратегий (А₁, А₂, ..., А_m), а игрок II — n стратегий (В₁, В₂, ..., В_n). Такая игра называется игрой размерностью m ´ n. Пусть каждая сторона определилась с выбором стратегии: игрок I — A_i (i = 1, 2, ..., m), игрок II — B_j (j = 1, 2, ..., n). Выигрыши игрока I — (A_i, B_j) и игрока II — (A_i, B_j) удовлетворяют соотношению (A_i, B_j) + (A_i, B_j) = 0.

Если игра состоит только из личных ходов, то выбор стратегии (A_i, B_j) однозначно определяет исход игры , т.е. выигрыш игрока I. Если игра содержит также случайные ходы, то выигрыш при паре стратегий (A_i, B_j) есть величина случайная, зависящая от исходов всех случайных ходов. В этом случае ожидаемый выигрыш — это среднее значение (математическое ожидание). Предположим, что значения a_ij известны для каждой пары стратегий (A_i, B_j). Построим таблицу, строки которой соответствуют стратегиям игрока I, а столбцы — стратегиям игрока II, т.е. платежную матрицу. Каждый элемент (a_ij > 0) матрицы определяет величину выигрыша игрока I и проигрыш игрока II. Цель игрока I — максимизировать свой выигрыш, а игрока II — минимизировать свой проигрыш. Платежная матрица имеет следующий вид:

I \ II B₁ B₂ ... B_j ... B_n

A₁ a₁₁ a₁₂ ... a_1j ... a_1n a₁

A₂ a₂₁ a₂₂ ... a_2j ... a_2n a₂

... ... ... ... ... ... ... ...

A_i a_i1 a_i2 ... a_ij ... a_in a_i

... ... ... ... ... ... ... ...

A_m a_m1 a_m2 ... a_mj ... a_mn a_m

Β_j b₁ b₂ ... b_j ... b_n

Задача состоит в определении:

1) наилучшей (оптимальной) стратегии игрока I из стратегий A₁, A₂, ..., A_m;

2) наилучшей (оптимальной) стратегии игрока II из стратегий B₁, B₂, ..., B_m.

Для решения задачи применяется принцип, согласно которому участники игры одинаково разумны и каждый из них делает все для того, чтобы добиться своей цели.

Проанализируем последовательно каждую стратегию игрока I. Если игрок I выбирает стратегию А₁, то игрок II может выбрать такую стратегию B_j, при которой выигрыш игрока I будет равен наименьшему из чисел a₁_j:

Выбирая стратегию A_i, игрок I должен рассчитывать на то, что в результате разумных действий игрока II он не выиграет больше, чем a_i. Поэтому игрок I должен выбрать ту стратегию, для которой a_i максимально:

Величина a — гарантированный выигрыш, который может обеспечить себе игрок I при любом поведении игрока II. Величина a называется нижней ценой игры или максимином, а стратегия А_i игрока I, обеспечивающая получение нижней цены игры, называется максиминной чистой стратегией. При этом игрок I при любом поведении игрока II обеспечивает себе выигрыш, не меньше a: a_i ³ a (i = 1, 2, ..., m).

Игрок II заинтересован в том, чтобы уменьшить свой проигрыш, т.е. обратить выигрыш игрока I в минимум. Для выбора оптимальной стратегии он должен найти максимальное значение выигрыша в каждом столбце:

и среди этих значений выбрать наименьшее: .

Величина b называется верхней ценой игры или минимаксом. Стратегия игрока II, обеспечивающая получение верхней цены игры, называется минимаксной чистой стратегией. Применяя ее, игрок II проиграет не больше b при любых действиях игрока I:

b_j £ b (j = 1, 2, ..., n), причем всегда справедливо неравенство a £ b.

Таким образом, придерживаясь максиминной стратегии A_i, игрок I желает получить выигрыш не менее a не зависимо от действий игрока II, а игрок II, придерживаясь минимаксной стратегии B_j, гарантирует себе проигрыш не больше b.

Принцип, диктующий игрокам соответствующих стратегий (максиминной и минимаксной), в теории игр называется принципом минимакса. Этот принцип был впервые сформулирован Дж. фон Нейманом в 1928 году.

Пример 1. Дана платежная матрица. Найти решение игры: определить нижнюю и верхнюю цены игры и минимаксные стратегии:

I \ II B₁ B₂ B₃ B₄ a

A₁ 5 3 8 2 2

A₂ 1 6 4 3 1

A₃ 9 5 4 7 4

Β_j 9 6 8 7

Таким образом, нижней цене игры (a = 4) соответствует стратегия A₃ игрока I. Выбирая эту стратегию, игрок I достигнет выигрыша не меньше 4 при любом поведении игрока II. Верхней цене игры (b = 6) соответствует стратегия игрока II — В₂. Эти стратегии являются минимаксными. Если обе стороны будут придерживаться этих стратегий, выигрыш будет равен а₃₃= 4.

Существуют матричные игры, для которых нижняя цена игры равна верхней, т.е. a = b. Такие игры называются играми с седловой точкой.

В этом случае g = a = b называется чистой ценой игры, а стратегии игроков и , позволяющие получить это значение — оптимальными. Пара называется седловой точкой матрицы, так как элемент одновременно является минимальным в i-й строке и максимальным в j-м столбце. Оптимальные стратегии и и чистая цена являются решением игры в чистых стратегиях, т.е. без привлечения механизма случайного выбора.

Пример 2. пусть задана платежная матрица. Найти нижнюю и верхнюю цены игры.

I II B₁ B₂ B₃ a

A₁ 5 1 2 1

A₂ 2 6 2 2

A₃ 3 4 3 3

b 5 6 3

Следовательно a = b = g = 3.

Седловой точкой является пара альтернатив (А₃, В₃).

3.4. Решения игр в смешанных стратегиях.

Если матричная игра содержит седловую точку, то ее решение находится по принципу минимакса. Если же платежная матрица не имеет седловую точку, то применение минимаксных стратегий каждым из игроков показывает, что игрок I обеспечит себе выигрыш не меньше a, а игрок II обеспечит себе проигрыш не больше b. Так как a < b, то игрок I стремится увеличить выигрыш, а игрок II уменьшить проигрыш. Если информация о действиях противной стороны будет отсутствовать, то игроки будут многократно применять чистые стратегии случайным образом с определенной вероятностью. Такая стратегия в теории игр называется смешанной стратегией. Смешанная стратегия игрока — это полный набор его чистых стратегий при многократном повторении игры в одних и тех же условиях с заданными вероятностями. Для применения смешанных стратегий должны быть следующие условия:

1) в игре отсутствует седловая точка;

2) игроками используется случайная смесь чистых стратегий с соответствующими вероятностями;

3) игра многократно повторяется в одних и тех же условиях;

4) при каждом из ходов один игрок не информирован о выборе стратегии другим игроком;

5) допускается осреднение результатов игр.

Основная теорема теории игр Дж. фон Неймана: любая парная конечная игра с нулевой суммой имеет, по крайней мере, одно решение, возможно среди смешанных стратегий.

Отсюда следует, что каждая конечная игра имеет цену, которую обозначим через g, средний выигрыш, приходящийся на одну партию, удовлетворяющий условию a £ g £ b. Каждый игрок при многократном повторении игры, придерживаясь смешанных стратегий, получает более выгодный для себя результат. Оптимальное решение игры в смешанных стратегиях обладает следующим свойством: каждый из игроков не заинтересован в отходе от своей оптимальной смешанной стратегии, если его противник применяет оптимальную смешанную стратегию, так как это ему невыгодно.

Чистые стратегии игроков в их оптимальных смешанных стратегиях называются активными.

Теорема об активных стратегиях. Применение оптимальной смешанной стратегии обеспечивает игроку максимальный средний выигрыш (или минимальный средний проигрыш), равный цене игры g, независимо от того, какие действия предпринимает другой игрок, если только он не выходит за пределы своих активных стратегий.

Смешанные стратегии игроков S₁и S₂обозначим соответственно A₁ , A₂ , … A_mи B₁ , B₂ , B₃ … B_n , а вероятности их использования через p_A = (p₁, p₂, ..., p_m) и q_B = (q₁, q₂, ..., q_n), где p_i ³ 0, q_j ³ 0, при этом .

Тогда смешанная стратегия игрока I — S_I, состоящая из стратегий A₁, A₂, ..., A_m, имеет вид:

Соответственно для игрока II:

Зная матрицу А для игрока I можно определить средний выигрыш (математическое ожидание) :

Игрок I, применяя свои смешанные стратегии, стремится увеличить свой средний выигрыш, достигая

Игрок II добивается:

Обозначим через и векторы, соответствующие оптимальным смешанным стратегиям игроков I и II, при которых выполняется равенство:

При этом выполняется условие:

Решить игру — это означает найти цену игры и оптимальные стратегии.

Рассмотрим наиболее простой случай конечной игры 2 ´ 2 без седловой точки с матрицами:

С платежной матрицей

Требуется найти оптимальные смешанные стратегии игроков , и цену игры g.

Каковы бы ни были действия противника, выигрыш будет равен цене игры g. Это означает, что если игрок I придерживается своей оптимальной стратегии , то игроку II нет смысла отступать от своей оптимальной стратегии .

В игре 2 ´ 2, не имеющей седловой точки, обе стратегии являются активными.

Для игрока I имеем систему уравнений:

Для игрока II аналогично:

Если g ¹ 0 и игроки имеют только смешанные оптимальные стратегии, то определитель матрицы не равен нулю, следовательно, эти системы имеют единственное решение.

Решая систему уравнений (10) и (11) находим оптимальные ешения , и g:

Пример: Дана платежная матрица:

Найти решение.

Решение. Так как a = 3, b = 5, то a ¹ b, то и матрица игра не имеет седловой точки. Следовательно, решение ищем в смешанных стратегиях. Запишем системы уравнений:

для игрока I:

для игрока II:

Решив эти системы находим:

Следовательно оптимальные стратегии игроков имеют вид:

3.5. Геометрический метод.

Решение игры в смешанных стратегиях допускает наглядную геометрическую интерпретацию. Геометрический метод решения игры включает следующие этапы.

1. В декартовой системе координат по оси абсцисс откладывается отрезок А₁А₂, длина которого равна 1 (рис. 2.1.). Левый конец отрезка точка x = 0 соответствует стратегии A₁, правый, где х = 1,0 — стратегии А₂. Все промежуточные точки этого отрезка соответствуют смешанным стратегиям S₁ = (p₁, p₂).

2. По оси ординат от точки O откладываются выигрыши при стратегии А₁.

3. На линии, параллельной оси ординат, от точки 1 откладываются выигрыши при стратегии А₂ .

Пусть имеется игра с платежной матрицей:

Если игрок II применяет стратегию В₁, то выигрыш игрока I при использовании чистых стратегий А₁ и А₂ составляет соответственно a₁₁ = 0,4 и a₂₁ = 0,6. Соединим эти точки прямой В₁В₁ .

Если игрок I при стратегии В₁ применяет смешанную стратегию , то средний выигрыш, определяемый по формуле математического ожидания g₁ = a₁₁p₁ + a₂₁p₂, изображается ординатой точки N на прямой B₁B₁. Прямая B₁B₁ называется стратегией В₁. Ордината любой точки отрезка B₁B₁ равна величине выигрыша игрока I при применении им стратегии A₁и А₂ с соответствующими вероятностями p₁ и p₂.

Аналогично строим отрезок В₂В₂, сооветствующий применению игороком II с тратегии В₂ .

Ординаты точек отрезка определяют средний стратегий А₁ и А₂ с соответствующими вероятностями p₁ и p₂и равных g₂ = a₁₂p₁ + a₂₂p₂.

Пример № 1. Найти оптимальную смешанную стратегию руководителя коммерческого предприятия и гарантированный средний выигрыш при выборе из двух новых технологий продажи товаров и , если известны выигрыши каждого вида продажи по сравнению со старой технологией, которые представлены в виде матрицы игры.

Игрок II Игрок I
	0,4	0,9	0,4
	0,6	0,5	0,5
	0,6	0,9

Решение: находим гарантированный выигрыш определяемый нижней ценой игры которая указывает на максиминную чистую стратегию . Верхняя цена игры что свидетельствует об отсутствии седловой точки, т.к. , тогда цена игры находиться в пределах находим решение игры в смешанных стратегиях геометрическим методам рис. 2.1.

Рис. 2.1. Геометрический метод решения игры

Оптимальная смешанная стратегия и цена игры ровны.

Гарантированный средний выигрыш составляет 0,57.

3.6. Метод линейного программирования.

Антагонистическую игру m ´ n (где m > 3, n > 3) с конечными значениями m и n можно свести к паре двойственных задач линейного программирования.

Рассмотрим игру m ´ n, заданную платежной матрицей:

При постановке задач, необходимо иметь в виду некоторые преобразования, которые помогают упростить сложную задачу путем изменения – уменьшения размерности платежной матрицы посредством выделения и исключения доминирующих и дублирующих стратегий. Стратегия игрока А_i доминирует над стратегией А_к, если при любом поведении противника даст не меньший выигрыш, а если такой же, то дублирует А_к. В таком случае все элементы i строки больше (доминируют) или равны (дублируют) всех элементов строки k.

Пример. С учетом вариантов конъюнктуры В₁, В₂, В₃, В₄, В₅сложившейся на рынке и поведения покупателей в микрорайоне города коммерческое предприятие разработало шесть технологий продажи товаров А_1,А_2, А₃, А₄, А₅, А₆. Найти оптимальное решение. Возможные варианты среднедневного товарооборота в млн.руб. приведены в таблице:

	В₁	В₂	В₃	В₄	В₅
А₁	0,4	0,9	0,5	0,5	0,6
А₂	0,6	0,5	0,7	0,8	0,9
А₃	0,6	0,3	0,8	0,6	0,7
А₄	0,3	0,8	0,5	0,4	0,3
А₅	0,1	0,3	0,5	0,4	0,3
А₆	0,4	0,8	0,5	0,4	0,5

Стратегия А₁ доминирует над стратегией А₆, а стратегия А₄доминирует над стратегией А₅, следовательно исключаем 5 и 6 строки матрицы

	В₁	В₂	В₃	В₄	В₅
А₁	0,4	0,9	0,5	0,5	0,6
А₂	0,6	0,5	0,7	0,8	0,9
А₃	0,6	0,3	0,8	0,6	0,7
А₄	0,3	0,8	0,5	0,4	0,3

С позиций проигрышей строки В стратегии В_3,В₄ и В₅ доминируют над стратегией В_1,поэтому эти столбцы исключаем из таблицы:

	В₁	В₂
А₁	0,4	0,9
А₂	0,6	0,5
А₃	0,6	0,3
А₄	0,3	0,8

С позиций игрока А стратегия А₁ доминирует над стратегией А₄, а стратегия А₂ доминирует над стратегией А₃, следовательно исключаем 3 и 4 строки матрицы:

	В₁	В₂
А₁	0,4	0,9
А₂	0,6	0,5

Допустим, что все элементы (выигрыши) платежной матрицы положительны (a_ij ³ 0) (если это не так, то можно ко всем элементам прибавлять достаточно большое число M, сделав их положительными. При этом цена игры увеличится на M, а решение задачи и не изменится). Если все a_ij ³ 0, то g > 0. Пусть платежная матрица не содержит седловой точки, т.е. игра решается в смешанных стратегиях:

Применение игроком I оптимальной смешанной стратегии гарантирует ему средний выигрыш, не меньше цены игры g, независимо от поведения игрока II. Игрок II, применяя оптимальную смешанную стратегию гарантирует для себя минимальный проигрыш (не больше g).

Если игрок II применяет свою чистую стратегию B_j, а игрок I — свою оптимальную стратегию , то средний выигрыш игрока I равен:

Если игрок I применяет чистую стратегию А_i, а игрок II – свою оптимальную смешанную стратегии , то средний выигрыш игрока II составит

Учитывая, что g_j не может быть меньше g для игрока I, а и не может быть больше g для игрока II, двойственную задачу линейного программирования можно записать следующим образом:

1) для игрока I:

2) для игрока II:

Смысл этих систем уравнений заключается в следующем: игрок I стремится увеличить цену игры (g ® max), он действует так, чтобы его средний выигрыш при использовании его стратегий с вероятностями p_i для любой j-й стратегии игрока II был не меньше величины g, которую он стремится увеличить. Игрок II с

<== предыдущая страница	\|	следующая страница ==>
Глава I. Линейное программирование	\|	Определение неприступного расстояния

Дата добавления: 2014-10-14; просмотров: 487; Нарушение авторских прав

Мы поможем в написании ваших работ!

lektsiopedia.org - Лекциопедия - 2013 год. | Страница сгенерирована за: 0.253 сек.