Дипломная работа на тему "Теория игр"

ГлавнаяПедагогика → Теория игр




Не нашли то, что вам нужно?
Посмотрите вашу тему в базе готовых дипломных и курсовых работ:

(Результаты откроются в новом окне)

Текст дипломной работы "Теория игр":


ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ

Государственное образовательное учреждение высшего профессионального образования

"ЧЕЛЯБИНСКИЙ ГОСУДАРСТВЕННЫЙ ПЕДАГОГИЧЕСКИЙ УНИВЕРСИТЕТ"

Кафедра информатики и методики преподавания информатики

Квалификационная работа

ТЕОРИЯ ИГР В НАЧАЛЬНОЙ ШКОЛЕ

Исполнитель:

Новикова Ксения Сергеевна,

студентка группы 591

Научный руководитель:

Дмитриева О. А.,

ассистент кафедры ИМПИ

Зав. к афедрой:

Матрос Д. Ш.,

докт. пед. наук, профессор

Дата допуска к защите:

Челябинск 2007

Содержание

Введение

Заказать написание дипломной - rosdiplomnaya.com

Специальный банк готовых защищённых на хорошо и отлично дипломных проектов предлагает вам скачать любые проекты по нужной вам теме. Качественное написание дипломных работ по индивидуальным требованиям в Перми и в других городах РФ.

Глава I Основные положения Теории игр

1.1 Предмет и задачи теории игр

1.2 Решение матричной игры в чистых стратегиях

1.3 Решение матричной игры в смешанных стратегиях

1.4 Решение игр графическим методом

1.5 Сведение матричной игры к задаче линейного программирования

1.6 Игры с природой

Выводы по I главе

Глава II Разработка элективного курса “Элементы теории игр в начальной школе”

2.1 Место компьютера в начальной школе

2.3 Игра как метод обучения в начальной школе

2.4 Анализ программ и стандарта по информатике в начальной школе

2.5 Элективный курс

2.6 Педагогический эксперимент

2.7 Описание программного продукта

Выводы по II главе

Заключение

Список использованной литературы

Приложения


Введение

Теория игр была основана Джоном фон Нейманом и Оскаром Моргенштерном в их первой работе "The Theory of Games and Economic Behavior", изданной в 1944 году. В 1928 году в математических анналах фон Нейманом была опубликована статья "О теории общественных игр", в которой впервые было применено понятие "теория игр". Использование этого понятия объясняется схожестью логики принятия решений в таких играх, как шахматы и покер. Характерным для таких ситуаций является то, что результат для принимающего решение зависит не только от его решения, но и от того, какое решение примут другие. Поэтому оптимальный исход не может быть получен в результате принятия решения одним лицом.

Другим предшественником теории игр по праву считается французский математик Э. Борель (1871-1956). Некоторые фундаментальные идеи были независимо предложены А. Вальдом (1902-1950), заложившим основы нового подхода к статистической теории принятия решений.

Первые приложения теория игр нашла в математической статистике. Во время второй мировой войны и сразу после нее теорией игр серьезно заинтересовались военные, которые увидели в ней аппарат для исследования стратегических решений. Ее использовали как плодотворный источник теоретических моделей в экономике и социологии. Методы теории игр используются также в теории операций и в линейном программировании.

В начальной школе для обучения детей используют различные правила и инструкции, поэтому в этом возрасте можно развивать у них алгоритмическое мышление, которое не только приводит к более прочному усвоению знаний, но и к вхождению в компьютерный мир.

Изучение "Теории игр" в начальной школе поможет сформировать у детей умение анализировать условие задачи, продумывать последовательность действий, направленных на ее выполнение. Контролировать правильность своих действий на всех этапах работы и корректировать их в случаях допущенной ошибки, то есть направить учащихся на формирование широкого спектра умений, которые будут необходимы в дальнейшей учебной и учебно-трудовой деятельности ребенка, а в будущем и любой профессиональной деятельности.

Цель: изучение теоретических положений по теории игр и создание элективного курса "Элементы теории игр в начальной школе" с методической поддержкой.

Объект исследования: Теория игр

Предмет исследования: Обучение теории игр в начальной школе.

Задачи исследования:

изучить теоретический материал

отобрать задачи для практической реализации

разработать алгоритмы решения задач

программно реализовать отобранные задачи

разработать элективный курс

создать электронное пособие

Гипотеза: если в процессе обучения использовать понятие выигрышной стратегии, то это будет способствовать развитию логического мышления и сообразительности у младших школьников, а также повысит общий уровень подготовки по информатике.

Новизна работы заключается в следующем:

На данный момент не существует школьного курса по теме теории игр в начальной школе.

Создана программная поддержка, позволяющая осуществить эффективное изучение данной темы в начальной школе.

Разработан элективный курс “Элементы теории игр в начальной школе" и программно-методическая поддержка к нему.


Глава I Основные положения Теории игр 1.1 Предмет и задачи теории игр

В процессе целенаправленной человеческой деятельности возникают ситуации, в которых интересы отдельных лиц (участников, групп, сторон) либо прямо противоположны (антагонистичны), либо, не будучи непримиримыми, все же не совпадают. Простейшими и наиболее наглядными примерами таких ситуаций являются спортивные игры, арбитражные споры, военные учения (маневры), борьба между блоками избирателей за своих кандидатов, в международных отношениях - отстаивание интересов своего государства и т. п. Здесь каждый из участников сознательно стремится добиться наилучшего результата за счет другого участника. Подобного рода ситуации встречаются и в различных сферах производственной деятельности.

Все ситуации, когда эффективность действия одного из участников зависит от действий других, можно разбить на два типа: интересы участников совпадают, и они могут договориться о совместных действиях; интересы участников не совпадают. В этих случаях может оказаться невыгодным сообщать другим участникам свои решения, так как кто-нибудь из них сможет воспользоваться знанием чужих решений и получит больший выигрыш за счет других участников. Ситуации такого типа называются конфликтными.

Для указанных ситуаций характерно, что эффективность решений, принимаемых в ходе конфликта каждой из сторон, существенно зависит от действий другой стороны. При этом ни одна из сторон не может полностью контролировать положение, так как и той и другой стороне решения приходится принимать в условиях неопределенности. Так, при определении объема выпуска продукции на одном предприятии нельзя не учитывать размеров выпуска аналогичной продукции на других предприятиях. В реальных условиях нередко возникают ситуации, в которых антагонизм отсутствует, но существуют противоположные тенденции. Например, для нормального функционирования производства, с одной стороны, необходимо наличие запасов разнообразных ресурсов, но с другой - стремление к чрезвычайному увеличению этих запасов вызывает дополнительные затраты по их содержанию и хранению. В приведенных примерах конфликтные ситуации возникают в результате сознательной деятельности людей. Однако на практике встречаются неопределенности, которые порождаются не сознательным противодействием другой стороны, а недостаточной информированностью об условиях проведения планируемой операции.

Раздел математики, изучающий конфликтные ситуации на основе их математических моделей, называется теорией игр. Таким образом, теория игр - это математическая теория конфликтных ситуаций, разрабатывающая рекомендации по наиболее рациональному образу действий каждого из участников в ходе конфликтной ситуации, т. е. таких действий, которые обеспечивали бы ему наилучший результат. Игровую схему можно придать многим ситуациям в экономике. Здесь выигрышем могут быть эффективность использования дефицитных ресурсов, производственных фондов, величина прибыли, себестоимость и т. д.

Необходимо подчеркнуть, что методы и рекомендации теории игр разрабатываются применительно к таким специфическим конфликтным ситуациям, которые обладают свойством многократной повторяемости. Если конфликтная ситуация реализуется однократно или ограниченное число раз, то рекомендации теории игр теряют смысл.

Чтобы проанализировать конфликтную ситуацию по ее математической модели, ситуацию необходимо упростить, учтя лишь важнейшие факторы, существенно влияющие на ход конфликта.

Определение 1. Игрой называется упрощенная математическая модель конфликтной ситуации, отличающаяся от реального конфликта тем, что ведется по определенным правилам.

Игра - это совокупность правил, определяющих возможные действия (чистые стратегии) участников игры. Суть игры в том, что каждый из участников принимает такие решения в развивающейся конфликтной ситуации, которые, как он полагает, могут обеспечить ему наилучший исход. Исход игры - это значение некоторой функции, называемой функцией выигрыша (платежной функцией), которая может задаваться либо аналитически выражением, либо таблично (матрицей). Величина выигрыша зависит от стратегии, применяемой игроком.

Человечество издавна пользуется такими формализованными моделями конфликтных ситуаций, которые являются играми в буквальном смысле слова. Примерами могут служить шашки, шахматы, карточные игры и т. д. Все эти игры носят характер соревнования, протекающего по известным правилам и заканчивающего "победой" (выигрышем) того или иного игрока.

Такие формально регламентированные, искусственно организованные игры представляют собой наиболее подходящий материал для иллюстрации и усвоения основных понятий теории игр. Терминология, заимствованная из практики таких игр, применяется и при анализе других конфликтных ситуаций: стороны, участвующие в них, условно именуются "игроками", а результат столкновения - "выигрышем" одной из сторон.

Определение 2. Под "правилами игры" подразумевается система условий, регламентирующая возможные варианты действий обеих сторон.

Определение 3. Стратегией игрока называется совокупность правил, однозначно определяющих последовательность действий игрока в каждой конкретной ситуации, складывающейся в процессе игры.

Определение 4. Оптимальной называется стратегия, которая при многократном повторении игры обеспечивает данному игроку максимально возможный средний выигрыш.

Основное предположение, исходя из которого находят оптимальные стратегии, состоит в том, что противник по меньшей мере так же разумен, как и сам игрок, и делает все для того, чтобы добиться своей цели.

Количество стратегий у каждого игрока может быть конечным или бесконечным, в зависимости от этого игры подразделяются на конечные и бесконечные.

Всякая игра состоит из отдельных партий.

Определение 5. Партией называется каждый вариант реализации игры определенным образом.

В свою очередь, в партии игроки совершают конкретные ходы.

Определение 6. Ходом называется выбор и реализация игроком одного из допустимых вариантов поведения.

Ходы бывают личные и случайные. При личном ходе игрок самостоятельно и осознанно выбирает и реализует ту или иную чистую стратегию. Набор возможных вариантов при каждом личном ходе регламентирован правилами игры и зависит от всей совокупности предшествующих ходов обеих сторон. Например, в шахматах каждый ход является личным. При случайном ходе выбор чистой стратегии производится с использованием какого-либо механизма случайного выбора, например с применением таблицы случайных чисел. Примером могут служить бросание монеты или игральной кости.

Конфликтные ситуации, встречающиеся в практике, порождают различные виды игр. Классифицировать игры можно по разным признакам. Различают, например, игры по количеству игроков. В игре может участвовать любое конечное число игроков.

Определение 7. Если в игре игроки объединяются в две группы, преследующие противоположные цели, то такая игра называется игрой двух лиц (парная игра).

В зависимости от количества стратегий в игре они делятся на конечные или бесконечные. В зависимости от взаимоотношений участников различают игры бескоалиционные (участники не имеют права заключать соглашения), или некооперативные, и коалиционные, или кооперативные. По характеру выигрышей игры делятся на игры с нулевой суммой и ненулевой суммой.

Определение 8. Игрой с нулевой суммой называется игра, в которой общий капитал игроков не меняется, а лишь перераспределяется в ходе игры, в связи с чем сумма выигрышей равна нулю (проигрыш принимается как отрицательный выигрыш).

В играх с ненулевой суммой сумма выигрышей отлична от нуля. Например, при проведении лотереи часть взноса участников идет организатору лотереи.

По виду функции выигрыша игры делятся на матричные, биматричные, непрерывные, выпуклые, сепарабельные и др.

Определение 9. Матричной игрой (при двух участниках) называется игра, в которой выигрыши первого игрока (проигрыши второго игрока) задаются матрицей.

В биматричных играх выигрыши каждого игрока задаются своей матрицей. Другие типы таких игр различаются видом аналитического выражения платежной функции. По количеству ходов игры делятся на одноходовые (выигрыш распределяется после одного хода каждого игрока) и многоходовые (выигрыш распределяется после нескольких ходов). Многоходовые игры в свою очередь делятся на позиционные, стохастические, дифференциальные и др. В зависимости от объема имеющейся информации различают игры с полной и неполной информацией.

В реальных конфликтных ситуациях каждый из игроков сознательно стремится найти наилучшее для себя поведение, имея общее представление о множестве допустимых для партнера ответных действий, но не ведая о том, какое же конкретное решение будет выбрано им в данный момент. В этом проявляется в равной мере неопределенность ситуации для каждого из партнеров.

Определение 10. Игры, в которых участники стремятся добиться для себя наилучшего результата, сознательно выбирая допустимые правилами игры способы действий, называются стратегическими.

Однако в экономической практике нередко приходится формализовать (моделировать) ситуации, придавая им игровую схему, в которых один из участников безразличен к результату игры. Такие игры называют играми с природой, понимая под термином "природа" всю совокупность внешних обстоятельств, в которых сознательному игроку (его называют иногда статистиком, а соответствующую игру - статистической) приходится принимать решение. Например, выбор агрономической службой сельскохозяйственного предприятия участков для посева той или иной культуры в надежде получить в предстоящем году наилучший урожай; определение объема выпуска сезонной продукции в ожидании наиболее выгодного для ее реализации уровня спроса; формирование пакета ценных бумаг в расчете на высокие дивиденды и т. п. Здесь в качестве второго игрока выступает: в первом примере - в буквальном смысле природа; во втором - уровень спроса; в третьем - размеры ожидаемой прибыли.

В играх с природой степень неопределенности для сознательного игрока (статистика) возрастает: если в стратегических играх каждый из участников постоянно ожидает наихудшего для себя ответного действия партнера, то в статистических играх "природа", будучи индифферентной в отношении выигрыша инстанцией, может предпринимать и такие ответные действия (будем говорить: реализовывать такие состояния), которые ей совершенно невыгодны, а выгодны сознательному игроку (статистику).

В дальнейшем мы будем рассматривать только парные матричные игры с нулевой суммой. Так как в случае конечной игры двух лиц функции выигрыша каждого из игроков удобно представлять в виде матрицы выигрышей, где строки представляют стратегии одного игрока, столбцы - стратегии другого игрока, а в клетках матрицы указываются выигрыши каждого из игроков в каждой из образующихся ситуаций. [9, 16, 17, 40, 46]


1.2 Решение матричной игры в чистых стратегиях

Рассмотрим простейшую математическую модель конечной конфликтной ситуации, в которой имеется два участника и выигрыш одного равен проигрышу другого. Такая модель называется антагонистической игрой двух лиц с нулевой суммой. Игра состоит из двух ходов: игрок А выбирает одну из возможных стратегий Аi, Рисунок убран из работы и доступен только в оригинальном файле., а игрок В выбирает одну из возможных стратегий Вj, Рисунок убран из работы и доступен только в оригинальном файле.. Каждый выбор производится при полном незнании выбора соперника. В результате выигрыш игроков составит соответственно aij и - aij. Цель игрока А - максимизировать величину aij, а игрока В - минимизировать эту величину.

Определение 1. Матрица, составленная из величин aij, Рисунок убран из работы и доступен только в оригинальном файле.,Рисунок убран из работы и доступен только в оригинальном файле.,

Рисунок убран из работы и доступен только в оригинальном файле.

называется платежной матрицей, или матрицей игры. Каждый элемент платежной матрицы aij, Рисунок убран из работы и доступен только в оригинальном файле.,Рисунок убран из работы и доступен только в оригинальном файле.равен выигрышу А (проигрышу В), если он выбрал стратегию Аi, Рисунок убран из работы и доступен только в оригинальном файле., а игрок В выбирал стратегию Вj, Рисунок убран из работы и доступен только в оригинальном файле..

Пример. В игре участвуют первый и второй игроки, каждый из них может записать независимо от другого цифры 1, 2 и 3. Если разность между цифрами, записанная игроками, положительна, то первый игрок выигрывает количество очков, равное разности между цифрами, и, наоборот, если разность отрицательна, то выигрывает второй игрок. Если разность равна нулю, то игра заканчивается вничью.

У первого игрока три стратегии (варианта действия): А1 (записать 1), А2 (записать 2), А3 (записать 3); у второго игрока также три стратегии: В1, В2, В3 (табл.1).

Таблица 1

--------------------------------------------------

В1 = 1

|

В2 = 2

|

В3 = 3

|
---------------------------------------------------------

А1 = 1

| 0 | -1 | -2 |
---------------------------------------------------------

А2 = 2

| 1 | 0 | -1 |
---------------------------------------------------------

А3 = 3

| 2 | 1 | 0 |
--------------------------------------------------------- --------------------------------------------------

Задача первого игрока - максимизировать свой выигрыш. Задача второго игрока - минимизировать свой проигрыш или минимизировать выигрыш первого игрока. Платежная матрица имеет вид

Рисунок убран из работы и доступен только в оригинальном файле..

Задача каждого из игроков - найти наилучшую стратегию игры, при этом предполагается, что противники одинаково разумны и каждый из них делает все, чтобы получить наибольший доход.

Найдем наилучшую стратегию первого игрока. Если игрок А выбрал стратегию Аi, Рисунок убран из работы и доступен только в оригинальном файле., то в худшем случае (например, если его ход известен В) он получит выигрыш Рисунок убран из работы и доступен только в оригинальном файле.. Предвидя такую возможность, игрок А должен выбрать такую стратегию, чтобы максимизировать свой минимальный выигрыш.

Рисунок убран из работы и доступен только в оригинальном файле..

Определение 2. Величина a - гарантированный выигрыш игрока А называется нижней ценой игры. Стратегия Aiопт, обеспечивающая получение выигрыша a, называется максиминной.

Если первый игрок будет придерживаться своей максиминной стратегии, то у него есть гарантия, что он в любом случае выиграет не меньше a.

Аналогично определяется наилучшая стратегия второго игрока. Игрок В при выборе стратегии Вj, Рисунок убран из работы и доступен только в оригинальном файле. в худшем случае получит проигрыш Рисунок убран из работы и доступен только в оригинальном файле.. Он выбирает стратегию Bjопт, при которой его проигрыш будет минимальным и составит

Рисунок убран из работы и доступен только в оригинальном файле..

Определение 3. Величина b - гарантированный проигрыш игрока В называется верхней ценой игры. Стратегия Bjопт, обеспечивающая получение проигрыша b, называется минимаксной.

Если второй игрок будет придерживаться своей минимаксной стратегии, то у него есть гарантия, что он в любом случае проиграет не больше b.

Фактический выигрыш игрока А (проигрыш игрока В) при разумных действиях партнеров ограничен верхней и нижней ценой игры. Для матричной игры справедливо неравенство a £ b.

Определение 4. Если a = b =v, т. е.

Рисунок убран из работы и доступен только в оригинальном файле.=Рисунок убран из работы и доступен только в оригинальном файле.,

то выигрыш игрока А (проигрыш игрока В) определяется числом v. Оно называется ценой игры.

Определение 5. Если a = b =v, то такая игра называется игрой с седловой точкой, элемент матрицы аiопт jопт = v, соответствующий паре оптимальных стратегий (Aiопт, Bjопт), называется седловой точкой матрицы. Этот элемент является ценой игры.

Седловой точке соответствуют оптимальные стратегии игроков. Их совокупность - решение игры, которое обладает свойством: если один из игроков придерживается оптимальной стратегии, то второму отклонение от своей оптимальной стратегии не может быть выгодным.

Определение 6. Если игра имеет седловую точку, то говорят, что она решается в чистых стратегиях.

Найдем решение игры рассмотренного выше примера:

Рисунок убран из работы и доступен только в оригинальном файле.,

a = a3 - нижняя цена игры.

Рисунок убран из работы и доступен только в оригинальном файле.,

b = b3 - верхняя цена игры.

Так как a = b = 0, матрица игры имеет седловую точку.

Оптимальная стратегия первого игрока - А3, второго - B3. Из таблицы видно, что отклонение первого игрока от оптимальной стратегии уменьшает его выигрыш, а отклонение второго игрока от В3 увеличивает его проигрыш.

Наличие седловой точки в игре - это далеко не правило, скорее, исключение. Существует разновидность игр, которые всегда имеют седловую точку и, значит, решаются в чистых стратегиях. Это так называемые игры с полной информацией.

Определение 7. Игрой с полной информацией называется такая игра, в которой каждый игрок при каждом личном ходе знает всю предысторию ее развития, т. е. результаты всех предыдущих ходов.

Примерами игр с полной информацией могут служить шашки, шахматы, "крестики-нолики" и т. д.

Теорема 1. Каждая игра с полной информацией имеет седловую точку и, значит, имеет решение в чистых стратегиях.

В каждой игре с полной информацией существует пара оптимальных стратегий, дающая устойчивый выигрыш, равный цене игры v. Если решение игры известно, сама игра теряет смысл. Например, шахматная игра либо кончается выигрышем белых, либо выигрышем черных, либо ничьей, только чем именно - мы пока не знаем (к счастью для любителей шахмат). Прибавим еще: вряд ли будем знать в обозримом будущем, так как число стратегий так велико, что крайне трудно привести шахматную игру к матричной форме и найти в ней седловую точку. Указать откуда это взялось, т. е. указать ссылки

1.3 Решение матричной игры в смешанных стратегиях

Если платежная матрица не имеет седловой точки, т. е. a <b и Рисунок убран из работы и доступен только в оригинальном файле., то поиск решения игры приводит к применению сложной стратегии, состоящей в случайном применении двух и более стратегий с определенными частотами.

Определение 1. Сложная стратегия, состоящая в случайном применении всех стратегий с определенными частотами, называется смешанной.

В игре, матрица которой имеет размерность m ´ n, стратегии первого игрока задаются наборами вероятностей Рисунок убран из работы и доступен только в оригинальном файле. (x1, x2,..., xm), с которыми игрок применяет свои чистые стратегии. Эти наборы можно рассмотреть как m-мерные векторы, для координат которых выполняются условия

Рисунок убран из работы и доступен только в оригинальном файле., xi ³ 0, Рисунок убран из работы и доступен только в оригинальном файле..

Аналогично для второго игрока наборы вероятностей определяют n-мерные векторы Рисунок убран из работы и доступен только в оригинальном файле. (y1, y2,..., yn), для координат которых выполняются условия

= 1, yj ³ 0, Рисунок убран из работы и доступен только в оригинальном файле..

Выигрыш первого игрока при использовании смешанных стратегий определяют как математическое ожидание выигрыша, т. е. он равен

Рисунок убран из работы и доступен только в оригинальном файле..

Теорема 1. (Неймана. Основная теорема теории игр) Каждая конечная игра имеет, по крайней мере, одно решение, возможно, в области смешанных стратегий. Применение оптимальной стратегии позволяет получить выигрыш, равный цене игры: a £ v £ b. Применение первым игроком оптимальной стратегии Рисунок убран из работы и доступен только в оригинальном файле.опт должно обеспечить ему при любых действиях второго игрока выигрыш не меньше цены игры. Поэтому выполняется соотношение

Рисунок убран из работы и доступен только в оригинальном файле., Рисунок убран из работы и доступен только в оригинальном файле..

Аналогично для второго игрока оптимальная стратегия Рисунок убран из работы и доступен только в оригинальном файле.опт должна обеспечить при любых стратегиях первого игрока проигрыш, не превышающий цену игры, т. е. справедливо соотношение

Рисунок убран из работы и доступен только в оригинальном файле., Рисунок убран из работы и доступен только в оригинальном файле..

Если платежная матрица не содержит седловой точки, то задача определения смешанной стратегии тем сложнее, чем больше размерность матрицы. Поэтому матрицы большой размерности целесообразно упростить, уменьшив их размерность путем вычеркивания дублирующих (одинаковых) и не доминирующих стратегий.

Определение 2. Дублирующими называются стратегии, у которых соответствующие элементы платежной матрицы одинаковы.

Определение 3. Если все элементы i-й строки платежной матрицы больше соответствующих элементов k-й строки, то i-я стратегия игрока А называется доминирующей над k-й стратегией. Если все элементы j-го столбца платежной матрицы меньше соответствующих элементов k-го столбца, то j-я стратегия игрока В называется доминирующей над k-й стратегией.

Пример. Рассмотрим игру, представленную платежной матрицей

Рисунок убран из работы и доступен только в оригинальном файле..

a = max (2, 2, 3,2) = 3, b = min (7, 6, 6, 4,5) = 4, a ¹ b, Рисунок убран из работы и доступен только в оригинальном файле..

Все элементы стратегии А2 меньше элементов стратегии А3, т. е. А2 заведомо невыгодна для первого игрока и ее можно исключить. Все элементы А4 меньше А3, исключаем А4.

Рисунок убран из работы и доступен только в оригинальном файле..

Для второго игрока: сравнивая В1 и В4, исключаем В1; сравнивая В2 и В4, исключаем В2; сравнивая В3 и В4, исключаем В3. В результате преобразований получим матрицу

Рисунок убран из работы и доступен только в оригинальном файле..

a = max (2,3) = 3, b = min (4,5) = 4, a ¹ b, Рисунок убран из работы и доступен только в оригинальном файле..

1.4 Решение игр графическим методом

Графический метод применим к играм, в которых хотя бы один игрок имеет только две стратегии.

Первый случай. Рассмотрим игру (2 ´ 2) с матрицей

Рисунок убран из работы и доступен только в оригинальном файле.

без седловой точки. Решением игры являются смешанные стратегии игроков Рисунок убран из работы и доступен только в оригинальном файле. (x1, x2) и Рисунок убран из работы и доступен только в оригинальном файле. (y1, y2), где x1 - вероятность применения первым игроком первой стратегии, x2 - вероятность применения первым игроком второй стратегии, y1 - вероятность применения вторым игроком первой стратегии, y2 - вероятность применения вторым игроком второй стратегии. Очевидно, что

x1 + x2 = 1, y1 + y2 = 1.

Найдем решение игры графическим методом. На оси ОX отложим отрезок, длина которого равна единице. Левый конец (x = 0) соответствует стратегии первого игрока А1, правый (x = 1) - стратегии А2. Внутренние точки отрезка будут соответствовать смешанным стратегиям Рисунок убран из работы и доступен только в оригинальном файле. (x1, x2) первого игрока, где x1 =1 - x2. Через концы отрезка проведем прямые, перпендикулярные оси ОX, на которых будем откладывать выигрыш при соответствующих чистых стратегиях. Если игрок В применяет стратегию В1, то выигрыш при использовании первым игроком стратегий А1 и А2 составит соответственно а11 и а21. Отложим эти точки на прямых и соединим их отрезком В1В1. Если игрок А применяет смешанную стратегию, то выигрышу соответствует некоторая точка М, лежащая на этом отрезке. (см. рис.1)

Рисунок убран из работы и доступен только в оригинальном файле.

В1 а21

М

В1

а11

х2 х11 Х

Рис.1. Подписать рисунок

Аналогично строится отрезок В2В2, соответствующий стратегии В2 игрока В.

Определение 1. Ломаная линия, составленная из частей отрезков, интерпретирующих стратегии игрока В, расположенная ниже всех отрезков, называется нижней границей выигрыша, получаемого игроком А.

Определение 2. Стратегии, части которых образуют нижнюю границу выигрыша, называются активными стратегиями.

В игре (2 ´ 2) обе стратегии являются активными.

Рисунок убран из работы и доступен только в оригинальном файле. В1 а21

В2

а12 К

В2 а22

В1

а11 v

О х2 N х1 1 Х

Рис.2.

Ломаная В1КВ2 является нижней границей выигрыша, получаемого игроком А. (см. рис.2) Точка К, в которой он максимален, определяет цену игры и ее решение. Найдем оптимальную стратегию первого игрока. Запишем систему уравнений

Рисунок убран из работы и доступен только в оригинальном файле.

Приравнивая выражения для v из уравнений системы и учитывая, что

x1 + x2 = 1, получим Рисунок убран из работы и доступен только в оригинальном файле., Рисунок убран из работы и доступен только в оригинальном файле., (1)

Рисунок убран из работы и доступен только в оригинальном файле.. (2)

Составляя аналогичную систему

Рисунок убран из работы и доступен только в оригинальном файле.

и учитывая условие

y1 + y2 = 1,

можно найти оптимальную стратегию игрока В:

Рисунок убран из работы и доступен только в оригинальном файле.Рисунок убран из работы и доступен только в оригинальном файле.. (3)

Пример 1. Найти решение игры, заданной матрицей

Рисунок убран из работы и доступен только в оригинальном файле..

--------------------------------------------------

---------------------------------------------------------
Рисунок убран из работы и доступен только в оригинальном файле. |
--------------------------------------------------------- --------------------------------------------------
a = max (1,1) = 1, b = min (3,2) = 2, a ¹ b, Рисунок убран из работы и доступен только в оригинальном файле.. Игра не имеет седловой точки. Оптимальное решение следует искать в области смешанных стратегий. Построим на плоскости отрезки, соответствующие стратегиям второго игрока. (см. рис.3)

Рис.3.

По формулам (1) - (3) находим оптимальные стратегии и цену игры:

x1 = 1/3, x2 = 2/3; y1 = 2/3, y2 = 1/3; v =5/3.

Ответ. Оптимальные смешанные стратегии игроков Рисунок убран из работы и доступен только в оригинальном файле. (1/3, 2/3) и Рисунок убран из работы и доступен только в оригинальном файле. (2/3, 1/3), цена игры составляет v =5/3.

Данный ответ означает следующее:

если первый игрок с вероятностью 1/3 будет применять первую стратегию и с вероятностью 2/3 вторую, то при достаточно большом количестве игр с данной матрицей его выигрыш в среднем составит не менее 5/3;

если второй игрок с вероятностью 2/3 будет применять первую стратегию и с вероятностью 1/3 вторую, то при достаточно большом количестве игр с данной матрицей его проигрыш в среднем составит не более 5/3.

Второй случай. Рассмотрим игру (2 ´ n) с матрицей

Рисунок убран из работы и доступен только в оригинальном файле..

Для каждой из n стратегий игрока В строится соответствующий ей отрезок на плоскости. Находится нижняя граница выигрыша, получаемого игроком А, и определяется точка на нижней границе, соответствующая наибольшему выигрышу. Выделяются две активные стратегии игрока В, отрезки которых проходят через данную точку. Далее рассматриваются только эти две стратегии игрока В. Игра сводится к игре с матрицей (2 ´ 2). Оптимальные стратегии и цену игры находят по формулам (1) - (3).

Пример 2. Найти решение игры, заданной матрицей

Рисунок убран из работы и доступен только в оригинальном файле..

a = max (1,1) = 1, b = min (4, 3, 3,4) = 3, a ¹ b, Рисунок убран из работы и доступен только в оригинальном файле..

Игра не имеет седловой точки. Оптимальное решение следует искать в области смешанных стратегий. Построим на плоскости отрезки, соответствующие стратегиям второго игрока. (см. рис.4)

--------------------------------------------------

---------------------------------------------------------
Рисунок убран из работы и доступен только в оригинальном файле. |
--------------------------------------------------------- --------------------------------------------------
Рис.4.

Нижней границей выигрыша для игрока А является ломаная В3КВ4. Стратегии В3 и В4 являются активными стратегиями игрока В. Точка их пересечения К определяет оптимальные стратегии игроков и цену игры. Второму игроку невыгодно применять стратегии В1 и В2, поэтому вероятность их применения равна нулю, т. е. у1 = у2= 0. Решение игры сводится к решению игры с матрицей (2 ´ 2)

Рисунок убран из работы и доступен только в оригинальном файле..

a = max (1,1) = 1, b = min (3,4) = 3, a ¹ b, Рисунок убран из работы и доступен только в оригинальном файле..

По формулам (1) - (3) находим оптимальные стратегии и цену игры:

x1 = 2/5, x2 = 3/5; y3 = 3/5, y2 = 2/5; v =11/5.

Ответ. Оптимальные смешанные стратегии игроков Рисунок убран из работы и доступен только в оригинальном файле. (2/5, 3/5) и Рисунок убран из работы и доступен только в оригинальном файле. (0, 0, 3/5, 2/5), цена игры составляет v =11/5.

Данный ответ означает следующее:

если первый игрок с вероятностью 2/5 будет применять первую стратегию и с вероятностью 3/5 вторую, то при достаточно большом количестве игр с данной матрицей его выигрыш в среднем составит не менее 11/5;

если второй игрок с вероятностью 3/5 будет применять третью стратегию, с вероятностью 2/5 четвертую и не будет использовать первую и вторую стратегии, то при достаточно большом количестве игр с данной матрицей его проигрыш в среднем составит не более 11/5.

Третий случай. Рассмотрим игру (m ´ 2) с матрицей

Рисунок убран из работы и доступен только в оригинальном файле..

Решение игры может быть получено аналогично случаю два. Для каждой из m стратегий игрока А строится соответствующий ей отрезок на плоскости.

Находится верхняя граница проигрыша, получаемого игроком В, и определяется точка на нижней границе, соответствующая наименьшему проигрышу. Выделяются две активные стратегии игрока А, отрезки которых проходят через данную точку.

Далее рассматриваются только эти две стратегии игрока А. Игра сводится к игре с матрицей (2 ´ 2). Оптимальные стратегии и цену игры находят по формулам (1) - (3).

Пример 3. Найти решение игры, заданной матрицей

Рисунок убран из работы и доступен только в оригинальном файле..

a = max (3, 2, 0, - 1) = 3, b = min (4,6) = 4, a ¹ b, Рисунок убран из работы и доступен только в оригинальном файле.. Игра не имеет седловой точки. Оптимальное решение следует искать в области смешанных стратегий. Построим на плоскости отрезки, соответствующие стратегиям первого игрока. (см. рис.5).

--------------------------------------------------

---------------------------------------------------------
Рисунок убран из работы и доступен только в оригинальном файле. |
--------------------------------------------------------- --------------------------------------------------
Рис.5.

Верхней границей проигрыша для игрока В является ломаная А1КА4. Стратегии А1 и А4 являются активными стратегиями игрока А. Точка их пересечения К определяет оптимальные стратегии игроков и цену игры. Первому игроку невыгодно применять стратегии А2 и А3, поэтому вероятность их применения равна нулю, т. е. x2 = x3= 0. Решение игры сводится к решению игры с матрицей (2 ´ 2)

Рисунок убран из работы и доступен только в оригинальном файле..

a = max (3, - 1) = 3, b = min (4,6) = 4, a ¹ b, Рисунок убран из работы и доступен только в оригинальном файле..

По формулам (1) - (3) находим оптимальные стратегии и цену игры:

x1 = 7/8, x4 = 1/8; y1 = 3/8, y2 = 5/8; v =27/8.

Ответ. Оптимальные смешанные стратегии игроков Рисунок убран из работы и доступен только в оригинальном файле. (7/8, 0, 0, 1/8) и Рисунок убран из работы и доступен только в оригинальном файле. (3/8, 5/8), цена игры составляет v =27/8.

Данный ответ означает следующее:

если первый игрок с вероятностью 7/8 будет применять первую стратегию, с вероятностью 1/8 четвертую и не будет использовать вторую и третью стратегии, то при достаточно большом количестве игр с данной матрицей его выигрыш в среднем составит не менее 27/8;

если второй игрок с вероятностью 3/8 будет применять первую стратегию и с вероятностью 5/8 вторую, то при достаточно большом количестве игр с данной матрицей его проигрыш в среднем составит не более 27/8.

1.5 Сведение матричной игры к задаче линейного программирования

Теория игр находится в тесной связи с линейным программированием, так как каждая конечная игра двух лиц с нулевой суммой может быть представлена как задача линейного программирования и решена симплексным методом и, наоборот, каждая задача линейного программирования может быть представлена как конечная игра двух лиц с нулевой суммой. Рассмотрим игру двух лиц с нулевой суммой, заданную платежной матрицей

Рисунок убран из работы и доступен только в оригинальном файле..

Если платежная матрица не имеет седловой точки, т. е. a <b и Рисунок убран из работы и доступен только в оригинальном файле., то решение игры представлено в смешанных стратегиях Рисунок убран из работы и доступен только в оригинальном файле. (x1, x2,..., xm) и Рисунок убран из работы и доступен только в оригинальном файле. (y1, y2,..., yn). Применение первым игроком оптимальной стратегии Рисунок убран из работы и доступен только в оригинальном файле.опт должно обеспечить ему при любых действиях второго игрока выигрыш не меньше цены игры.

Рисунок убран из работы и доступен только в оригинальном файле., Рисунок убран из работы и доступен только в оригинальном файле..

Рассмотрим задачу отыскания оптимальной стратегии игрока А, для которой имеют место ограничения

Рисунок убран из работы и доступен только в оригинальном файле.

Величина v неизвестна, однако можно считать, что цена игры v > 0. Последнее условие выполняется всегда, если все элементы платежной матрицы неотрицательны, а этого можно достигнуть, прибавив ко всем элементам матрицы некоторое положительное число.

Преобразуем систему ограничений, разделив все члены неравенств на v.

Рисунок убран из работы и доступен только в оригинальном файле. (1)

где

Рисунок убран из работы и доступен только в оригинальном файле., Рисунок убран из работы и доступен только в оригинальном файле.. (2)

По условию x1 + x2 + … +xm = 1.

Разделим обе части этого равенства на v.

Рисунок убран из работы и доступен только в оригинальном файле..

Оптимальная стратегия Рисунок убран из работы и доступен только в оригинальном файле. (x1, x2,..., xm) игрока А должна максимизировать величину v, следовательно, функция

Рисунок убран из работы и доступен только в оригинальном файле. (3)

должна принимать минимальное значение.

Таким образом, получена задача линейного программирования: найти минимум целевой функции (3) при ограничениях (1), причем на переменные наложено условие неотрицательности (2). Решая ее, находим значения Рисунок убран из работы и доступен только в оригинальном файле., Рисунок убран из работы и доступен только в оригинальном файле. и величину 1/v, затем отыскиваются значения xi = vti.

Аналогично для второго игрока оптимальная стратегия Рисунок убран из работы и доступен только в оригинальном файле.опт должна обеспечить при любых стратегиях первого игрока проигрыш, не превышающий цену игры.

Рисунок убран из работы и доступен только в оригинальном файле., Рисунок убран из работы и доступен только в оригинальном файле..

Рассмотрим задачу отыскания оптимальной стратегии игрока B, для которой имеют место ограничения

Рисунок убран из работы и доступен только в оригинальном файле.

Преобразуем систему ограничений, разделив все члены неравенств на v.

Рисунок убран из работы и доступен только в оригинальном файле. (4) где Рисунок убран из работы и доступен только в оригинальном файле., Рисунок убран из работы и доступен только в оригинальном файле.. (5)

По условию y1 + y2 + … +yn = 1. Разделим обе части этого равенства на v.

Рисунок убран из работы и доступен только в оригинальном файле..

Оптимальная стратегия Рисунок убран из работы и доступен только в оригинальном файле. (y1, y2,..., yn) игрока В должна минимизировать величину v, следовательно, функция

Рисунок убран из работы и доступен только в оригинальном файле. (6)

должна принимать максимальное значение.

Получена задача линейного программирования: найти максимум целевой функции (6) при ограничениях (4), причем на переменные наложено условие неотрицательности (5).

Таким образом, для нахождения решения игры имеем симметричную пару двойственных задач линейного программирования. Можно найти решение одной из них, а решение второй находится с использованием теории двойственности.

Пример. Найти решение игры, заданной матрицей

Рисунок убран из работы и доступен только в оригинальном файле..

a = max (2, 3,1) = 3, b = min (4, 5, 6,5) = 4, a ¹ b, Рисунок убран из работы и доступен только в оригинальном файле..

Игра не имеет седловой точки. Оптимальное решение следует искать в области смешанных стратегий.

Для определения оптимальной стратегии игрока А имеем следующую задачу линейного программирования:

Рисунок убран из работы и доступен только в оригинальном файле.,

Рисунок убран из работы и доступен только в оригинальном файле.

Рисунок убран из работы и доступен только в оригинальном файле., Рисунок убран из работы и доступен только в оригинальном файле..

Для нахождения оптимальной стратегии игрока В имеем следующую задачу линейного программирования:

Рисунок убран из работы и доступен только в оригинальном файле.,

Рисунок убран из работы и доступен только в оригинальном файле.

Рисунок убран из работы и доступен только в оригинальном файле., Рисунок убран из работы и доступен только в оригинальном файле..

Оптимальные решения пары двойственных задач имеют вид

Рисунок убран из работы и доступен только в оригинальном файле., Рисунок убран из работы и доступен только в оригинальном файле., Рисунок убран из работы и доступен только в оригинальном файле..

Учитывая соотношения между xi и ti, yj и sj, а также равенство

Рисунок убран из работы и доступен только в оригинальном файле.,

можно найти оптимальные стратегии игроков и цену игры:

Рисунок убран из работы и доступен только в оригинальном файле. (1/2, 1/2, 0), Рисунок убран из работы и доступен только в оригинальном файле. (3/4, 0, 0, 1/4), v=7/2.


1.6 Игры с природой

В рассмотренных выше матричных играх предполагалось, что в них принимают участие два игрока, интересы которых противоположны. Поэтому действия каждого игрока направлены на увеличение выигрыша (уменьшение проигрыша). Однако в некоторых задачах, приводящихся к игровым, имеется неопределенность, вызванная отсутствием информации об условиях, в которых осуществляется действие (погода, покупательский спрос и т. д.). Эти условия зависят не от сознательных действий другого игрока, а от объективной действительности. Такие игры называются играми с природой. Человек в играх с природой старается действовать осмотрительно, второй игрок (природа, покупательский спрос) действует случайно.

Условия игры задаются матрицей

Рисунок убран из работы и доступен только в оригинальном файле..

Пусть игрок А имеет стратегии А1, А2, …, Аm, а природа - состояния В1, В2, …, Вn. Наиболее простой является ситуация, когда известна вероятность pj каждого состояния природы Вj. При этом, если учтены все возможные состояния, p1 + p2 + … + pj + … + pn = 1.

Если игрок А выбирает чистую стратегию Аi, то математическое ожидание выигрыша составит p1 ai1 + p2 ai2 + … + pn ain. Наиболее выгодной будет та стратегия, при которой достигается

Рисунок убран из работы и доступен только в оригинальном файле.  (p1 ai1 + p2 ai2 + … + pn ain).

Рисунок убран из работы и доступен только в оригинальном файле. 

Если информация о состояниях с природой мала, то можно применить принцип недостаточного основания Лапласа, согласно которому можно считать, что все состояния природы равновероятностны:

,

т. е. стратегию, для которой среднее арифметическое элементов соответствующей строки максимальное.

Имеется ряд критериев, которые используются при выборе оптимальной стратегии. Рассмотрим некоторые из них.

1. Критерий Вальда. Рекомендуется применять максиминную стратегию. Она выбирается из условия

Рисунок убран из работы и доступен только в оригинальном файле.

и совпадает с нижней ценой игры. Критерий является пессимистическим, считается, что природа будет действовать наихудшим для человека способом.

2. Критерий максимума. Он выбирается из условия

Рисунок убран из работы и доступен только в оригинальном файле..

Критерий является оптимистическим, считается, что природа будет наиболее благоприятна для человека.

3. Критерий Гурвица. Критерий рекомендует стратегию, определяемую по формуле

Рисунок убран из работы и доступен только в оригинальном файле.,

где a - степень оптимизма и изменяется в диапазоне [0, 1].

Критерий придерживается некоторой промежуточной позиции, учитывающей возможность как наихудшего, так и наилучшего поведения природы. При a = 1 критерий превращается в критерий Вальда, при a = 0 - в критерий максимума. На a оказывает влияние степень ответственности лица, принимающего решение по выбору стратегии. Чем больше последствия ошибочных решений, больше желания застраховаться, тем a ближе к единице.

4. Критерий Сэвиджа. Суть критерия состоит в выборе такой стратегии, чтобы не допустить чрезмерно высоких потерь, к которым она может привести. Находится матрица рисков, элементы которой показывают, какой убыток понесет человек (фирма), если для каждого состояния природы он не выберет наилучшей стратегии.

Рисунок убран из работы и доступен только в оригинальном файле..

Элементы матрицы рисков находятся по формуле

,

где - максимальный элемент в столбце исходной матрицы.

Оптимальная стратегия определяется выражением

Рисунок убран из работы и доступен только в оригинальном файле..

При принятии решений в условиях неопределенности следует оценивать различные варианты с точки зрения нескольких критериев. Если рекомендации совпадают, можно с большей уверенностью выбрать наилучшее решение; если рекомендации противоречат друг другу, окончательное решение надо принимать с учетом его сильных и слабых сторон.

Пример. Возможно строительство четырех типов электростанций: А1 (тепловых), А2 (приплотинных), А3 (бесшлюзовых), А4 (шлюзовых). Состояния природы обозначим через Р1, Р2, Р3, Р4. Экономическая эффективность строительства отдельных типов электростанций изменяется в зависимости от состояния природы и задана матрицей

Рисунок убран из работы и доступен только в оригинальном файле..

1) Согласно критерию Вальда

Рисунок убран из работы и доступен только в оригинальном файле.  Рисунок убран из работы и доступен только в оригинальном файле.,

Рисунок убран из работы и доступен только в оригинальном файле. 

следует строить бесшлюзовую электростанцию.

2) Воспользуемся критерием Сэвиджа. Построим матрицу рисков:

Рисунок убран из работы и доступен только в оригинальном файле..

Согласно критерию Сэвиджа определяем

Рисунок убран из работы и доступен только в оригинальном файле..

В соответствии с этим критерием также предлагается строить бесшлюзовую электростанцию.

3) Воспользуемся критерием Гурвица. Положим a=1/2.

Рисунок убран из работы и доступен только в оригинальном файле.,

т. е. следует принять решение о строительстве приплотинной электростанции.

4) Если принять известным распределение вероятностей для различных состояний природы, например считать эти состояния равновероятностными (р1=р2=р3=р4=1/4), то для принятия решения следует найти математические ожидания выигрыша:

Рисунок убран из работы и доступен только в оригинальном файле.,

Рисунок убран из работы и доступен только в оригинальном файле.,

Рисунок убран из работы и доступен только в оригинальном файле.,

Рисунок убран из работы и доступен только в оригинальном файле..

Так как максимальное значение имеет М3, то следует строить бесшлюзовую электростанцию. [16, 18, 21, 25, 27, 49]

Выводы по I главе

Таким образом, в первой главе были рассмотрены основные теоретические положения и определения теории игр. Было сформулировано и дано определение теории игр, а также были затронуты такие понятия как: игра, правила игры, стратегия, оптимальная стратегия, партия, ход.

В результате изучения основных характеристик игры, можно сказать, что очень важна эффективн

Здесь опубликована для ознакомления часть дипломной работы "Теория игр". Эта работа найдена в открытых источниках Интернет. А это значит, что если попытаться её защитить, то она 100% не пройдёт проверку российских ВУЗов на плагиат и её не примет ваш руководитель дипломной работы!
Если у вас нет возможности самостоятельно написать дипломную - закажите её написание опытному автору»


Просмотров: 534

Другие дипломные работы по специальности "Педагогика":

Метод языкового анализа на уроках русского языка

Смотреть работу >>

Использование образовательной технологии "Школа 2100" в обучении математике младших школьников

Смотреть работу >>

Организация учебного сотрудничества в процессе обучения младших школьников русскому языку

Смотреть работу >>

Организация работы по подготовке школьного актива органами ВЛКСМ в 60-80-хх годах ХХ века

Смотреть работу >>

Особенности организации самостоятельной работы студентов педагогического колледжа при овладении курсом методики физического воспитания и развития детей

Смотреть работу >>