Бесконечные антагонистические игры — страница 5

  • Просмотров 2105
  • Скачиваний 37
  • Размер файла 163
    Кб

 1 f(х1) + 2 f(х2), где х1 и х2 – любые две точки из интервала (а,b); 1, 2  0, причём 1 + 2 = 1. Если для 1  0, 2  0 всегда имеет место строгое неравенство f(1 х1 + 2 х2) < 1 f(х1) + 2 f(х2), то функция f называется строго выпуклой на (а;b). Геометрически выпуклая функция изображает дугу, график которой расположен ниже стягивающей её хорды (см. рис.) Напомним, также, что непрерывная и строго выпуклая функция f на замкнутом интервале принимает

минимальное значение только в одной точке интервала. Для нахождения решения выпуклой игры можно воспользоваться следующей теоремой. Теорема 4. Пусть М(х, y) – непрерывная функция выигрышей игрока 1, на единичном квадрате и строго выпуклая по y для любого х. Тогда имеется единственная оптимальная чистая стратегия y = yo [0;1] для игрока 2, цена игры определяется по формуле V = M(x, y), значение yo определяется как решение следующего

уравнения M(x, yo) = V. Замечание. Если в теореме 4 не предполагать строгую выпуклость функции М(х, y) по y, а просто выпуклость, то теорема остаётся в силе с тем отличием, что у игрока 2 оптимальная чистая стратегия не будет единственной. Замечание. Выпуклые игры называют часто выпукло-вогнутыми, т.к. игра в них имеет седлообразное ядро, а так как ядро седлообразное, то игра имеет седловую точку в чистых стратегиях. Таким образом, если М(х,

y) непрерывна и выпукла по y, то цена игры определяется по формуле (1), и игрок 2 имеет оптимальную чистую стратегию, определяемую из уравнения (2). Аналогично и для игрока 1: если функция выигрышей М(х, y) непрерывна по обоим аргументам и строго вогнута по х при любом y, то в этом случае игрок 1 имеет единственную оптимальную стратегию. Цена игры определяется по формуле V = M(x,y), а чистая оптимальная стратегия хo игрока 1 определяется из

уравнения M(xo, y) = V. Пример. Пусть на квадрате [0;1] задана функция М(х, y) = . Так как для x [0; 1], y (0;1), то М(х, y) строго вогнута по х для любого y (0;1). Следовательно, цена игры находится по формуле (3) V = . Отметим, что при 0  х  справедливо равенство = а при 0,5 < х  1 = Поэтому V = max [; ] = = max [; ] = = max [;] = . При этом значение х получается равным хo = . Это же значение получается из решения уравнения = , т.к. минимум достигается при y = 0, и это уравнение

превращается в следующее = , откуда следует, что х = . Заметим, что если в функции выигрышей (5) поменять местами х и y, то она не изменится, а следовательно, эта функция выпукла и по y при всех х [0;1]. Поэтому к ней применима та же теория, т.е. у игрока 2 существует оптимальная чистая стратегия yo, определяемая из уравнения (4) = Очевидно, максимум по х достигается при х = , и последнее уравнение примет вид = . Решением последнего уравнения