ОБ ОДНОЙ ИГРОВОЙ ЗАДАЧЕ СБЛИЖЕНИЯ ПРИ НАЛИЧИИ СЛУЧАЙНЫХ ВОЗМУЩЕНИЙ



ЧИКРИЙ В.К. Для ігрових задач, що описуються квазілінійними функціонально-диференціальними системами, дано узагальнення першого прямого методу Л.С. Понтрягіна. У випадку адитивних випадкових збурень у правій частині дано достатні умови скінченності середнього часу зближення. Результати ілюструються на прикладі простих рухів гравців.

L.S. Pontryagin’s first direct method is extended to the game problems described by the quasi-linear functional-differential systems. Sufficient conditions of the game termination in the mean time areprovided in the case of additive random pertubations. Results are illustrated on an example of simple motions of the plauers.

УДК 517.977

В теории динамических игр разработано ряд фундаментальных методов сближения траекторий, которые применимы для исследования конфликтно-управляемых процессов различной природы [1–3]. В практических задачах, как правило, присутствует некоторая неопределенность, связанная с неточностью измерений или неполной информацией об объекте. Стремление внести стохастическую неопределенность в игровую модель приводит к различным постановкам задач. В данной работе рассматриваются процессы со случайными возмущениями, которые адитивно входят в правую часть.

Рассмотрим конфликтно-управляемый процесс, эволюция которого описывается равенством

Здесь $z(t)\in {{R}^{n}}$, $n\ge1$. Функция $g(t)$, $g:{{R}_{+}}\to{{R}^{n}}$, ${{R}_{+}}=\{t:t\ge 0\}$, измерима по Лебегу и ограничена при $t>0$. Она содержит информацию о начальных данных процесса. Блок управления содержит матричную функцию $\Phi (t,\tau )$, $t\ge \tau \ge 0$, измеримую по $t$ и суммируемую по $\tau $ для каждого $t\in {{R}_{+}}$, которая действует на функцию $\varphi(u,v)$, $\varphi :U\times V\to {{R}^{n}}$, зависящую от управлений игроков. Эта функция предполагается непрерывной по совокупности переменных на прямом произведении непустых компактов $U$ и $V$, областей управления.

Допустимыми управлениями первого $(u)$ и второго $(v)$ игроков являются измеримые функции времени $u(\tau )$, $u:{{R}_{+}}\to U$, $v(\tau)$, $v:{{R}_{+}}\to V$. Блок возмущений содержит матричную функцию $H(t,\tau )$, $t\ge \tau \ge 0$, измеримую по $t$ и суммируемую по $\tau $ для каждого $t\in{{}_{+}}$, воздействующую на функцию возмущений $h(\tau )$, $\tau \ge 0$, измеримую и ограниченную, которая может принимать счетное число значений ${{h}_{i}}(\cdot)$, $i\in N=\{1,2,...\}$, с соответствующими вероятностями ${{p}_{i}}$, ${{p}_{i}}\ge0$, $\sum\limits_{i=1}^{\infty }{{{p}_{i}}=1}$. Заметим, что функции ${{h}_{i}}(\cdot)$, $i\in N$, предполагаются заранее известными, чего нельзя сказать об управляющих воздействиях игроков.Кроме динамики процесса задано терминальное множество ${{M}^{*}}$, имеющее цилиндрический вид

\[{{M}^{*}}={{M}_{0}}+M,\quad\quad\quad(2)\]

где ${{M}_{0}}$ – линейное подпространство из ${{R}^{n}}$, а $M$ – компакт из ортогонального дополнения $L$ к ${{M}_{0}}$ в ${{R}^{n}}$.

Первый игрок стремится вывести траекторию процесса на терминальное множество, а второй этому препятствует. Поскольку присутствуют случайные возмущения, то будем ориентироваться на среднее время вывода траектории [4]. При этом первый игрок использует смешанные стробоскопические стратегии О. Хайека [3], которые предписывают смешанные контруправления по Н.Н. Красовскому [2].

Представление решения динамической системы в виде (1) позволяет в единой схеме рассмотреть широкий круг функционально-дифференциальных систем, функционирующих в условиях конфликта. В частности, систем обыкновенных дифференциальных, интегральных,интегро-дифференциальных, дифференциально-разностных уравнений, а также систем уравнений с классическими дробными производными Римана–Лиувилля, регуляризованными дробными производными Джрбашяна–Нерсесяна–Капуто, секвенциальными дробными производными Миллера–Росса, дробными производными Хильфера и Грюнвальда–Летникова. Аналогичное представление имеет место для импульсных систем и многошаговых процессов.

Используя технику многозначных отображений и их селекторов, дано обобщение схемы первого прямого метода Л.С. Понтрягина[1], позволяющее строить управления первого игрока на основе теоремы измеримого выбора. В результате получены достаточные условия конечности среднего времени сближения траектории (1) с терминальным множеством (2) [4]. Эти условия конкретизируются для различных уже упомянутых систем.

В качестве иллюстративного примера рассмотрена игровая адача $\varepsilon $-сближения с простым движением, шарообразными областями управления и конечным набором постоянных случайных возмущений.

Выписаны соотношения, связывающие начальное состояниек онфликтно-управляемого процесса, максимальные скорости игроков, радиус захвата $\varepsilon $ и случайные возмущения, достаточные для конечности среднего времени сближения. При этом в явном виде найдены смешанные управления первого игрока, обеспечивающие этот результат [4].

Список литературы

$1.$ Понтрягин Л.С. Избранные научные труды. – М.: Наука. 1988. – 2. – 576 с.

$2.$ Красовский Н.Н., Субботин А.И. Позиционные дифференциальные игры. – М.: Наука. 1974. – 455 с.

$3.$ HayekO. Pursuit Games. – N.Y.:Acad. Press. – 1975. – 12. – 266 p.

$4.$ Чикрий В.К. Среднее время сближения в игровых задачах со случайными возмущениями // Проблемы управления и информатики. – 2015. – № 4. – С. 7-15.

Jun 23, 2016