Метод верхньої та нижньої розв’язуючих функцій для диференціальних ігор зближення з чистим запізненням



Стаття | Article    

Download

КПІ ім. Ігоря Сікорського

Київ, Україна

lesia@baranovsky.org

Анотацiя—Розглядається модифiкацiя методу розв’язуючих функцiй для диференцiально- рiзницевих iгор зближення з чистим запiз-ненням. Для даного класу iгор введено нижню i верхню розв’язуючi функцiї рiзних типiв. Для локальної задачi зближення побудовано схему методу, сформульовано достат-нi умови завершення гри.

Ключовi слова–диференциально-рiзницевi iгри, диференцiальни iгри, динамiчнi iгри, iгри зближе- ння, теорiя iгор.

Вступ

Розглядаються диференціально-різницеві ігри зближення з чистим запізненням. Для одержання гарантованого результату використовується метод розв’язуючих функцій [1]. Схема методу для диференціально-різницевих ігор розроблена в роботах [2,3,4]. У роботах [5,6,7] розглянуто задачу зближення для групи переслідувачів та одного втікача. Схему методу розв’язуючих функцій для диференціально-різницевих систем нейтрального типу розроблено у роботі [8]. Для об’єктів з різною інерційністю у роботі [9] запропоновано модифікацію умови Понтрягіна за рахунок введення тілесної частини термінальної множини. У даній роботі введено верхні та нижні розв’язуючі функції різних типів [10] у схемі методу розв’язуючих функцій для диференціальної гри зближення з чистим запізненням, що дозволяє розвивати метод навіть якщо умова Понтрягіна не виконується. Одержано достатні умови для завершення гри.

Схема методу

Нехай рух керованого об’єкту в евклідовому просторі ${R}^{n}$ описується системою диференціально-різницевих рівнянь з чистими запізненням $\tau =const>0$:

\begin{eqnarray}\label{eq:1} \dot{z}\left(t\right)=Bz\left(t-\tau\right)+u\left(t\right)-v\left(t\right) \nonumber \ z\in {{R}^{n}}, \; u\in U, \; v\in V. \end{eqnarray}

Тут $B$ – стала квадратна матриця порядку $n$; $U, V$ – непорожні компакти; функція $\varphi :U\times V\to {R}^{n}$ неперервна за сукупністю змінних; $u, v$ – параметри керування переслідувача і втікача відповідно.

Початковим станом системи (1) є дійсна функція

\begin{eqnarray}\label{eq:2} z(t)={{z}^{0}}(t),-\tau \le t\le 0, \end{eqnarray}

${{z}^{0}}(t)$ абсолютно неперервна на $[-\tau ,0].$

Термінальна множина є циліндричною і має вигляд

\begin{eqnarray} {{M}^{*}}={{M}_{0}}+M, \end{eqnarray}

де ${{M}_{0}}-$лінійний підпростір з ${{\text{R}}^{n}}$, М – непорожній компакт з ортогонального доповнення $L$ до ${{M}_{0}}$ у просторі ${{\text{R}}^{n}}$.

Ціль переслідувача (u) – вивести траєкторію процесу на термінальну множину (3) за найкоротший час, ціль втікача (v) – ухилитися від зустрічі або максимально відтягнути цей час. Приймемо сторону втікача, при цьому критерієм якості у грі є час. Тоді керування втікача в момент t будемо будувати у вигляді вимірної функції \begin{eqnarray} u(t)=u({{z}^{0}}(.),{{v}_{t}}(\cdot )), u(t)\in U, t\in [0,T], \end{eqnarray}
${{v}_{t}}(\cdot )=\{v(s):s\in [0,t]\};$ або у вигляді контркерування $u(t)=u({{z}^{0}}(.),v(t)), u(t)\in U,t\in [0,T].$

Нехай $\Delta =\{(t,s):0\le s\le t\prec+\infty \}$ -- плоский конус, $\pi $ -- ортопроектор, який діє з ${R}^{n}$ в $L.$

Розглянемо наступне багатозначне відображення \[W(t,s,v)=\pi K(t,s)\varphi (U,v)\] на множині $\Delta \times V$ і \[W(t,s)=\bigcap\limits_{v\in V}{W(t,s,v)},\; 0\le s\le t\prec+\infty,\] де $K(t,s)$ -- фундаментальна матриця [11].

Позначимо $dom W=\{(t,s)\in \Delta :W(t,s)\ne \varnothing \}.$

{\em Умова Понтрягіна.} $dom W=\Delta$.

{\em Умова 1.} Відображення $W(t,s,v)$ замкнутозначне на прямому добутку конуса $\Delta $ і компакта V.

Назвемо $\gamma (t,s)$, $\gamma :\Delta \to L$, функцією зсуву. Вона майже скрізь обмежена і вимірна по t, інтегровна по s, $s\in [0,t]$ для кожного $t\in {{R}_{+}}$.

Позначимо \[ \xi (t)=\xi (t,{{z}^{0}}(t),\gamma (t,\cdot ))=\pi K(t){{z}^{0}}(0)+\]
\[+\int\limits_{-\tau }^{0}{\pi K(t-s-\tau)B{{z}^{0}}(s)}ds+\int\limits_{0}^{t}{\gamma (t,s)}ds. \]

Розглянемо багатозначне відображення \[ Res(t,s,v)= \] \[ =\{\alpha \ge 0:[\pi K(t,s)\varphi (u,v)-\gamma (t,s)]\bigcap \alpha [M-\xi (t)]\ne \varnothing \}, \] \[ Res:\Delta \times V\to {{2}^{{{R}_{\text{+}}}}}. \]

Позначимо

\[Res(t,s)=\bigcap\limits_{v\in V}{Res(t,s,v)}, \; (t,s)\in \Delta.\]

{\em Умова 2.} Багатозначне відображення $Res(t,s)$ має непорожні образи на конусі $\Delta. $

Введемо верхню та нижню розв’язуючі функції [10]

\[{{\alpha }^{*}}(t,s)=sup\{\alpha :\alpha \in Res(t,s)\},\] \[{{\alpha }_{*}}(t,s)=inf\{\alpha :\alpha \in Res(t,s)\},\]

а також числові функції

\[{{\alpha }^{*}}(t)=\int\limits_{0}^{t}{{{\alpha }^{*}}(t,s)}ds,\] \[{{\alpha }_{*}}(t)=\int\limits_{0}^{t}{{{\alpha }_{*}}(t,s)}ds.\]

Верхній розв’язуючій функції ${{\alpha }^{*}}(t,s,v)$, яка змістовно означає максимальний виграш переслідувача в момент s у грі на інтервалі $[0,t]$ при протидії v, поставимо у відповідність множину

\begin{eqnarray}
T({{z}^{0}}(\cdot ),\gamma (\cdot ,\cdot ))=\{t>0: \nonumber \ \underset{v(\cdot )\in V(\cdot )}{\mathop{inf}}\,\int\limits_{0}^{t}{{{\alpha }^{*}}(t,s,v(s))}ds\ge 1\} \end{eqnarray}

і його найменший елемент

\[t({{z}^{0}}(\cdot ),\gamma (\cdot ,\cdot ))=inf\{t:t\in T({{z}^{0}}(\cdot ),\gamma (\cdot ,\cdot ))\}.\]

Якщо для деякого $t$, $t>0$, ${{\alpha }^{*}}(t,s,v)\equiv +\infty $, $s\in [0,t]$, $v\in V$, то в цьому випадку значення інтеграла у співвідношенні (5) природньо покласти рівним $+\infty $, а відповідна нерівність виконується автоматично і $t\in T({{z}^{0}}(\cdot ),\gamma (\cdot ,\cdot ))$. У випадку, коли нерівність в (5) не виконується при всіх $t>0$, покладемо $T({{z}^{0}}(\cdot ),\gamma (\cdot ,\cdot ))=\varnothing $, тоді, відповідно, $t({{z}^{0}}(\cdot ),\gamma (\cdot ,\cdot ))=+\infty $.

\textbf{Теорема.} Нехай для конфліктно-керованого процесу (1), (2) виконуються умови 1 і 2, $M=coM$; для заданої функції ${{z}^{0}}(\cdot )$ і функції зсуву $\gamma (\cdot ,\cdot )$ $T({{z}^{0}}(\cdot ),\gamma (\cdot ,\cdot ))\ne \varnothing $.

Тоді при ${{\alpha }_{*}}(T)\prec1$ траєкторія процесу (1) може бути приведена на термінальну множину (3) в момент Т за допомогою керування у вигляді (4); а за умови ${{\alpha }^{*}}(T)\ge 1$ – в классі контркерування, при будь-яких допустимих протидіях втікача.

Висновки

У данiй роботi побудовано схему методу розв’язуючих функцiй для диференцiально- рiзницевих iгор зближення з чистим запiзне- нням. Уперше введено для таких задач верх- ню i нижню розв’язуючi функцiї, що дозволяє використовувати побудовану схему методу до процесiв, у яких не виконується умова Понтря- гiна. Сам вибiр методу розв’язуючих функцiй А.О. Чикрiя зумовлений легкiстю знаходжен- ня розв’язуючих функцiй та практичною реа- лiзацiєю. Метод дає обґрунтування класично- му правилу паралельного переслiдування, добре вiдомого проектувальникам ракетної та космi- чної технiки. Основна складнiсть таких iгор по- лягає у знаходженнi фундаментальної матрицi диференцiально-рiзницевих систем. Для подаль- ного розвитку запропонованого методу плану- ється використовувати поняття запiзнюючого експоненцiалу [2, 3, 4] для практичного знахо- дження фундаментальної матрицi системи у ви- глядi степеневого ряду. Також планується пере- нести цю схему методу для розв’язання групових задач зближення [12, 13], а також на випадок вiдмови керуючих пристроїв [14].

Лiтература

[1] Chikrii A.A. Conflict-Controlled Processes. – Springer Science &Business Media, 2013. – 404 p.

[2] Baranovska L.V. Quasi-Linear Differential-Deference Game of Approach // Understanding Complex Systems. – 2019. – P. 505-524.

[3] Baranovska L.V. On Quasilinear Differential-Difference Games of Approach // Journal of Automation and Information Sciences. – 2017. – vol. 49, is. 8. – P. 53- 67.

[4] Lesia V. Baranovska. Pursuit differential-difference games with pure time-lag // Discrete and Continuous Dynamical Systems – Series B. – 2019. – vol. 24, is. 3. – P. 1021-1031.

[5] Baranovskaya G.G. Group Pursuit in Quasilinear Differential-Difference Games / G.G. Baranovskaya, L.V. Baranovskaya // Journal of Automation and Information Sciences. – 1997. – vol. 29, is. 1.

[6] Baranovskaya L.V. Inverse Minkowski functionals in a nonstationary problem of group pursuit / L.V. Baranovskaya, A.A. Chikrij, Al.A. Chikrij // Izvestiya Akademii Nauk. Teoriya i Sistemy Upravleniya. – 1997.

[7] Baranovskaya L.V. Inverse Minkowski functional in a nonstationary problem of group pursuit / L.V. Baranovskaya, A.A. Chikrii, Al.A. Chikrii // Journal of Computer and Systems Sciences International. – 1997. – vol. 36, is. 1. – P. 101-106.

[8] Baranovskaya L.V. A method of resolving functions for one class of pursuit problems / L.V. Baranovskaya // Eastern-European Journal of Enterprise Technologies. – 2015. – vol. 2, is 4(74). – P. 4-8.

[9] Baranovska L.V. Method of resolving functions for the differential-difference pursuit game for different-inertia objects / L.V. Baranovska // Advances in Dynamical Systems and Control. – Springer. – 2016. – vol. 69 of the series Studies in Systems, Decision and Control.

[10] Chikrii A.A. Image structure of multivalued mappings in game problems of motion control / A.A. Chikrii, V.K. Chikriy // Journal of Automation and Information Sciences. – 2016. – vol. 48, is. 1. – P. 20-35.

[11] Беллман Р. Дифференциально-разностные уравнения. / Р. Беллман, К. Кук. – М.: Мир, 1967. – 254с.

[12] Baranovska L.V. Group Pursuit Differential Games with Pure Time-Lag // Contemporary Approaches and Methods in Fundamental Mathematics and Mechanics.– 2020.

[13] Барановская Л.В. О дифференциально-разностной игре группового преследования / Л.В. Барановская, Г.Г. Барановская // Доповiдi Нацiональної академiї наук України. – 1997. – №3. – С. 12-15.

[14] Chikriy A.A. An approach game problem under the failure of controlling devices / A.A. Chikriy, L.V. Baranovskaya, Al.A. Chikriy // Journal of Automation and Information Sciences. – 2000. – vol. 32, is.5.

Nov 16, 2020