МОДЕЛИРОВАНИЕ СИСТЕМЫ УПРАВЛЕНИЯ ИМПУЛЬСНЫМИ ПРОЦЕССАМИ В КОГНИТИВНЫХ КАРТАХ СЛОЖНЫХ СИСТЕМ ПРИ ОГРАНИЧЕННЫХ РЕСУРСАХ



РОМАНЕНКО В.Д., МИЛЯВСКИЙ Ю.Л. У роботі розглядається задача управління складними системами, представленими у вигляді когнітивних карт. При цьому, оскільки ресурси, варіюванням яких забезпечується управління, є обмеженими, за критерій оптимальності при формуванні закону управління обрано критерій узагальненої дисперсії із обмеженнями у вигляді нерівностей. Таким чином, запропонований метод управління когнітивними картами дозволяє стабілізувати імпульсний процес так, щоб дисперсії приростів координат вершин та керувань не перевищували наперед задані значення.

In the present work problem of control of complex systems represented by cognitive maps is discussed. As far as resources, which are varied for the purpose of control, are restricted, optimality criterion for control law formulation is selected as generalised variance criterion with inequality restrictions. Thus proposed cognitive maps control method allows stabilising impulse process in such a way that variances of increments of vertices coordinates and controls do not exceed preassigned values.

Ключевые слова: когнитивная карта, импульсный процесс,управление с ограничениями.

УДК 62.50

Когнитивная карта (КК) является одним из популярных инструментов для описания сложных систем разной природы [1]. КК представляет собой ориентированный граф, вершины которого обозначают некоторые объекты или понятия предметной области, а ребра – степень влияния одной вершины на другую. В частности, в данной работе рассматриваются КК «в духе Ф. Робертса»[2], т.е. взвешенные орграфы, в которых веса ребер отвечают за приращение значения координаты одной вершины при действии на нее другой вершины. Когда на одну или несколько вершин действует начальный импульс, система переход в режим импульсного процесса, математическое описание которого принято формулировать в виде разностного уравнения первого порядка:

\[\Delta{{Y}_{i}}(k+1)=\sum\limits_{j=1}^{n}{{{a}_{ij}}\Delta {{Y}_{j}}(k),}\quad\quad\quad(1)\]

где $\Delta {{Y}_{i}}(k)={{Y}_{i}}(k)-{{Y}_{i}}(k-1),i=1,2,...,n,$ –приращения координат вершин КК в дискретный момент времени $k$, ${{a}_{ij}}$ – вес ребра, идущего из $j$-ой в $i$-ую вершину. В векторно-матричной форме(1) можно представить следующим образом:

\[\Delta\bar{Y}(k+1)=A\Delta \bar{Y}(k),\quad\quad\quad (2)\]

где $\Delta \bar{Y}(k)$ – вектор приращений координат КК.

Предположим, что лицо, принимающее решения, может управлять некими ресурсами (финансовыми, человеческими и др.), влияющими на все или некоторые вершины КК. Чтобы выразить это математически, добавим вектор управляющих воздействий $\bar{U}$ в модель (2):

\[\Delta \bar{Y}(k+1)=A\Delta\bar{Y}(k)+B\bar{U}(k),\quad\quad\quad(3)\]

где $B$ – матрица, обычно состоящая из нулей и единиц.

Легко видеть, что если обозначить $\bar{X}(k)=\Delta\bar{Y}(k)$, уравнение (3) превращается в уравнение состояния в пространстве состояний:

\[\bar{X}(k+1)=A\bar{X}(k)+B\bar{U}(k).\quad\quad\quad(4)\]

Если система является устойчивой, т.е. собственные числа матрицы состояния $A$ по модулю меньше единицы, для ускорения стабилизации импульсного процесса можно применять квадратичный критерий оптимальности. Если полагать, что сложная система находится в стохастической среде, т.е. на нее действуют внешние стохастические возмущения, критерий оптимальности можно записать в виде

\[J=tr{{Q}_{x}}{{V}_{x}}+tr{{Q}_{u}}{{V}_{u}},\quad\quad\quad(5)\]

где ${{V}_{x}}=E\bar{X}(k){{\bar{X}}^{T}}(k)$ – матрица ковариации вектора состояния $\bar{X}(k)$, ${{V}_{u}}=E\bar{U}(k){{\bar{U}}^{T}}(k)$ – матрица ковариации вектора управления $\bar{U}(k)$, ${{Q}_{x}},\,{{Q}_{u}}$ – заданные неотрицательно определенные матрицы коэффициентов.

Следует обратить внимание на тот факт, что поскольку вектор состояния является вектором приращений координат вершин КК. Среднее значение этого вектора по предположению рано нулю. Таким образом,минимизируется не сумма дисперсий координат вершин, а сумма дисперсий приращений этих координат. То есть, по существу, минимизируются дисперсии скоростей изменения вершин КК.

Однако, как показывает практика, минимизации критерия (5) часто оказывается недостаточно для того, чтобы управление было достаточно гладким. В импульсном процессе часто наблюдаются существенные колебания как координат, так и управлений, что во многих случаях является физически невозможным ил крайне нежелательным. Поэтому предлагается, помимо указанного критерия (5), ввести дополнительные жесткие ограничения типа неравенств на дисперсии переменных состояния, управлений или их линейные комбинации.

Запишем следующие ограничения:

где ${{Q}_{i}},{{R}_{j}}$ – заданные матрицы, ${{q}_{i}},{{r}_{j}}$ – числа.

Применим алгоритм условной минимизации [3] для нашего случая.

$1.$ Найдем матрицу ковариации вектора состояния как предельное значение рекуррентного уравнения (относительно ${{P}_{k}}$): ${{P}_{k+1}}=A{{P}_{k}}{{A}^{T}}+{{R}_{w}},$ где ${{R}_{w}}$ – известная матрица ковариации шума состояния. Обозначим решение ${{P}_{x}}$.

$2.$ На первом шаге итерационного алгоритма для определения матрицы усиления регуляторе по состоянию выберем некоторый вектор начальных значений множителей Лагранжа ${{\bar{\lambda}}^{(0)}}>0$ и матрицы Гессе ${{H}_{0}}=I.$ Размерность равна количеству ограничений.

$3.$ На $i$-м шаге алгоритма найдем $Q_{x}^{(i)}={{Q}_{x}}+\sum\limits_{j=1}^{{{n}_{q}}}{\lambda_{j}^{(i)}{{Q}_{j}}}$, $Q_{u}^{(i)}={{Q}_{u}}+\sum\limits_{j=1}^{{{n}_{u}}}{\lambda_{{{n}_{q}}+j}^{(i)}{{R}_{j}}}$ и решим матричное алгебраическое уравнение Риккати:

\[S={{A}^{T}}SA-{{A}^{T}}SBL+Q_{x}^{(i)},\]

\[L={{(Q_{u}^{(i)}+{{B}^{T}}SB)}^{-1}}{{B}^{T}}SA.\]

$4.$ Решив уравнение Риккати, решим матричное уравнение Ляпунова: \[{{V}_{x}}=(A-BL){{V}_{x}}{{(A-BL)}^{T}}+A{{P}_{x}}A-(A-BL){{P}_{x}}{{(A-BL)}^{T}}+{{R}_{w}},\]

и рассчитаем ${{V}_{u}}=L({{V}_{x}}-{{P}_{x}}){{L}^{T}}.$

$5.$ Вычислим координаты вектора $\bar{\xi }$ по формулам

\[\xi _{j}^{(i)}=\lambda_{j}^{(i)}(tr{{Q}_{j}}{{V}_{x}}-q_{j}^{2}),j=1,...,{{n}_{q}},\] \[\xi _{j}^{(i)}=\lambda_{{{n}_{q}}+j}^{(i)}(tr{{R}_{j}}{{V}_{u}}-r_{j}^{2}),j=1,...,{{n}_{r}}.\]

Если норма $\bar{\xi }$ меньше заданного $\varepsilon$, остановить итерационный алгоритм.

$6.$ Обновим матрицу Гессе

\[{{H}_{i}}={{H}_{i-1}}+\frac{(\Delta {{{\bar{\lambda}}}^{(i)}}+{{H}_{i-1}}\Delta {{{\bar{\xi }}}^{(i)}}){{(\Delta {{{\bar{\lambda}}}^{(i)}})}^{T}}{{H}_{i-1}}}{{{(\Delta {{{\bar{\lambda}}}^{(i)}})}^{T}}{{H}_{i-1}}\Delta {{{\bar{\xi }}}^{(i)}}},\]

где $\Delta{{\bar{\lambda }}^{(i)}}={{\bar{\lambda }}^{(i)}}-{{\bar{\lambda }}^{(i-1)}},\,$$\Delta {{\bar{\xi }}^{(i)}}={{\bar{\xi }}^{(i)}}-\Delta {{\bar{\xi}}^{(i-1)}}.$

$7.$ Обновим вектор множителей Лагранжа, например, по формуле

\[\lambda _{j}^{(i+1)}=\lambda_{j}^{(i)}+\beta H_{i}^{j}{{\bar{\xi }}^{(i)}},\,j=1,...,{{n}_{q}}+{{n}_{r}},\,\]

Единожды рассчитав по указанному алгоритму в п. 3 матрицу , будем на каждом периоде дискретизации генерироватьуправления по формуле

\[\bar{U}(k)=-L\bar{X}(k).\quad\quad\quad(7)\]

Данный подход был апробирован на КК, описывающей деятельность коммерческого банка [4].

Список литературы

  1. Г.В. Горелова,Е.Н. Захарова, С.А. Радченко. Исследование слабо структурированных проблем социально-экономических систем. Когнитивный подход. — Ростов-на-Дону: Изд-во РГУ, 2006. — 332 с.

  2. F. Roberts. Discrete Mathematical Models with Applications to Social, Biological, and Environmental Problems — Englewood Cliffs,Prentice-Hall, 1976. — 559 p.

  3. P. Makila, T. Westerlund, H.Toivonen. Constrained Linear Quadratic Gaussian Control with Process Applications// Automatica, Vol. 20, No. 1, 1984. – P. 15 – 29.

  4. В.Д.Романенко, Ю.Л. Милявский, А.А. Реутов. Метод адаптивного управления неустойчивыми импульсными процессами в когнитивных картах на основе эталонных моделей // Проблемы информатики и управления. —2015. — № 2. — С. 35—45.
Jun 16, 2016