Применение байесовских сетей в задачах диагностики и адаптивного управления



Рассмотрены подходы к решению задач адаптивной фильтрации в системах управления сложными объектами в условиях неопределенности средствами динамических байесовских сетей. Затронуты вопросы автоматической онлайн диагностики состояния элементов системы управления с помощью интеллектуального диагностического блока, включающего байесовскую сеть.

Ключевыеслова: байесовская сеть, динамическая байесовская сеть, адаптивная фильтрация,диагностика, интеллектуальный анализ данных

Bayesian networks in diagnostics and adaptive control problems

PysarenkoA., National Technical University of Ukraine “KPI”

TischenkoD., National Technical University of Ukraine “KPI”

Ukraine,Kyiv

Approaches to solving adaptive filtering problem by means of dynamic Bayesian networks in control systems of complex objects under uncertainty conditions were considered. The issues of automatic online diagnosis of the controls system elements state with intelligent diagnostic block based on Bayesian network were developed.

Keywords: Bayesian network, dynamic Bayesian network, adaptive filtering, diagnostics, data mining

К современным системам управления, повсеместно используемым в различных сферах человеческой деятельности, предъявляются повышенные требования с точки зрения показателей качества и надежности. Обеспечение заданных показателей качества процессов в условиях неопределенности среды их протекания является важнейшей задачей, не утрачивающей своей актуальности на любом этапе развития теории и практики управления. Бурное развитие методов, впоследствии объединенных под общим названием «интеллектуальный анализ данных», позволяет значительно продвинуться в решении указанных задач. Неопределенности, рассматриваемые в теории управления (параметрические, сигнальные, функциональные, структурные,статистические) по-разному учитываются в процессе проектирования, начиная от классических адаптивного и робастного подходов и заканчивая такими методами интеллектуального анализа данных как искусственные нейронные сети, нечеткая логика, нейро-нечеткие сети, байесовские сети, генетические алгоритмы, деревья решений и другие.

Данные в виде последовательностей возникают во многих областях науки и техники. Динамические системы порождают временные последовательности данных в ходе своего функционирования, которые могут быть получены с использованием всевозможных датчиков и косвенных инструментов получения данных. В одних задачах имеется необходимость в онлайн анализе, когда данные поступают в режиме реального времени, в других достаточно автономного режима анализа, когда данные уже были собраны.

Сети Байеса

Как известно, байесовская сеть (БС) кодирует вероятностные взаимосвязи между представляющими интерес переменными, используя ациклический ориентированный граф. Такое представление имеет ряд преимуществ для анализа данных. Поскольку модель описывает зависимости между переменными, она справляется с ситуациями, когда некоторая информация отсутствует. Также БС может быть использована для установления причинно-следственных связей и, следовательно, может быть использована для получения понимания о проблемной области и прогнозирования. К тому же подобное представление позволяет объединить априорную информацию и данные. В результате БС являются очень популярными вероятностными моделями и сегодня интерес к обучению БС с использованием измерительных (статистических) данных значителен.

Примерами задач, в которых БС являются идеальными инструментами для анализа, являются, например:вычисление общей надежности системы с учетом надежности отдельных ее компонентов и их взаимодействия [1]; систем безопасности, где БС используются в качестве инструмента для оценивания факта проникновения в сеть[2]; в судебно-медицинской экспертизе [3]; также в медицинской диагностике, поддержке принятия решений,диагностике состояния датчиков, поиске информации, управлении рисками и робототехнике и других [4]. Таким образом, БС находят все более широкое применение в различных областях человеческой деятельности и на деле доказывают свою перспективность и успешность.

По типу используемых данных различают следующие типы БС: дискретные, непрерывные и гибридные, а по способу описания режимов функционирования объектов исследования –статистические и динамические. Очевидно, что каждый тип БС пригоден для определенного класса задач. Поскольку предметом данной работы является адаптация и диагностика в системах автоматического управления, рассмотрим более подробно применимость БС в указанных задачах.

Скрытые модели Маркова и фильтр Калмана популярны, поскольку они относительно простые и удобные для практического применения. Тем не менее, они ограничены в своих потенциальных возможностях. Динамические байесовские сети (ДБС) обобщают модели Маркова, позволяя представить пространство состояний в разложенном виде, а не в качестве единой дискретной случайной величины. Также ДБС обобщают фильтр Калмана, позволяя произвольно распределять вероятности, а не только в линейной гауссовой постановке задачи.

Исходя из вышеизложенного, представляется обоснованным использование возможностей ДБС для адаптивной фильтрации (наблюдения состояний управляемого процесса), а также для поддержки принятия управленческих решений в автоматическом или полуавтоматическом режимах функционирования систем управления.

В онлайн анализе данных общая задача состоит в том, чтобы прогнозировать будущие наблюдения, учитывая все предыдущие измерения до текущего момента времени, которые мы обозначим как Поскольку, как правило,мы не можем быть уверены в будущем, мы хотели бы получить прогноз. Кроме того,мы хотели бы знать, насколько он правдоподобен, чтобы его учитывать. Поэтому необходимо вычислить распределение вероятностей по возможным будущим наблюдениям, обозначив их как $P\left( {{x}_{k+h}}\left| {{x}_{1:k}} \right. \right),$ где $h>0$ – горизонт прогнозирования, – на сколько шагов в будущее необходимо оценить прогноз.

В случае управления системой возникает необходимость прогнозирования будущих состояний (выходов) системы в зависимости от значений входных величин. Если обозначить через u1:k прошедшие значения входов, а через ${{u}_{k+1:k+h}}$следующие h значений входов, то задача будет состоять в вычислении $P\left( {{x}_{k+h}}\left|{{u}_{1:k+h}},{{x}_{1:k}} \right. \right).$

Если рассматривать модели в пространстве состояний, то их использование является более предпочтительным, чем классических регрессионных описаний временных последовательностей по ряду причин: они не подвержены эффекту влияния конечного окна прошлых измерений; они могут легко обрабатывать дискретные и многомерные входы и выходы; а также они могут легко включать исходные предварительные знания.Например, есть переменные, которые мы не можем измерить, но в тоже время необходимо оценить весь вектор состояний.

Есть много способов представления моделей в пространстве состояний, наиболее распространенными из которых являются скрытые марковские модели (СММ), а также модели, используемые в алгоритмах фильтра Калмана (ФК).

Трудности применения СММ. Предположим, что необходимо отслеживать n состояний объекта. Пусть каждое состояние может принимать одно из Nвозможных состояний. Тогда $\mathbf{x}\left[ k \right]={{\left( {{x}_{1}}\left[k \right],...,{{x}_{n}}\left[ k \right] \right)}^{T}}$может иметь ${{N}^{n}}$ возможных значений. Это означает, что требуется экспоненциальное количество параметров для определения модели наблюдения, то есть потребуется много данных, для построения модели. Кроме того, логический вывод займет экспоненциальное время, например, проход вперед-назад занимает $O\left( T{{N}^{2n}} \right)$, где Т – длина выборки.

Трудность применения ФК заключается в том, что он рассматривается для линейных динамических систем, что не всегда приемлемо для решения некоторых задач. Обычной практикой является использование либо расширенного, либо так называемого нечувствительного(unscented) фильтра Калмана в качестве решения в таких случаях.

Использование ДБС, являющихся в некоторой степени обобщением СММ и ФК позволит в значительной степени избежать указанных трудностей. Динамическая байесовская сеть представляет собой способ расширения сетей Байеса для моделирования распределения вероятностей над набором случайных величин $\mathbf{z}\left[ 1\right],\mathbf{z}\left[ 2 \right],...$. Мы будем объединять переменные в $\mathbf{z}\left[k \right]=\left( \mathbf{u}\left[ k \right],\mathbf{x}\left[ k\right],\mathbf{y}\left[ k \right] \right)$ для представления входных, скрытых и выходных переменных модели в пространстве состояний.

Последовательность построения модели в форме БС можно представить в виде следующих шагов: (1) – углубленный анализ исследуемого процесса (объекта) с целью установления особенностей его функционирования и выявления родительских и дочерних переменных; (2) – выявление существующих моделей процесса и анализ возможности их дальнейшего использования;(3) – установление существующих связей между переменными процесса с помощью специальных тестов и экспертного оценивания; (4) – сокращение размерности задачи построения модели; (5) – масштабирование и дискретизация переменных; (6)– определение семантических ограничений для модели; (7) – оценивания структур моделей-кандидатов с использованием оптимизационных процедур, то есть поиск альтернативных моделей в форме БС; (8) – параметрическое обучение модели; (9) –анализ качества и выбор лучшей из моделей-кандидатов; (9) – применение выбранной модели для решения поставленной задачи; (10) – формирование вероятностных выводов относительно выбранных переменных с построенной моделью(моделями), анализ качества полученного результата. Окончательным результатом применения модели в форме БМ (ДБМ) является вычисление вероятности попадания значения в некоторый интервал.

Динамическая байесовская сеть определяется парой $\left( {{B}_{1}},{{B}_{\to }} \right),$ где${{B}_{1}}$ это байесовская сеть, определяющая предшествующую $P\left(\mathbf{z}\left[ 1 \right] \right),$ а ${{B}_{\to}}$ – временная БС с двумя временными срезами (2ВБС), определяющая $P\left(\mathbf{z}\left[ k \right]\left| \mathbf{z}\left[ k-1 \right] \right. \right),$ как

\[P\left( \mathbf{z}\left[ k \right]\left| \mathbf{z}\left[ k-1 \right]\right. \right)=\prod\limits_{i=1}^{n}{P\left( {{\mathbf{z}}_{i}}\left[ k\right]\left| Pa\left( {{\mathbf{z}}_{i}}\left[ k \right] \right) \right.\right)},\]

где ${{\mathbf{z}}_{i}}\left[ k \right]$ –$i$-я вершина в моментk , $Pa\left( {{\mathbf{z}}_{i}}\left[ k \right] \right)$ – предки ${{\mathbf{z}}_{i}}\left[ k \right]$ на графе. Вершины в первом срезе 2 ВБС не имеют каких-либо параметров, связанных с ними, но каждая вершина во втором срезе 2 ВБС имеет связанное с ней распределение условной вероятности, определяемой $P\left({{\mathbf{z}}_{i}}\left[ k \right]\left| Pa\left( {{\mathbf{z}}_{i}}\left[ k\right] \right) \right. \right)$ для всех $k>1$. Предки вершины, $Pa\left( {{\mathbf{z}}_{i}}\left[ k \right] \right),$ могут находиться как в том же временном срезе, так и в предыдущем.

Таким образом, разница между ДБС и СММ заключается в том, что ДБС представляет вектор состояний как набор случайных величин ${{x}_{1}}\left[ k \right],...,{{x}_{n}}\left[ k\right]$ т. е., использует распределенное представление состояния. В противоположность этому, в СММ пространство состояний состоит из одной случайной величины $\mathbf{x}\left[ k \right]$. Разница между ДБС и ФК состоит в том, что распределение условных вероятностей ФК должно быть линейным(одинаковым для всех переменных), в то время как ДБС позволяет произвольное распределение.

Рассмотрим теперь особенности использования БС для задач диагностики. Определим диагностику, как вычисление апостериорного распределения дискретной переменной. Во многих приложениях будущие значения дискретных переменных представляют гипотезы о состоянии оборудования или режима работы, а предыдущие значения переменных представляют наблюдаемые параметры. Модели для таких систем, как правило, заданы наблюдаемыми переменными (назовем X) как потомки переменных гипотез (назовем H), тогда цель состоит в том, чтобы вычислить $P\left( H\left| X \right. \right)$.

Бывает, что гипотеза Н имеет несколько возможных значений, которые соответствуют набору взаимоисключающих гипотез, например, нормальную работу и несколько взаимоисключающих режимов отказа. Значение $P\left( H\left| X \right. \right)$ представляет собой список чисел, которые указывают вероятность для каждой из возможных гипотез; как правило, если вероятность одного или нескольких видов отказов велика, то необходимо будет предпринимать какие-либо действия. Однако не существует отдельных вычислений, предшествующих вычислению вероятности каждого вида неисправности; вероятность одного или нескольких сбоев любого рода это лишь$\sum\limits_{k}{\Pr }$ ("отказ типа k"), так что для того, чтобы вычислить агрегированную вероятность отказа, необходимо провести весь расчет $P\left(H\left| X \right. \right)$.

Таким образом в задачах диагностики наиболее применимы статические БС (дискретные либо непрерывные), позволяющие оценить вероятность возникновения определенного типа отказа из заранее определенного перечня возможных.

Список литературы

  1. LangsethH., Portinale L., Bayesian networks in reliability // Reliability Engineeringand System Safety 92(1), ­– 2007, 92–108.

  2. ZhangS., Song S., A Novel Attack Graph Posterior Inference Model Based on BayesianNetworks // Journal of Information Security, – 2011,vol 2, pp 8 – 27.

  3. DawidA., Mortera J., Pascali V, Van Boxel D., Probabilistic expert systems forforensic inference from genetic markers // Scandinavian Journal of Statistics,– 2002,vol 29 № 4, pp 577 – 595.

  4. PourretO., Bayesian networks: a practical guide to applications // Wiley, – 2008.

  5. Терентьев А.Н. Методы построения байесовских сетей / А.Н. Терентьев, П.И. Бидюк //Межведомственный научно-технический сборник „Адаптивные системы автоматического управления”. -Днепропетровск: Системные технологии, 2005. - № В. - С. 130 -141.
Apr 12, 2016