МЕТОД ПОБУДОВИ СПАЙКОВИХ УЗАГАЛЬНЕНИХ ЗГОРТОЧНИХ НЕЙРОННИХ МЕРЕЖ ДЛЯ РОЗВ’ЯЗАННЯ ЗАДАЧІ РОЗПІЗНАВАННЯ ЕМОЦІЙНОГО СТАНУ ЛЮДИНИ



ДОРОГИЙ Я.Ю., ТКАЧОВ А.С. В работе рассмотрен вопрос построения спайковых сверточных нейронных сетей для задачи распознавания эмоционального состояния человека.

УДК 621.391

In the thesis the designing of spike convolutional neural networks for emotional state recognition was considered.

Згорточні нейронні мережі активно та успішно використовуються для розв’язання різноманітних задач з теорії розпізнавання. В роботі [1] даний клас мереж успішно використаний для розпізнавання літер, в [2] – для детектування об’єктів, в [3] – для розпізнавання людських облич та емоцій [4-5]. В ційроботі пропонується використати підхід на базі модифікованих узагальнених згорточних нейронних мереж [6].

Архітектура мережі. Для розв’язання задачі розпізнавання емоційного стану людини використаємо архітектуру узагальненої згорточної нейронної мережі (УЗНМ) з [6] з модифікованими нейронами. Архітектура нейронної мережі представлена на рис. 1.

Рис. 1. Архітектура УЗНМ

Як відомо з [6], для покращення узагальнюючої здатності ЗНМ використана вдосконалена топологія з використанням однакових карт ознак, але з різними вікнами обходу (рис. 2).

Рис. 2. Різні вікна обходу

В якості функцій активації нейронів використаємо наступну [7](рис. 3).

Рис. 3. Вигляд функції активації ReLU

Функція випрямляння є функцією активації, що має вигляд f(x) = Max(0, x). Основна причина використання – ефективність її обчислення без втрати якості узагальнення. Ця функція додає деяку нелінійність в мережу.

Алгоритм переходу до спайкової нейронної мережі. Для побудови спайкової узагальненої згорточної нейронної мережі пропонується використати наступний алгоритм:

  1. Використати функцію випрямляння як функцію активацій для всіх нейронів мережі.

  2. Прирівняти значення зміщення нейронів до 0 і використати будь-який алгоритм навчання зі зворотнім поширенням помилки.

  3. Змінити всі нейрони мережі на спайкову модель «integrate-and-fire». Еволюція напруги мембрани ${{v}_{mb}}$ такого нейрону описується наступною формулою (1):

\[\frac{d{{v}_{mb}}(t)}{dt}=\sum\limits_{i}{\sum\limits_{s\in{{S}_{i}}}{{{w}_{i}}\delta (t-s),}}\quad\quad\quad(1)\]

де ${{w}_{i}}$ - вага i-го вхідного синапсу;

$\delta ()-$ дельта-функція;

${{S}_{i}}=\{t_{i}^{0},t_{i}^{1},...\}$ - серія спайків i-го пресинаптичного нейрону.

Зауваження: якщо напруга на мембрані перевищує граничне значення ${{v}_{th}}$, то її значення скидається до заданого ${{v}_{rs}}$.

$4.$ Використати метод нормалізації ваг, що описаний нижче.

Нормалізація ваг. Для нормалізації ваг знаходимо найбільшу позитивну вагу та виконуємо відносно неї масштабування всіх інших ваг. Таким чином, якщо нейрон з максимальною вагою виробляє тільки один спайк, то нейронній мережі не потрібно буде виробляти більше одного спайку за один раз для того ж самого нейрону.

Дослідження мережі. Для дослідження запропонованого методу побудована наступна узагальнена згорточна мережа:

- вхідний шар розміром 64×64 нейронів;

- перший шар згортки з 15 картами ознак розміром 7×7 та вікнами обходу 3×3 і 5×5;

- перший шар підвибірки з вікном 2×2;

- другий шар згортки з 64 картами ознак розміром 5×5 та вікнами обходу 2×2 і 3×3;

- другий шар підвибірки з розміром вікна 2×2;

- вихідний шар з 8 нейронів, що відповідають 8-ми емоційним станам людини, які були розглянуті при формуванні бази даних зображень.

Параметри алгоритмунавчання вибрані наступні:

- фіксована швидкість навчання – 0,9;

- відсутність інерції навчання;

- нульове значення зміщення нейронів;

- кількість епох навчання – 60.

В базу даних зображень включені 80 зображень облич людей з різним емоційним станом. 50 зображень використано для навчання нейронної мережі, 30 – для її тестування. Описана нейронна мережа досягла 98,4% якості розпізнавання.

Отримані ваги нейронів навченої УЗНМ далі були застосовані для побудованої спайкової узагальненої згорточної нейронної мережі (СУЗНМ) згідно з запропонованим алгоритмом. Частота подачі спайків на вхід даної нейронної мережі – 800 Гц. Отримана СУЗНМ протестована на побудованій базі даних та досягла 97% якості розпізнавання. Час моделювання– 200 мс.

Висновки. В роботах [8-9] доведена можливість значного підвищення продуктивності роботи спайкових нейронних мереж над звичайними. В даній роботі запропонований метод переходу від традиційних нейронних мереж до спайкових для розв’язання задач розпізнавання без значної втрати якості розпізнавання.

Jun 9, 2016