Дослідження впливу колірних моделей при визначенні кольорових характеристик об’єктів розпізнавання на зображенні



В статті здійснено аналіз методів визначення кольорових особливостей зображень. Розглянуто популярні колірні моделі та окреслено їхні особливості.

Ключові слова: колірна модель, обробка зображень, комп’ютерне бачення, RGB, HSV, Lab, розпізнавання

Антосєв Андрій Сергійович

студент

КПІ ім. Ігоря Сікорського

Київ, Україна

gibson12ant@gmail.com

Дорогий Ярослав Юрійович к.т.н., доц.

КПІ ім. Ігоря Сікорського

Київ, Україна

Cisco.rna@gmail.com

Сьогодні вслід за швидким ростом обчислювальних можливостей комп'ютерів стають все більш популярними задачі комп'ютерного бачення. За допомогою програмного аналізу зображення вирішується безліч побутових та професійних проблем. Однією з яких є розпізнавання та слідкування за рухомими об’єктами. Під час виявлення окремих об’єктів на зображенні недостатньо інформації лише про їх форму та розташування, адже такі параметри в більшості випадків не несуть в собі унікальних знань про ці об’єкти. Найбільш важливою інформацією про об’єкт є його колір. Саме визначення кольорової характеристики зображення та подальший її аналіз суттєво спрощує задачу розпізнавання та слідкування за об’єктами.

Після виділення окремого об’єкта на зображенні, він представляється у вигляді набору пікселей із певними числовими значеннями кольорів. Слід виділити основні колірні моделі такі, як RGB, HSV та Lab. RGB – найбільш розповсюджена адитвна колірна модель, що представляє собою спосіб синтезу кольору за допомогою накладання червоного, синього та зеленого світла відповідно [1]. Найпростішим методом для створення кольорової характеристики зображення є підрахунок кількості пікселів однакового кольору з використанням RGB моделі. Ідея полягає в тому, щоб порівнювати такі масиви даних з різних кадрів та слідкувати за об’єктами. Такий підхід є найлегшим як у розуміння так і з боку використання обчислювальних ресурсів. Проте існує ряд суттєвих недоліків. Так як кожна складова кольору має значення у межах від 0 до 255, то кількість можливих кольорів складає 16 777 216. При чому при найменшому впливі на об’єкт світла або зміни ракурсу до камери велика частина точок будуть змінювати своє кольорове значення. Для спрощення сприйняття кольору виконується нормалізація таких значень. Попередньо обирається в якому діапазоні цілих чисел повинні відображатись кожен з каналів. Такий діапазон зазвичай є унікальним для різних ситуацій чи потреб. Часто обирають максимальне значення - 7. Тобто кожен кольоровий канал, що попередньо був у діапазоні від 0 до 255, після нормалізації лежатиме в межах цілих чисел від 0 до 7 відповідно. Як нескладно зрозуміти, для нормалізації необхідно поділити кожне значення кольорового каналу на 32. Маючи спрощені значення кольорів, з ними на порядок легше працювати, адже невеликі зміни у їх відтінках у частині випадків не відображаються на їх цифровому значенні. Проте даний підхід є досить ненадійним. Нормалізовані кольори мають різку зміну тону, а також накладання тіні на частину об’єкта певного кольору може змінити його сприйняття. Отже хотілось би звернути увагу на наступний метод,що вирішує недоліки свого попередника. Метод складання кольоровоїхарактеристики на основі HSV моделі враховує ситуації зі зміною тону кольорупід час затінення об’єкта. Для початку декілька слів про дану кольорову модель. HSV відображає кольори у вигляді трьох наступнихскладових: колірний тон (Hue), насиченість (Saturation) та значення кольору(Value) [2]. Колірний тон - це значення “чистого” кольору,тобто без накладання чорного або білого тонів. Його значення зазвичай представляють в межах 0 - 360 градусів, або просто від 0 до 100 (рис. 1).

Рис.1 - Шкала колірного тону (hue)

Насиченість відповідає за відтінок білого у кольорі і лежить у межах від 0 до 100, або від 0 до 1. При показнику 1 колір “чистий”, при 0 - білий. Цей параметр може змінюватись при засвічені об’єкта білим світлом. Тобто при попаданні на об’єкт променів білого відтінку значення Hue, в ідеальному випадку, не змінюється. Змінює своє значення параметр Saturation. Отже можна зазначити, що обираючи колірну модель HSV, покращується сприйняття алгоритмом впливу світла на об’єкт розпізнавання. Останнім параметром є - значення кольору. Дана складова відповідає за яскравість кольору та задається в аналогічних межах від 0 до 1, або від 0 до 100. При наближенні показника до 0 колір приймає чорний відтінок. Таку особливість колірної моделі дуже зручно використовувати для аналіз падаючої на об’єкт розпізнавання тіні. Візуалізація HSV простору приведена на рис. 2 у вигляді циліндричної системи координат.

Рис. 2 - Візуалізація HSV моделі

Така колірна модель в більшості випадків дає кращі результати ніж RGB, проте вона не є ідеальною. Проблеми полягають у сприйнятті кольорів та світла. Іноді при засвічені або затіненні об’єкта він приймає відтінок іншого кольору чим спотворює дані алгоритму обробки. Наступною необхідно виділити колірну модель Lab. Дана модель розроблялась з метою представлення кольорів у вигляді якомога ближчому до того, як їх сприймає людина. В просторі Lab відокремили хроматичну складову кольору від світлості. Тим самим Lab однозначно визначає колір, значення якого задається трьома параметрами. За світлість відповідає L, що лежить в діапазоні від 0 до 100, тобто від темного до світлого. Колір же визначається двома координатами - a та b. Перша координата визначає відношення зеленого до червоного, а друга відношення синього до жовтого. Так як в моделі Lab світлість відокремлюється від кольору дія світла на зображення майже не відображає змін у сприйнятті кольорів алгоритмом. А отже створення кольорової характеристики об’єкта виконується дуже подібно на різних кадрах під різним впливом на цих об’єктів світла, що є надзвичайно важливим при обробці послідовності кадрів із метою виділення окремих об’єктів. Важливо відмітити, що перетворення RGB зображення в Lab - ресурсозатратний процес. Це може стати на заваді при реалізації алгоритму з використанням моделі Lab на слабких машинах, наприклад Raspberry Pi. Для порівняння впливу вибору колірної моделі на результат дії алгоритму розпізнавання було проведено наступне дослідження. Було обрано послідовність з десяти кадрів, попередньо записаних на відео з камери. На уривку відео зображена людина, що проходить по нерівномірно освітленому приміщенню, тобто на об’єкт спостереження на деяких кадрах падає світло або тінь. На кожному кадрі виділяється контур людини та знаходяться всі точки всередині контуру, кожна з яких має свій колір у відповідній колірній моделі. Далі розраховується скільки пікселів якого кольору має цей об’єкт на кожному кадрі. Такий набір даних далі вважаємо за колірну характеристику об’єкта. Після чого порівнюється колірна характеристика на одному кадрі з попередньою, на скільки відсотків вони подібні. Слід зазначити, що відхилення до 10% можна вважати допустимим, адже розміри контуру можуть змінюватись зі знаходженням об’єкта на зображенні. Також під час руху деякі частини об’єкта закриваються або навпаки з’являються.

Таблиця 1 - Порівняння колірних моделей

Також необхідно зауважити, що перед проведенням досліду значення каналів були нормалізовані. Адже без нормалізації результати порівняння сусідніх кадрів складали близько 8% схожості при нормальних умовах, використовуючи колірну модель RGB. Після нормалізації діапазони кожного параметру було зменшено у 8 разів, що не сильно спотворює дані. На кадрах 1-3 на об’єкт падає світло; кадр 4 - вихід об’єкта у рівномірно освітлений простір; 5-7 об’єкт знаходиться у рівномірному освітленні. На кадрі 8 об’єкт заходить в тінь і рухається в темній частині приміщення. З таблиці 1 можна побачити, що використовуючи модель RGB схожість колірних характеристик об’єкта на сусідніх кадрах 60-70%. Проте при зміні освітлення результати різко погіршуються. Цю проблему вирішують моделі HSV та Lab. З їх використанням вплив світла та тіні не такий значний. Найкраще себе показую саме Lab модель, через відокремлення значення світлості від кольору. Також слід зауважити, що використання двох останніх моделей при визначенні активності на відео значно покращує знаходження контурів рухомого об’єкта, адже поява тіні на зображенні ігнорується, що не можна сказати про модель RGB, де невелика зміна відтінку буде сприйматись, як рухомий об’єкт. Таким чином при розробці алгоритму обробки зображень з урахуванням кольору рекомендовано обирати колірну модель Lab, зважаючи на її переваги над іншими.

ЛІТЕРАТУРА

$1.$ Лисиця В. Т. КОЛІРНІ МОДЕЛІ ТА ЗАКОНИ ПОШИРЕННЯ СВІТЛА / В. Т. Лисиця.–2012.– С. 19.

$2.$ Комп’ютерна графіка "Навчальний посібник". // Тернопільський національний технічний університет імені Івана Пулюя. – 2017. – С. 44.

$3.$ ПРОЦЕДУРА КОРРЕКЦИИ ЦВЕТОВОГО БАЛАНСА ЦИФРОВЫХ ИЗОБРАЖЕНИЙ В ЦВЕТОВОМ ПРОСТРАНСТВЕ LAB. // Збірник наукових праць Харківського університету Повітряних Сил. – 2014. – №1. – С. 122–124

May 17, 2018