Сизоненко О. Д. Розроблення технології та програмних засобів виявлення та розпізнавання об'єктів у режимі реального часу

English version

Дисертація на здобуття ступеня доктора філософії

Державний реєстраційний номер

0824U002601

Здобувач

Спеціальність

  • 121 - Інженерія програмного забезпечення

29-08-2024

Спеціалізована вчена рада

ДФ 08.051.109 ID 6570 Сизоненко О.Д.

Дніпровський національний університет імені Олеся Гончара

Анотація

Актуальність теми дослідження обумовлено існуючим протиріччям між ускладненням моделей глибинного навчання при використанні існуючих програмних рішень, з одного боку, та зростанням труднощів інтерпретації цих моделей у прикладному застосуванні з підвищенням швидкодії процедури розпізнавання та відстеження об’єктів у режимі реального часу – з іншого боку. Сфера застосування безпілотних літальних апаратів (БпЛА) постійно зростає і виникає необхідність адаптації алгоритмів машинного навчання та моделей глибинного навчання для використання саме на борту БпЛА при врахуванні обмеженості на обчислювальні ресурси та специфіку організації отриманого відеопотоку даних. У роботі підкреслюється вага вже існуючих архітектурних рішень реалізації згорткової нейронної мережі при використанні методів та алгоритмів машинного навчання. Встановлене протиріччя долається внесенням додаткових умов для задачі опрацьовування великого набору зображень відеопотоку, який постійно оновлюється та може вміщувати інформацію про об'єкти різного розміру та форми для задачі розпізнавання та відстеження. Виділяється необхідність використання в запропонованому програмному рішенні адаптованої функції втрат для підтримки прийняття рішень на основі спостережених даних. Актуальною в цій тематиці є задача злиття ознак згорткових нейронних мереж для просторового та часового потоків. Метою роботи є підвищення точності виявлення, розпізнавання та відстеження об'єктів в режимі реального часу та реалізації відповідної технології у вигляді програмного засобу. Об’єктом дослідження є процеси опрацювання даних в задачах виявлення, розпізнавання та відстеження об’єктів у режимі реального часу. Предметом дослідження є моделі, алгоритми та технології використання згорткових нейронних мереж для вирішення задачі розпізнавання та відстеження об'єкта у режимі реального часу. Внутрішня логіка програмного забезпечення розробленої технології побудована з використанням компонентно-орієнтованого підходу. Для реалізації обчислень використано такі бібліотеки, як Pytorch, Ultralytics, NumPy, OpenCV2 та Matplotlib. Для розгортання цієї технології запропоновано реалізація декількох точок інтеграції. Наукова новизна результатів дослідження полягає в наступному: – вперше розроблено архітектурне рішення побудови нейронної згорткової мережі задачі виявлення, розпізнавання та відстеження об'єктів в режимі реального часу, що відрізняється від існуючого рішення тим, що використовує більшу кількість блоків розпізнавання об'єктів різного розміру, яке є оптимізоване для задач конкретної предметної області; – вперше обґрунтовано можливість використання в розробленій технології PFNB-блоку, який базується на архітектурному рішенні Faster-Net, що використовує багатомасштабну мережу обʼєднання ознак для демонстрації покращеної точності розпізнавання у порівнянні з базовою технологією; – вперше сформований власний набір даних для апробації розробленої технології починаючи з етапу розпізнавання об'єктів у відеопотоці, який включає об'єкти різного масштабу визначеної предметної області, що підтверджує ефективність розробленої моделі; – вперше запропоновано архітектуру кросплатформної бібліотеки для реалізації технології виявлення, розпізнавання та відстеження об'єктів, яка є п'ятимасштабною структурою і містить механізм уваги BiFormer з малою обчислювальною потужністю, що дозволяє покращити точність виявлення малих об'єктів та покращує увагу до ключової інформації на карті об'єктів; – вперше проведено моделювання порівняльних експериментів на YOLO v9 на невеликому наборі даних, які відрізняються використанням різних видів функцій втрат при зберіганні інших умов навчання незмінними, що показало використання функції регресійних втрат WIoU v3 найефективнішою для побудованої моделі; – вперше проведено моделювання експериментів на невеликій кількості зображень при додаванні до базової моделі блоків детектування групи PFNB, які об'єднують дрібні особливості шарів нейронної згорткової мережі, що збільшує на невеликому наборі даних усереднене значення mAP та при їх одночасному використанні розмір моделі і кількість параметрів зменшується; – вперше проведено моделювання експериментів на покращеній моделі YOLO v9 P, яка відрізняється від базової моделі YOLO v9 функцією втрат, методом злиття та модифікованою архітектурою блоку розпізнавання, що на невеликому наборі даних дозволило отримати покращення усередненого значення mAP на 7,7% і AP від 2,5% до 14,1%.

Публікації

Федій О.Д., Божуха Л.М. Про підходи визначення місцезнаходження об’єктів. Науковий журнал «Математичне моделювання». 2021. Вип. 2(45). С. 39-46. DOI: https://doi.org/10.31319/2519- 8106.2(45)2021.246874 URL: http://matmod.dstu.dp.ua/article/view/246874 (фахове видання категорії Б)

Сизоненко О.Д., Божуха Л.М. Підвищення точності геолокації об’єкта на цифровому зображенні при використанні комбінованих технологій аналізу даних. Науковий журнал «Актуальні проблеми автоматизації та інформаційних технологій». 2022. Т.26. С. 103-109. DOI: http://dx.doi.org/10.15421/432213 URL: https://actualproblems.dp.ua/index.php/APAIT/article/view/221 (фахове видання категорії Б)

Сизоненко О.Д., Божуха Л.М. Методи локалізації об’єктів на основі зображень із використанням комбінації алгоритмів та багатопоточної зв’язки Faster R-CNN. Актуальні проблеми автоматизації та інформаційних технологій. 2023. Т.27. C. 164-177. DOI: http://dx.doi.org/10.15421/432316 URL: https://actualproblems.dp.ua/index.php/APAIT/article/view/241 (фахове видання категорії Б)

Сизоненко О.Д., Божуха Л.М. Порівняння YOLO V5 та Faster R- CNN для виявлення об’єктів на зображенні в потоковому режимі. Системні технології. 2024. 1(150). С. 51-60. DOI: https://doi.org/10.34185/1562-9945-1- 150-2024-05 URL: https://journals.nmetau.edu.ua/index.php/st/article/view/1523 (фахове видання категорії Б)

Сизоненко О. Д., Божуха Л.М. Виявлення місцезнаходження бпла за допомогою зіставлення зображень з використанням ключових точок. XXI Міжнародна науково-практична конференція «Математичне та програмне забезпечення інтелектуальних систем»: тези доповідей наукової конференції за підсумками науково-дослідної роботи ДНУ за 2023 рік. Дніпро, 2023, С. 266-267, URL: http://mpzis.dnu.dp.ua/wp-content/uploads/2023/11/mpzis- 2023.pdf

Сизоненко О.Д., Божуха Л.М. Виявлення місцезнаходження об’єктів за допомогою GIS. XХ Міжнародна науково-практична конференція “Математичне та програмне забезпечення інтелектуальних систем”: тези доповідей наукової конференції за підсумками науково-дослідної роботи ДНУ за 2022 рік. Дніпро, 2022, С. 178, URL: http://mpzis.dnu.dp.ua/wp- content/uploads/2022/12/MPZIS-2022-1.pdf

Федій О.Д., Божуха Л.М. Про алгоритми позиціювання об’єктів в локальній мережі. XIХ Міжнародна науково-практична конференція “Математичне та програмне забезпечення інтелектуальних систем”: тези доповідей наукової конференції за підсумками науково-дослідної роботи ДНУ за 2021 рік. Дніпро, 2021, С. 201, URL: http://mpzis.dnu.dp.ua/wp- content/uploads/2021/11/mpzis_2021.pdf

Сизоненко О.Д., Божуха Л.М. Методи прив'язки зображення до геолокації. Всеукраїнська науково-методична конференція “Проблеми математичного моделювання”: тези доповідей Всеукраїнської науково- методичної конференції за 2022 рік. Кам'янське, 2022, С. 84, URL: https://www.dstu.dp.ua/uni/downloads/zbirka_konf_pm.pdf

Файли

Схожі дисертації