Syzonenko O. Development of technology and software tools for detecting and recognizing objects in real time

Українська версія

Thesis for the degree of Doctor of Philosophy (PhD)

State registration number

0824U002601

Applicant for

Specialization

  • 121 - Інженерія програмного забезпечення

29-08-2024

Specialized Academic Board

ДФ 08.051.109 ID 6570 Сизоненко О.Д.

Oles Honchar Dnipro National University

Essay

The relevance of the research topic is due to the existing contradiction between the complexity of deep learning models when using existing software solutions, on the one hand, and the growing difficulty of interpreting these models in an application with an increase in the speed of the procedure for recognizing and tracking objects in real time, on the other hand. The field of application of unmanned aerial vehicles (UAVs) is constantly growing and there is a need to adapt machine learning algorithms and deep learning models for use on board UAVs, taking into account the limited computing resources and the specifics of organizing the received video data stream. The paper emphasizes the importance of existing architectural solutions for the implementation of convolutional neural networks when using machine learning methods and algorithms. The identified contradiction is overcome by introducing additional conditions for the task of processing a large set of video stream images that are constantly updated and can contain information about objects of different sizes and shapes for the task of recognition and tracking. The necessity of using an adapted loss function in the proposed software solution to support decision-making based on the observed data is emphasized. The task of fusing features of convolutional neural networks for spatial and temporal flows is relevant in this area. The purpose of the study is to improve the accuracy of detection, recognition and tracking of objects in real time and to implement the corresponding technology in the form of a software tool for the task as part of intelligent systems. The object of research is the processes of data processing in the tasks of detecting, recognizing and tracking objects in real time. The subject of the study is models, algorithms and technologies for using convolutional neural networks to solve the problem of recognizing and tracking an object in real time. The scientific novelty of the research results is as follows: – for the first time, an architectural solution for building a neural convolutional network for the task of detecting, recognizing, and tracking objects in real time has been developed, which differs from the existing solution in that it uses a larger number of object recognition units of different sizes, which is optimized for the tasks of a specific subject area; – for the first time, the possibility of using the PFNB block in the developed technology, which is based on the Faster-Net architectural solution, which uses a multi-scale feature fusion network to demonstrate improved recognition accuracy compared to the basic technology, has been substantiated; – for the first time, an own dataset was formed to test the developed technology starting from the stage of object recognition in a video stream, which includes objects of different scales of a certain subject area, which confirms the effectiveness of the developed model; – for the first time, the architecture of a cross-platform library for the implementation of object detection, recognition and tracking technology is proposed, which is a five-scale structure and contains the BiFormer attention mechanism with low computing power, which improves the accuracy of detecting small objects and improves attention to key information on the object map; – for the first time, comparative experiments were simulated on YOLO v9, which differ in the use of different types of loss functions while keeping other training conditions unchanged, which showed the use of the WIoU v3 regression loss function to be the most effective for the built model; – for the first time, experiments were simulated when adding to the basic model the detection units of the PFNB group, which combine small features of the layers of the neural convolutional network, which increases the average value of mAP and, when used simultaneously, the model size and the number of parameters decrease; – for the first time, experiments were simulated on the improved YOLO v9 P model, which differs from the basic YOLO v9 model in the loss function, fusion method and modified architecture of the recognition unit, which allowed to improve the average mAP value by about 7.7% and AP by about 2.5% to 14.1%.

Research papers

Федій О.Д., Божуха Л.М. Про підходи визначення місцезнаходження об’єктів. Науковий журнал «Математичне моделювання». 2021. Вип. 2(45). С. 39-46. DOI: https://doi.org/10.31319/2519- 8106.2(45)2021.246874 URL: http://matmod.dstu.dp.ua/article/view/246874 (фахове видання категорії Б)

Сизоненко О.Д., Божуха Л.М. Підвищення точності геолокації об’єкта на цифровому зображенні при використанні комбінованих технологій аналізу даних. Науковий журнал «Актуальні проблеми автоматизації та інформаційних технологій». 2022. Т.26. С. 103-109. DOI: http://dx.doi.org/10.15421/432213 URL: https://actualproblems.dp.ua/index.php/APAIT/article/view/221 (фахове видання категорії Б)

Сизоненко О.Д., Божуха Л.М. Методи локалізації об’єктів на основі зображень із використанням комбінації алгоритмів та багатопоточної зв’язки Faster R-CNN. Актуальні проблеми автоматизації та інформаційних технологій. 2023. Т.27. C. 164-177. DOI: http://dx.doi.org/10.15421/432316 URL: https://actualproblems.dp.ua/index.php/APAIT/article/view/241 (фахове видання категорії Б)

Сизоненко О.Д., Божуха Л.М. Порівняння YOLO V5 та Faster R- CNN для виявлення об’єктів на зображенні в потоковому режимі. Системні технології. 2024. 1(150). С. 51-60. DOI: https://doi.org/10.34185/1562-9945-1- 150-2024-05 URL: https://journals.nmetau.edu.ua/index.php/st/article/view/1523 (фахове видання категорії Б)

Сизоненко О. Д., Божуха Л.М. Виявлення місцезнаходження бпла за допомогою зіставлення зображень з використанням ключових точок. XXI Міжнародна науково-практична конференція «Математичне та програмне забезпечення інтелектуальних систем»: тези доповідей наукової конференції за підсумками науково-дослідної роботи ДНУ за 2023 рік. Дніпро, 2023, С. 266-267, URL: http://mpzis.dnu.dp.ua/wp-content/uploads/2023/11/mpzis- 2023.pdf

Сизоненко О.Д., Божуха Л.М. Виявлення місцезнаходження об’єктів за допомогою GIS. XХ Міжнародна науково-практична конференція “Математичне та програмне забезпечення інтелектуальних систем”: тези доповідей наукової конференції за підсумками науково-дослідної роботи ДНУ за 2022 рік. Дніпро, 2022, С. 178, URL: http://mpzis.dnu.dp.ua/wp- content/uploads/2022/12/MPZIS-2022-1.pdf

Федій О.Д., Божуха Л.М. Про алгоритми позиціювання об’єктів в локальній мережі. XIХ Міжнародна науково-практична конференція “Математичне та програмне забезпечення інтелектуальних систем”: тези доповідей наукової конференції за підсумками науково-дослідної роботи ДНУ за 2021 рік. Дніпро, 2021, С. 201, URL: http://mpzis.dnu.dp.ua/wp- content/uploads/2021/11/mpzis_2021.pdf

Сизоненко О.Д., Божуха Л.М. Методи прив'язки зображення до геолокації. Всеукраїнська науково-методична конференція “Проблеми математичного моделювання”: тези доповідей Всеукраїнської науково- методичної конференції за 2022 рік. Кам'янське, 2022, С. 84, URL: https://www.dstu.dp.ua/uni/downloads/zbirka_konf_pm.pdf

Files

Similar theses