Мельниченко А. В. Методи та програмні засоби підвищення швидкодії моделей розпізнавання образів на основі машинного навчання

English version

Дисертація на здобуття ступеня доктора філософії

Державний реєстраційний номер

0824U001849

Здобувач

Спеціальність

  • 121 - Інженерія програмного забезпечення

Спеціалізована вчена рада

ДФ 26.002.171; ID 5617

Національний технічний університет України "Київський політехнічний інститут імені Ігоря Сікорського"

Анотація

Дисертаційна робота присвячена аналізу методів оптимізації нейронних мереж і розробці програмних засобів для збільшення швидкодії нейронних мереж під час навчання і виконання. У сучасному високотехнологічному світі, нейронні мережі вийшли на передній план як ключова технологія. Ця варіація математичних моделей продемонструвала високу ефективність у багатьох задачах, що варіюються від комп'ютерного зору до розуміння природніх мов, тим самим ставши невід'ємною частиною щоденного життя. Втім, розгортання нейронних мереж у реальних сценаріях часто ускладняється їхньою обчислювальною складністю та ресурсоємністю. Великий об’єм енергоспоживання, що потребується для навчання і використання великих моделей нейронних також має негативний вплив на навколишнє середовище. Обчислювальна складність часто проявляється у вигляді великої кількості параметрів та глибоких архітектур, які вимагають значного об’єму обчислювальної потужності як для навчання, так і для подальшого використання на кінцевих пристроях. Ця складність є особливо проблематичною в застосуваннях нейронних мереж на пристроях Інтернету речей (IoT), де обчислювальні ресурси часто обмежені. Ресурсоємні характеристики включають в себе обчислювальну потужність і використання пам'яті. Це питання є особливо актуальним у мобільних та вбудованих пристроях, де пам'ять є обмеженим ресурсом. Більше того, затримка, спричинена нестачею ресурсів, часто є неприйнятною в ряді задач, що включає в себе системи автономного керування, де навіть невелика затримка в прийнятті рішень може мати серйозні наслідки. Оптимізація нейронних мереж є актуальною задачею в технологічній галузі, що підкреслюється емпіричними даними. Об’єм обчислювальних ресурсів, необхідний для навчання найсучасніших нейронних мереж, подвоювався приблизно кожні 3 місяці з 2012 року. Це експоненційне зростання обчислювальних вимог не є сталим на довгострокову перспективу, особливо з урахуванням енергоспоживання та екологічного впливу, пов'язаного з дата-центрами. Метою дисертації є збільшення ефективності моделeй нейронних мереж, а саме зменшення втрати точності при збільшенні швидкодії, після застосування методів оптимізації моделей глибинного навчання, створених для вирішення задач комп’ютерного зору. Наукова новизна одержаних результатів полягає в наступному. Удосконалено модель нейронної мережі для виявлення облич RetinaFace, яка на відміну від існуючих використовує метод прунінгу SNIP для оптимізації, що дозволяє використовувати розріджені матриці для зберігання і виконання мережі з метою подальшого удосконалення та збільшення швидкодії. Удосконалено метод прунінгу SNIP для моделі виявлення облич RetinaFace, який на відміну від існуючих передбачає можливість виключення контекстних модулів з процесу прунінгу. Вдосконалений метод дозволяє досягти більшої точності при незмінній кількості виключених параметрів. Вперше розроблено метод прунінгу перед навчанням для моделей архітектури трансформер, який на відміну від існуючих враховує важливість механізму «уваги». Використання розробленого методу дозволяє значно збільшити точність класифікації кінцевої моделі в порівнянні з методом SNIP. Вперше розроблено архітектуру програмного забезпечення для моделювання та дослідження методів прунінгу перед навчанням нейронних мереж, яка на відміну від існуючих дозволяє приводити матриці вагових коефіцієнтів мережі до розрідженого формату, використовуючи запропонований механізм оцінки важливості вагів. Оптимізована мережа RetinaFace містить на 68% параметрів менше ніж початкова мережа при втраті точності на лише 1.4%. Вдосконалений метод дозволив зменшити втрати точності з 1.4% до 0.7% порівняно з методом SNIP при порівнянні з необрізаною моделлю, при скороченні параметрів на 68%. Реалізація методу прунінгу для архітектури трансформер дозволила натренувати мережу з покращенням точності до 37% порівняно з методом SNIP при порівнянні з необрізаною моделлю, при скороченні кількості параметрів на 90%. Встановлено, що результати визначення критеріїв важливості вагів, отриманих розробленим алгоритмом, можуть бути використані для підвищення швидкодії нейронних мереж від 20% до 65% шляхом використання розріджених матриць формату 2:4, в залежності від графічного процесора. Встановлено, що додаткові виходи для сіамських нейронних мереж, призначених для встановлення схожості двох зображень, не дають приросту в швидкості сходження і точності моделі.

Публікації

Melnychenko, A., Zdor K. Incorporating attention score to improve foresight pruning on transformer models. Computer Science and Applied Mathematics, 2023, №2, pp.22-28

Melnychenko, A., Shaldenko, O. Evaluation of a snip pruning method for a state-of-the-art face detection model. Computational Problems of Electrical Engineering, 2023, Vol. 12, №1, pp. 18-22

Melnychenko, A., Zdor, K. Efficiency of supplementary outputs in siamese neural networks. Advanced Information Systems, 2023,Volume 7, №3, pp. 49–53

Мельниченко, А., Шалденко, О. Особливості використання прунінгу перед тренуванням нейронної мережі для детекції обличчя, ХХ Міжнародна науково-практична конференція молодих вчених і студентів, 25‒28 квітня 2023 року, Київ, Україна

Melnychenko A. Evaluating SNIP pruning method on the state-of-the-art face detection model. Modern scientific research: achievements, innovations and development prospects, XVI Міжнародна науково-практична конференція, 11-13 вересня 2022 року, Берлін, Німеччина. С. 68-72.5. Melnychenko A. Evaluating SNIP pruning method on the state-of-the-art face detection model. Modern scientific research: achievements, innovations and development prospects, XVI Міжнародна науково-практична конференція, 11-13 вересня 2022 року, Берлін, Німеччина. С. 68-72.

Melnychenko, A., Zdor, K. Applying classification and regression supplemetary output in siamese neural network using fashion MNIST and plantvillage datasets, VII Міжнародна науково-практична конференція “Modern problems of science, education and society”, 11-13 вересня 2023 Київ, Україна, С. 126-129.

Melnychenko, A., & Zdor, K. Appling classification and regression supplemetary outputs in siamese neural network using plantvillage dataset, I Міжнародна науково-практична конференція “Current challenges of science and education”, 18-20 вересня 2023, Берлін, Німеччина. С. 79-82.

Melnychenko A., Zdor K. Appling classification and regression supplemetary output in siamese neural network using fashion MNIST and plantvillage datasets, X Міжнародна науково-практична конференція “Innovations and prospects in modern science”, 25-27 вересня 2023, Стокгольм, Швеція. С. 87-92.

Мельниченко A., Здор K. Збільшення ефективності оптимізації моделей архітектури ViT перед навчанням шляхом включення активацій механізму самоуваги, I міжнародна науково–практична конференція “Сучасні аспекти інженерії програмного забезпечення”, 14 грудня 2023, Київ, Україна.

Мельниченко А.В., Здор К.А. Врахування механізмів самоуваги при прунінгу моделей нейронних мереж Vision Transformer. Збірник матеріалів ІІІ Міжнародної науково-технічної конференції “Системи і технології зв’язку, інформатизації та кібербезпеки: актуальні питання і тенденції розвитку”, 30 листопада 2023 року, Київ, Україна. С. 214 – 215.

Файли

Схожі дисертації