Горносталь О. А. Ансамблевий метод ідентифікації стану комп'ютерних систем

English version

Дисертація на здобуття ступеня доктора філософії

Державний реєстраційний номер

0824U001783

Здобувач

Спеціальність

  • 123 - Комп’ютерна інженерія

20-06-2024

Спеціалізована вчена рада

ДФ 64.050.138-5697

Національний технічний університет "Харківський політехнічний інститут"

Анотація

Дисертаційна робота присвячена вирішенню актуальної науково-прикладної задачі вдосконалення, розробки та впровадження методів ідентифікацій стану комп’ютерних систем з метою покращення їх ефективності за рахунок використання ансамблевих методів машинного навчання. Метою дисертаційної роботи є підвищення якості ідентифікації стану комп’ютерних систем шляхом розробки та удосконалення методів розпізнавання аномалій та зловживань. Об’єкт дослідження – процес виявлення вторгнень у комп’ютерні системи в умовах зовнішніх впливів. Предмет дослідження – методи ідентифікації стану комп’ютерних систем на основі технології машинного навчання з використанням ансамблевих мета-алгоритмів. За результатами дослідження отримано такі наукові результати: 1. Отримав подальший розвиток метод ідентифікації стану комп’ютерної системи на основі дерев рішень та мета-алгоритму беггінг за рахунок вибору оптимальних гіперпараметрів налаштування класифікатора та використання процедури попередньої обробки даних, яка сфокусована на видаленні аномальних даних та зменшенні статистичної залежності між ознаками, що дозволило підвищити якість ідентифікації стану КС. 2. Отримав подальший розвиток ансамблевий метод ідентифікації стану комп’ютерної системи завдяки використанню багатошарового перцептрону у якості базової моделі ансамблю та вибору оптимальних гіперпараметрів налаштування класифікатора, що дозволило підвищити якість його функціонування. 3. Удосконалено ансамблевий метод ідентифікації стану комп'ютерної системи на основі гомогенного мета-алгоритму беггінг за рахунок розробки спеціальної процедури зменшення кількості базових класифікаторів та їх ранжування під час зваженого голосування, що дозволило зменшити час роботи ансамблю та підвищити якість класифікації стану КС. 4. Вперше запропоновано метод ідентифікації стану комп'ютерної системи, який відрізняється від відомих методів використанням гетерогенного мета-алгоритму беггінг та включає триетапний процес підбору базових моделей класифікатора на основі технології Pasting, що дозволило підвищити ефективність ідентифікації стану КС. Практичне значення отриманих результатів полягає в наступному: - сформовано програмну модель попередньої обробки даних, яка сфокусована на видаленні аномальних даних та зменшенні статистичної залежності між ознаками, що дозволяє збільшити швидкість розпізнавання до 1,62 разів, зменшити час навчання моделі до 24,76 разів, а також підвищити якість класифікації; - розроблено метод ідентифікації стану комп’ютерної системи, який включає сформовану процедуру попередньої обробки даних, процес вибору алгоритму формування вхідних даних та побудову беггінг-класифікатора з налаштуванням його гіперпараметрів, що дозволило підвищити якість класифікації: значення AUC-ROC класифікатору на навчальній вибірці зростає на 11%, а на тестовій вибірці – на 3%; - реалізовано програмну модель ансамблевого класифікатору на основі багатошарового перцептрону у якості базового класифікатора та процедури підбору оптимальних налаштувань його параметрів, а саме: алгоритм формування вибірок даних, кількості базових класифікаторів, функцію оптимізації ваг нейронних мереж, розмірів першого та другого прихованих шарів та функцію активації, що дозволило підвищити значення точності класифікації на 4,67%; - розроблено програмне забезпечення, яке виконує обрізку ансамблю на основі максимізації абсолютної точності базових класифікаторів та класифікує за допомогою зваженого голосування з використанням вагових коефіцієнтів на основі функції логарифмічних втрат, що дозволило підвищити показники якості класифікації беггінг-ансамблю, а саме значення метрики F1- Score – на 2,4%; - запропоновано метод формування гетерогенного ансамблю, який включає відбір базових класифікаторів, навчання на їх основі однорідних беггінг-ансамблів, створення комбінаційних груп (пулів) із базових класифікаторів та формування гетерогенного ансамблю за допомогою процедури Pasting, що дозволило підвищити якість класифікації, а саме збільшити показник F1-Score моделі при роботі на тестових даних на 9,5% у порівнянні зі стандартним однорідним беггінг-ансамблем на основі дерев рішень та на 2% у порівнянні з максимальним значенням серед однорідних ансамблів. За результатами дослідження підтверджено теоретичну та практичну цінність, проведено дослідження їх ефективності та сформовано практичні рекомендації, щодо їх застосування.

Публікації

1. О. А. Горносталь та С. Ю. Гавриленко, "Розробка адаптивних шаблонів фіксації аномальної поведінки комп'ютерної системи", Зб. наукових праць Системи обробки інформації, Харків.: ХУ ПС, 2016, Вип. 3(140), с.11-14. (Б)

2. O. Hornostal and S. Gavrylenko, V. Chelak, and V. Vassilev, "Development of a method for identification the state of a computer system using fuzzy cluster analysis", Advanced Information Systems, Kharkiv, 2020, vol. 4, no. 2, pp. 8-11. (Б)

3. O. Hornostal and S. Gavrylenko, "Development of a method for identification of the state of computer systems based on bagging classifiers", Advanced Information Systems, 2021, vol. 5, no. 4, pp. 5–9. (Б)

4. О. Горносталь та С. Гавриленко, "Метод ідентифікації стану комп’ютерної системи на основі ансамблевих класифікаторів з покращеною процедурою голосування", Системи управління, навігації та зв’язку. Збірник наукових праць, 2023, т. 3, вип. 73, с. 79-85. (Б)

5. O. Hornostal and S. Gavrylenko, "Application of heterogeneous ensembles in problems of computer system state identification", Advanced Information Systems, 2023, vol. 7, no. 4, pp. 5–12. (Б)

6. О. А. Горносталь та С. Ю. Гавриленко, "Аналіз ефективності фільтрації несприятливого мережевого трафіку з використанням комплексних систем", Інформатика, управління та штучний інтелект. Матеріали другої науково-технічної конференції студентів, магістрів та аспірантів, Харків, 2015, с. 13.

7. О. А. Горносталь та С. Ю. Гавриленко, "Виявлення аномальної поведінки комп'ютерних систем за допомогою контрольних карт Шухарта та карт кумулятивних сум", Матеріали міжнародної конференції «Проблеми науково-технічного та правового забезпечення кібербезпеки у сучасному світі», Харків, 2016, с.14-15.

8. O. Hornostal, V. Chelak, S. Gavrylenko and, S. Gornostal, "Intrusion detection in computer systems", Proceedings of the symposium "Metrology and metrology assurance", Sozopol, Bulgaria, 2016, pp. 342-347.

9. O. Hornostal, S. Gavrylenko, and V. Chelak, "Development of a heuristic scanner for an antivirus program on the basis of the Mamdani fuzzy logic method", Proceedings of the 28th International Scientific Symposium Metrology and Metrology Assurance, Sozopol, Bulgaria, 2018, pp.129-133.

10. O. Hornostal, V. Chelak, S. Gavrylenko, and S. Gornostal, "Identification of the computer system state based on multidimensional discriminant analysis", in Proceedings of the 29th International Scientific Symposium Metrology and Metrology Assurance, Sozopol, Bulgaria, 2019, pp. 192-196. (Scopus, Bulgaria)

11. O. Hornostal, and S. Gavrilenko, "Identification of Anomalies in the Behavior of a Computer System using Fuzzy Cluster Analysis", Proceedings of the 7th International Informatics, management and artificial intelligence, Kharkiv, 2019, p. 21.

12. O. Hornostal, V. Chelak, and S. Gavrylenko, "Research of Intelligent Data Analysis Methods for Identification of Computer System State", in Proceedings of the 30th International Scientific Symposium Metrology and Metrology Assurance (MMA), Sozopol, Bulgaria, 2020, pp. 1-5. (Scopus, Bulgaria)

13. O. Hornostal, S. Gavrylenko and V. Chelak, "Ensemble approach based on bagging and boosting for identification the computer system state", in Proceedings of the 31th International Scientific Symposium Metrology and Metrology Assurance, Sozopol, Bulgaria, 2021, pp. 1-7. (Scopus, Bulgaria)

14. О. А. Горносталь та С. Ю. Гавриленко, "Дослідження методів підвищення ефективності роботи беггінг-класифікаторів у задачах ідентифікації стану комп’ютерних систем", Матеріали VIII міжнародної науково-технічної конференції “Інформатика, управління та штучний інтелект" (ІУШІ-2021), Харків, 2021.

15. О. А. Горносталь та С. Ю. Гавриленко, "Дослідження беггінг-алгоритмів для ідентифікації стану комп’ютерної системи", Матеріали ІV Всеукраїнської науково-практичної інтернет-конференції студентів, аспірантів та молодих вчених за тематикою «Сучасні комп’ютерні системи та мережі в управлінні»: збірка наукових праць, під редакцією Г.О. Райко, Херсон, 2021, с. 27-28.

16. О. А. Горносталь, та С. Ю. Гавриленко, "Дослідження та вдосконалення методів підвищення точності роботи bagging-ансамблів для классифікації стану комп’ютерних систем", на дев'ятій міжнародній науково-технічної конференції "Інформатика, Управління та Штучний Інтелект" (ІУШІ-2022), Харків - Краматорськ, 2022, с. 29.

17. O. Hornostal, S. Gavrylenko, and V. Chelak, "Construction Method of Fuzzy Decision Trees for Identification the Computer System State", in Proceedings of the 32th International Scientific Symposium Metrology and Metrology Assurance, Sozopol, Bulgaria, 2022, pp. 1-5. (Scopus, Bulgaria)

18. O. Hornostal, S. Gavrylenko, and V. Chelak, "Research of Methods of Identifying the Computer Systems State based on Bagging Classifiers", in IEEE 3rd KhPI Week on Advanced Technology (KhPIWeek), Kharkiv, Ukraine, 2022, pp. 1-6. doi: 10.1109/KhPIWeek57572.2022.9916439. (Scopus, Ukraine)

19. O. Hornostal and S. Gavrylenko, "Study of Methods for Improving the Meta-Algorithm of the Bagging Classifier", 2023 IEEE 4th KhPI Week on Advanced Technology (KhPIWeek), Kharkiv, Ukraine, 2023, pp. 1-6. (Scopus, Ukraine)

20. О. А. Горносталь та С. Ю. Гавриленко, "Метод підвищення якості ансамблевого класифікатору за рахунок диверсифікації базових моделей", ХXIII Міжнародна науково-технічна конференція Проблеми інформатики та моделювання, Харків, 2023, c. 33-34.

Файли

Схожі дисертації