Белас А. О. Моделі і методи інтелектуального аналізу даних для прогнозування нелінійних нестаціонарних процесів

English version

Дисертація на здобуття ступеня доктора філософії

Державний реєстраційний номер

0823U100148

Здобувач

Спеціальність

  • 122 - Комп’ютерні науки

09-03-2023

Спеціалізована вчена рада

ДФ 26.002.11

Національний технічний університет України "Київський політехнічний інститут імені Ігоря Сікорського"

Анотація

У дисертаційному дослідженні розв’язана задача підвищення адекватності математичних моделей нелінійних нестаціонарних фінансово-економічних процесів та точності відповідних прогнозів, шляхом застосування сучасних методів інтелектуального аналізу даних до статистичних даних, представлених у вигляді часових рядів. В роботі вибрано, розглянуто і описано класи нелінійних нестаціонарних процесів, що використані для моделювання та прогнозування, а також виконано опис математичних моделей та підходів, що на базі статистичних даних у вигляді часових рядів, використовуються для опису їх динаміки. Вибрано типи процесів для дослідження, такі як: інтегровані, гетероскедастичні процеси, процеси Леві, процеси зі стохастичним трендом, процеси логістичного типу. В роботі вибрано клас фінансово-економічних процесів, сформульовано задачу їх прогнозування. Однак розроблену методику можливо застосовувати і в інших системах (технічних, медичних, тощо) з відповідною визначеною динамікою. Для прогнозування розглянуто підхід предиктивної аналітики з використанням методів інтелектуального аналізу даних. Методологічною основою роботи є сучасна аналітична методологія SEMMA. Зібрано статистичні дані для експериментів на базі продажів магазину Walmart, продажів протидіабетичних препаратів в Австралії, продажу пального в США для застосування розробленої методики на реальних статистичних даних. Для первинного аналізу даних запропоновано підходи статистичного та графічного аналізу, а також статистичні тести для визначення нелінійності та нестаціонарності процесу: вибрано тест Уайта для перевірки на нелінійність та тест KPSS для перевірки на нестаціонарність як основні. Розглянуто методи для виявлення та обробки аномальних та пропущених значень. Для виділення шумової складової з часового ряду розглянуто фільтр Калмана та метод експонеційного згладжування. Підходи цифрової фільтрації варто застосовувати обережно, не завжди як необхідний етап процесу побудови моделі, а як можливий варіант, обов’язково перевіряючи в кінці процесу моделювання якість отриманих прогнозів з та без використання попередньої фільтрації. В роботі запропоновано метод побудови моделей нелінійних процесів, що відрізняється застосуванням окремих процедур для оптимізації структури лінійної та нелінійної складових моделі з їх наступним адитивним об’єднанням в єдину модель, що забезпечує підвищення адекватності моделі і точності прогнозів у цілому. Розглянуто різні методи комбінування оцінок прогнозів різних моделей, вибрано метод бустінгу як основний для використання в роботі. Описано підхід для виділення та моделювання лінійної складової процесу на базі регресійних моделей, а також підхід з використання отриманої моделі AR для формування оцінок прогнозів, розглянуто і вибрано критерії для оцінки адекватності отриманих моделей, такі як BIC. Для оцінок якості прогнозів побудовано критеріальну базу на базі критеріїв MSE, MAE, RMSLE. Для опису нелінійної складової розглянуто авторегресивний підхід на базі ARIMA, з алгоритмом автоматичної побудови моделі, а також підходи на базі рекурентних (RNN) і згорткових (СNN) нейронних мереж, проаналізовано їх переваги та недоліки. Для нейронних мереж проаналізовано підходи до оптимізації параметрів моделі, запропоновано алгоритм Adam, як найбільш ефективний. Розглянуто різні підходи для багатокрокового прогнозування за допомогою нейронних мереж, вибрано підхід із застосуванням multi-output мереж як основний. Розглянуто необхідність адаптивної побудови моделей для прогнозування нелінійних нестаціонарних процесів, основні принципи адаптації таких моделей. Розглянуто відповідні підходи до адаптації як для лінійних моделей, так і для нейронних мереж. Для адаптації лінійних моделей удосконалено метод оцінювання параметрів на основі методу Монте-Карло для марківських ланцюгів. Проведено порівняльний аналіз отриманих прогнозів з результатами використання відомих підходів та методів. За результатами всіх практичних експериментів було показано, що використання розробленого підходу AR-CNN дозволяє отримувати адекватні моделі та точні прогнози при відносній простоті побудові та невеликих обчислювальних втратах.

Файли

Схожі дисертації