Попов С. В. Штучні нейронні мережі зі спеціалізованими архітектурами в задачах обробки часових рядів

English version

Дисертація на здобуття ступеня доктора наук

Державний реєстраційний номер

0510U000045

Здобувач

Спеціальність

  • 05.13.23 - Системи та засоби штучного інтелекту

28-12-2009

Спеціалізована вчена рада

Д 64.052.01

Харківський національний університет радіоелектроніки

Анотація

Об'єкт дослідження - процеси різної фізичної природи, що описуються часовими рядами. Мета дослідження - синтез спеціалізованих архітектур штучних нейронних мереж (ШНМ) для розв'язання задач обробки часових рядів, що дозволяють враховувати апріорну інформацію про властивості сигналів, що моделюються, і факторів, які впливають на них, а також дозволяють здобувати з даних нову інформацію про ці властивості. Методи дослідження - теорія штучних нейронних мереж, що дозволила синтезувати нові типи нейронів і архітектури ШНМ; теорія оптимізації та лінійна алгебра, що дозволили удосконалити методи навчання ШНМ; теорія нечіткої логіки, що дозволила врахувати вплив факторів, заданих у порядковій і номінальній шкалах вимірювання; математичний аналіз, що дозволив виявити властивості аналізованих функцій; імітаційне моделювання, що підтвердило вірогідність отриманих теоретичних результатів; математична статистика, що дозволила дослідити результати експериментів. Теоретичні і практичні результати - розроблено загальний підход до проблеми урахування апріорної інформації про властивості оброблюваного часового ряду та факторів, що впливають на нього, при синтезі спеціалізованих архітектур нейро-фаззі мереж, заснованого на фаззіфікації вхідних змінних за допомогою функцій належності різних типів, що дозволило обробляти дані, задані в різних шкалах вимірювання (кількісній, порядковій, номінальній) і враховувати інформацію про форму впливу різних факторів; розроблено низхідний підхід до розв'язання задачі нелінійної декомпозиції дійсних функцій, що не потребує апріорної інформації про властивості функції, яка аналізується, що дозволяє виявляти нову інформацію про властивості сигналів, які моделюються, і факторів, що впливають на них; удосконалено методи об'єднання ансамблів нейронних мереж та навчання нейронних мереж, що враховують особливості задач обробки часових рядів. Наукова новизна - вперше запропоновано спеціалізовану архітектуру нейро-фаззі мережі з прямою передачею інформації та спеціалізовані архітектури рекурентних нейро-фаззі мереж, що є модифікаціями рекурентних мереж Елмана й Мадхавана та рекурентної луна-мережі, які відрізняються наявністю першого прихованого шару блоків затримки та фаззіфікації з функціями належності різних типів, що дає можливість враховувати апріорну інформацію про властивості оброблюваного часового ряду та факторів, що впливають на нього; вперше запропоновано архітектуру нейро-фаззі елемента, який відрізняється від відомого нео-фаззі нейрона наявністю додаткової нелінійності у вигляді "стискальної" активаційної функції, що дозволило обмежити діапазон змінення його вихідного сигналу; вперше запропоновано спеціалізовану нейро-фаззі мережу на базі нейро-фаззі елементів і динамічних нейронів із скінченною імпульсною характеристикою, яка відрізняється гібридною неповнозв'язною архітектурою, що дозволило збільшити гнучкість спеціалізації нейро-фаззі мережі й скоротити кількість параметрів, що настроюються; вперше запропоновано архітектуру гібридного нейроподібного елемента, який відрізняється можливістю одночасного використання лінійних та нелінійних синапсів, а також синапсів-фільтрів із скінченною й нескінченною імпульсними характеристиками, що дає можливість будувати спеціалізовані архітектури нейро-фаззі мереж із заданими властивостями; вперше запропоновано архітектуру спеціалізованої нейро-фаззі мережі на основі гібридних нейроподібних елементів, яка відрізняється від відомих архітектур можливістю незалежного вибору типу й параметрів окремих синапсів мережі відповідно до наявної апріорної інформації про властивості вхідних змінних і прогнозованого часового ряду, що дозволило скоротити число параметрів, що настроюються, і поліпшити узагальнюючі властивості мережі; вперше запропоновано спеціалізовану архітектуру ШНМ для нелінійної декомпозиції дійсних функцій, яка відрізняється наявністю декількох підмереж, які апроксимують незалежні впливи окремих вхідних сигналів, що дає можливість виявляти нову інформацію про властивості оброблюваних часових рядів і факторів, що впливають на них; удосконалено метод навчання нейро-фаззі елемента, який відрізняється застосуванням робастного критерію навчання, що дозволило зменшити похибки при обробці даних, які містять аномальні спостереження; удосконалено метод об'єднання ансамблю ШНМ, що обробляють багатовимірні дані, який відрізняється обмеженням на невід'ємність вагових коефіцієнтів, що дає можливість оцінити "внесок" кожної з мереж, що входять в ансамбль, до об'єднаної оцінки; удосконалено метод навчання ШНМ, який відрізняється урахуванням симетрії простору їхніх параметрів, пов'язаної з можливістю перестановки обчислювальних елементів у прихованих шарах і одночасної зміни знаків груп параметрів, що дозволило значно скоротити об'єм області пошуку розв'язку оптимізаційної задачі; удосконалено метод навчання ШНМ, який, на відміну від відомих, не потребує передобробки пропущених значень, що дає можливість безпосередньо працювати з неповними вибірками і отримувати оцінки пропущених значень на основі представлення вибірки в просторі зниженої розмірності. Ступінь упровадження - результати досліджень впроваджено в ТОВ "Хартеп", м. Харків, що підтверджено актом від 30.07.2009 р., та у НЕК "Укренерго", м. Київ, що підтверджено актом від 03.09.2009 р.; наукові положення, висновки і рекомендації, викладені в дисертації, було використано при підготовці курсів "Нейромережеві методи обчислювального інтелекту" та "Інтелектуальні системи керування та діагностики", які читаються студентам спеціальності "Інтелектуальні системи прийняття рішень" Харківського національного університету радіоелектроніки, що підтверджено актом від 10.09.2009 р., а також у науково-дослідних роботах Харківського національного університету радіоелектроніки, що підтверджено актом від 14.09.2009 р. Сфера використання - в організаціях, що займаються аналогічними проблемами розробки інтелектуальних систем та методів обробки часових рядів; у галузях інформаційних технологій, фінансів, медицини, біології, екології, енергетики, транспорту; у навчальному процесі при підготовці фахівців у галузях систем інтелектуальної обробки інформації.

Файли

Схожі дисертації