Хмільовий С. В. Інформаційна технологія видобування знань для прогнозування часових рядів на прикладі завантаженості обладнання зв'язку.

English version

Дисертація на здобуття ступеня кандидата наук

Державний реєстраційний номер

0409U004088

Здобувач

Спеціальність

  • 05.13.06 - Інформаційні технології

26-06-2009

Спеціалізована вчена рада

К11.051.08

Анотація

Дисертація на здобування вченої степені кандидату технічних наук за спеціальністю 05.13.06 - інформаційні технології. - ДонНУ, Донецьк, 2008. В дисертації розглядається важлива науково-практична проблема видобування знань при прогнозуванні часових рядів. На етапі попередньої обробки даних найважливішим для даної задачі признано відбір значущих факторів. За умов стохастичності оцінки набору факторів (що отримується при прогнозуванні часових рядів за допомогою нейронних мереж) відомі методи мало використовувані та потребують модифікації. Запропоновано компактний генетичний алгоритм, модифіковано величину зміни його імовірнісного вектору. Модифікація змінює величину імовірнісного вектору КГА в залежності від достовірності порівняння підмножин атрибутів. Задача видобування знань виконувалась шляхом автоматичної побудови бази нечітких правил (бази знань). Автоматична побудова правил виконується еволюційним алгоритмом. Для поліпшення точності правил бази знань, що створюється, модифікована фітнес-функція еволюційного алгоритму. З базової функції зберігаються частини, що відповідають за несхожість правил та за мале покриття помилкових точок. Головною "точністною" частиною є J-міра. Модифікована лінгвістична база даних (ЛБД) для поліпшення точності отримуваної бази знань. Модифікація системи нечіткого висновку шляхом заміни алгоритму Мамдані на спрощений алгоритм нечіткого висновку дозволяє використовувати любий вид функції належності. Оптимізація параметрів ЛБД на основі довільного виду функції належності за допомогою (1+1) - еволюційної стратегії дозволило практично досягнути точність прогнозу, що отримується НМ. Вперше для створення бази знань на основі нечітких правил розроблено паралельний еволюційний алгоритм. Він дозволяє збільшувати швидкість створення бази знань практично лінійно при малій кількості клієнтів, що генерують правила. Модифіковано етап постпроцесінгу, де запропоновано засоби як для поліпшення точності, так і для інтерпретуємості правил: мультисимпліфікація, зважування правил, тюнинг. Доведено ефективність введення 1+1 - еволюційної стратегії в процедуру тюнингу. Розроблені алгоритми програмного забезпечення інформаційної технології, спроектована ієрархія об'єктів для об'єктно-орієнтованої програмної реалізації. Створене програмне забезпечення апробоване на тестових наборах (benchmarks), доведена успішність запропонованих методів та модифікацій. Розроблено технічне і організаційне забезпечення технології. Проведена апробація пакету на ОАО "Промтелеком" для задачі прогнозування завантаженості обладнання і прогнозування для цього кількості підключень до АТС підприємства. Ключові слова: інформаційна технология, відбір значущих факторів, генетичний алгоритм, система нечіткого висновку, база знаний, прогнозування часових рядів, автоматична побудова нечітких правил, постпроцесинг правил, інтерпретуємість.

Файли

Схожі дисертації