Волкова В. В. Методи нечіткої кластеризації політематичних текстових документів

English version

Дисертація на здобуття ступеня кандидата наук

Державний реєстраційний номер

0411U001076

Здобувач

Спеціальність

  • 05.13.23 - Системи та засоби штучного інтелекту

22-12-2010

Спеціалізована вчена рада

Д 64.052.01

Харківський національний університет радіоелектроніки

Анотація

Об'єкт дослідження - процес класифікації та кластеризації політематичних текстових документів у інтелектуальних системах обробки документів. Предмет дослідження - методи адаптивної нечіткої кластеризації політематичних текстових документів. Методи дослідження базуються на методах штучного інтелекту, зокрема на методах теорії штучних нейронних мереж, процедурах генетичної оптимізації, а також послідовного комплекс-методу пошуку екстремуму функцій багатьох змінних. Теоретичні та практичні результати роботи у сукупності є розв'язанням актуальної науково-практичної задачі, пов'язаної з підвищенням ефективності нечіткої кластеризації політематичних текстових документів у режимі послідовної обробки даних. Наукова новизна: 1) вперше запропоновано модель адаптивної нечіткої нейронної мережі, що самоорганізується, яка відрізняється від інших нейронних мереж використанням спеціальних нелінійних обчислювачів, які дозволяють знаходити рівні належності вхідних образів документів до кластерів; 2) вперше розроблені рекурентні ймовірнісний та можливісний методи навчання для запропонованої адаптивної нечіткої нейронної мережі, що самоорганізується, які відрізняються від інших методів навчання нейронних мереж наявністю фаззіфікатора, що дозволило в процесі роботи методів виявляти нові кластери; 3) вперше запропоновано модель системи кластеризації політематичних текстових документів, яка відрізняється від існуючих моделей наявністю двох паралельно працюючих адаптивних нечітких нейронних мереж, що самоорганізуються; 4) вперше розроблено метод автоматичної кластеризації політематичних текстових документів на основі генетичного алгоритму зі штучним відбором; 5) набув подальшого розвитку метод навчання для нейронних мереж, що самоорганізуються, який на відміну від правила навчання "переможець отримує все", містить оцінку рівня належності спостережень кожному з наявних кластерів на основі функції належності. Ступінь впровадження - в науковій бібліотеці ХНУРЕ та науково-технічній бібліотеці Національного аерокосмічного університету ім. М.Є. Жуковського "Харківський авіаційний інститут", а також на кафедрі штучного інтелекту Харківського національного університету радіоелектроніки. Сфера використання - в організаціях, що займаються проблемами розробки інтелектуальних систем нечіткої кластеризації даних, а також у навчальному процесі при підготовці фахівців у галузі систем інтелектуальної обробки інформації.

Файли

Схожі дисертації