Шубкіна О. В. Методи та моделі семантичного анотування текстових документів з використанням штучних нейронних мереж

English version

Дисертація на здобуття ступеня кандидата наук

Державний реєстраційний номер

0412U000073

Здобувач

Спеціальність

  • 05.13.23 - Системи та засоби штучного інтелекту

21-12-2011

Спеціалізована вчена рада

Д 64.052.01

Харківський національний університет радіоелектроніки

Анотація

Об'єкт дослідження - процес видобування знань в системах інтелектуальної обробки документів. Предмет дослідження - методи та моделі семантичного анотування текстових документів з використанням штучних нейронних мереж. Методи дослідження базуються на методах штучного та обчислювального інтелекту, технології Semantic Web та принципах обробки природно-мовної інформації. Теоретичні та практичні результати роботи у сукупності є розв'язанням актуальної науково-практичної задачі, пов'язаної з підвищенням ефективності генерації семантичних анотацій текстових документів у режимі послідовної обробки даних. Наукова новизна: 1) вперше запропоновано ієрархічну багатошарову радіально-базисну нейронну мережу, яка в кожному вузлі використовує радіально-базисну нейронну мережу зниженої розмірності, що дозволяє зменшити кількість ознак, які надходять на вхід кожного шару за умов обмеженої навчальної вибірки для формування семантичних анотацій текстових документів; 2) вперше запропоновано ймовірнісні нейронні мережі спеціального виду, а саме: модифіковану та конкурентну, які розроблені на основі гібридизації стандартної ймовірнісної та узагальненої регресійної нейронних мереж, а також самоорганізовних мап Кохонена, що забезпечує простоту реалізації і високу швидкість обробки та дозволяє отримувати ймовірності належності вхідного текстового об'єкта до кожного з потенційно можливих класів онтології ПрО для генерації семантичних анотацій в послідовному режимі, по мірі надходження текстових документів; 3) вперше запропонована ймовірнісна модель семантичного анотування текстових документів на основі введення в моделі опису RDF-структур імовірнісної складової, що дозволяє формувати метадані текстових документів з урахуванням ймовірностей належності текстового об'єкта до концепта онтології ПрО та забезпечує оцінку відношення текстових даних щодо поточної онтології; 4) набула подальшого розвитку модель семантичного анотування з урахуванням бінарних виходів штучної нейронної мережі, яка відрізняється від моделей опису семантичних анотацій на основі RDF-структур використанням інформації з виходів ШНМ, поданої у бінарному вигляді, що дозволило доповнити нею формовані семантичні анотації текстових документів за умов обмеженої вибірки. Ступінь впровадження - на ТОВ "Компанія СМІТ" (м. Харків), а також на кафедрі штучного інтелекту Харківського національного університету радіоелектроніки. Сфера використання - в організаціях, що займаються проблемами розробки інтелектуальних систем аналізу текстових даних, а також у навчальному процесі при підготовці фахівців у галузі систем інтелектуальної обробки інформації.

Файли

Схожі дисертації