Ніколаєвський О. Ю. Моделі, методи та інформаційна технологія автоматизованого опрацювання текстів на природній мові

English version

Дисертація на здобуття ступеня кандидата наук

Державний реєстраційний номер

0417U004041

Здобувач

Спеціальність

  • 05.13.06 - Інформаційні технології

20-10-2017

Спеціалізована вчена рада

Д 26.056.01

Київський національний університет будівництва і архітектури

Анотація

Дисертація є результатом дослідження та розробки моделей, методів та інформаційної технології для опрацювання текстів на природній мові. Проведено аналіз теоретичного та практичного доробку в сфері лінгвістичних дослідженьта інформаційних технологій для систем пошуку, реферування та машинного перекладу. Досліджено лінгвістичні бази даних для автоматизованого морфологічного та семантичного аналізу. Визначено основні проблеми існуючих підходів, та запропоновано модель представлення лінгвістичної інформації для словоформ. Для вирішення завдань морфологічного та семантичного рівня обробки природно-мовних текстів розроблено методи побудови словника квазізакінчень та інших словників, які формують лінгвістичну базу даних. Проведено порівняльний аналіз запропонованих методів та моделей із існуючими, та визначено переваги запропонованого методу. Зазначимо, що важливим є те, що побудовані у роботі аналітико-граматичні словники є уніфікованими та мультимовними, що визначає можливості універсальності їх застосування. Теоретичні розробки доведені до програмної реалізації, розроблено два програмних продукти - АРМ ПАРАДИГМА та АРМ ЕКСПЕРТ, вихідні результати програм та ефективність цих комплексів досліджена у роботі, а також наведено приклади використання АРМ-івфахівцями на практиці.

Файли

Схожі дисертації