Тарануха В. Ю. Моделі та алгоритми обробки природномовних текстів для флективних мов.

English version

Дисертація на здобуття ступеня кандидата наук

Державний реєстраційний номер

0417U003836

Здобувач

Спеціальність

  • 01.05.01 - Теоретичні основи інформатики та кібернетики

21-09-2017

Спеціалізована вчена рада

Д 26.001.09

Київський національний університет імені Тараса Шевченка

Анотація

Дисертація присвячена дослідженню проблем обробки природномовних текстів та побудові спеціалізованих моделей, орієнтованих на флективні мови. Проаналізовано проблеми, які виникають при евристичному морфолексичному аналізі; розроблено оптимізований алгоритм евристичного морфолексичного аналізу, що використовує в якості джерела даних окреме слово, словник тексту та безпосередній контекст слова. Проаналізовано модель тексту на рівні морфем та фонем та отримано критерій визначення авторства на основі ознак, які важко контролюються свідомістю авторів текстів. Проаналізовано n-грамну модель тексту на рівні словоформ, досліджено метод розділення моделі на синтаксичну і семантичну та подальшого її об'єднання для отримання оптимізованої моделі. Сформульовано межі придатності для методу у вигляді теорем про структуру граматичних та лематичних класів. Проведено комп'ютерні експерименти, які перевіряють ефективність оптимізованої моделі.

Файли

Схожі дисертації