Дарчук Н. П. Лінгвістичне забезпечення автоматичних систем аналізу українськомовного тексту (на прикладі системи автоматичного граматичного аналізу тексту АГАТ).

English version

Дисертація на здобуття ступеня доктора наук

Державний реєстраційний номер

0515U000263

Здобувач

Спеціальність

  • 10.02.01 - Українська мова
  • 10.02.21 - Структурна, прикладна та математична лінгвістика

20-03-2015

Спеціалізована вчена рада

Д 26.001.19

Київський національний університет імені Тараса Шевченка

Анотація

У дисертації вперше в українській прикладній лінгвістиці запропоновано алгоритми і програми повного циклу автоматичного аналізу українського тексту. Мета дослідження - теоретичне й експериментальне обґрунтування лінгвістичних і процедурних засад інтегральної моделі семантико-граматичної взаємодії знакових одиниць у тексті і створення на цій основі комп'ютерної граматики української мови (АГАТ). Створено частиномовні лексикони, які містять необхідну граматичну й лексичну інформацію для аналізу морфології, синтаксису та семантики української мови; розроблено лінгвістичну стратегію і правила автоматичного морфологічного аналізу, автоматичного морфного сегментування словоформ тексту; автоматичного синтаксичного аналізу; автоматичного семантичного аналізу у вигляді термінологічного тезаурусу інформаційно-пошукового типу, ідеографічних словників для іменників, дієслів; виявлено і систематизовано граматичні явища, характерні для синтаксису української мови з використанням Корпусу української мови. Усі алгоритми програмно реалізовані і протестовані на реальних текстах.

Файли

Схожі дисертації