Вознюк Т. Г. Застосування семантико-синтаксичної тензорної моделі природної мови для аналізу кореферентних зв’язків у текстах

English version

Дисертація на здобуття ступеня кандидата наук

Державний реєстраційний номер

0416U001806

Здобувач

Спеціальність

  • 01.05.01 - Теоретичні основи інформатики та кібернетики

24-03-2016

Спеціалізована вчена рада

Д 26.001.09

Київський національний університет імені Тараса Шевченка

Анотація

Основним результатом дисертації є розробка та математичне обґрунтування нових алгоритмів ідентифікації та аналізу кореферентних зв’язків у 18 природномовних текстах, що має істотне значення для розв’язання фундаментальної задачі комп’ютерної лінгвістики - семантичного аналізу текстів. Для цього було застосовано тензорну модель природної мови, керуючі простори синтаксичних структур речень та методи машинного навчання. В дисертаційній роботі розроблено новий алгоритм побудови керуючих просторів синтаксичних структур речень, який дозволив отримати зручне та стисле представлення моделі, зменшити розмірність тензора, отримати більш надійний та стійкий опис семантико-синтаксичних зв’язків між словами. В результаті інтеграції розроблених алгоритмів в одну з найкращих систем визначення кореферентних зв’язків Stanford Deterministic Coreference Resolution вдалось покращити за запропонованою на конференції MUC-6 мірою точність визначення на тестовій вибірці конференції CoNLL-2011 з 61.03% до 64.45%.

Файли

Схожі дисертації