Швороб І. Б. Методи та засоби екстракції та аналізу слабоструктурованих текстових даних на основі документо-орієнтованого графа

English version

Дисертація на здобуття ступеня кандидата наук

Державний реєстраційний номер

0418U001342

Здобувач

Спеціальність

  • 10.02.21 - Структурна, прикладна та математична лінгвістика

15-03-2018

Спеціалізована вчена рада

Д 35.052.05

Національний університет "Львівська політехніка"

Анотація

У дисертаційній роботі розв'язано актуальне наукове завдання розроблення технологій для екстракції, збереження, опрацювання та аналізу слабоструктурованих даних. Введено поняття документ-орієнтованого графа для представлення слабоструктурованих природно-мовних текстів, що дало змогу використати теорію графів для встановлення зв'язків між елементами документа та визначення типу відношення між документом та шаблоном. Вперше розроблено метод первинного аналізу даних, який дає змогу частково структурувати природномовний текст для його подальшого опрацювання.

Файли

Схожі дисертації