Коса В. В. МЕТОД ЕКСПЕРИМЕНТАЛЬНОГО ДОСЛІДЖЕННЯ ТЕРМІНОЛОГІЧНОГО НАСИЧЕННЯ В КОЛЕКЦІЯХ ДОКУМЕНТІВ ДЛЯ ЗДОБУТТЯ ЗНАНЬ

English version

Дисертація на здобуття ступеня доктора філософії

Державний реєстраційний номер

0821U101735

Здобувач

Спеціальність

  • 122 - Комп’ютерні науки

26-05-2021

Спеціалізована вчена рада

ДФ 17.051.026

Запорізький національний університет

Анотація

Об’єкт дослідження: процес автоматизованого здобуття, з колекцій релевантних документів, наборів термінів, що характеризують довільну професійну предметну область, для подальшої побудови онтологій цієї предметної області, з урахуванням впливу явища термінологічного насичення. Предмет дослідження: метод експериментального дослідження термінологічного насичення в колекціях документів для здобуття знань у процесі вивчення онтологій довільного домену. Мета роботи: підвищення репрезентативності, ефективності та результативності здобуття термінології з колекцій професійних документів у межах довільної предметної області для подальшої побудови онтологій, шляхом розробки комплексного обчислювального методу виявлення та вимірювання термінологічного насичення в колекціях професійних текстових документів, що описують предметну область. Результати дослідження: Уперше розроблено комплексний обчислювальний метод виявлення та вимірювання термінологічного насичення у послідовності інкрементально зростаючих підколекцій гіпотетично існуючої повної колекції професійних документів, що описують довільний домен. Отримали подальший розвиток: формальне визначення міри термінологічної різниці між двома наборами термінів зі значеннями оцінок їх значущості; оптимізований обчислювальний метод автоматичного здобуття термінів на базі методу C-value, що обчислює часткові C-value, здобуті з інкременту колекції документів, і потім зливає часткові C-value. Удосконалено обчислювальний конвеєр виявлення, вимірювання та аналізу термінологічного насичення шляхом залучення обчислювального методу для відбору релевантних документів до інкрементів колекції, використання розробленої техніки та алгоритмів групування частково подібних термінів, впорядкування документів для формування інкрементів колекції за зменшенням частоти цитування документів. Сфера використання: здобуті результати можна використовувати: у наукових дослідженнях для відбору репрезентативних колекцій наукових статей на обрану тематику; у промисловості для термінологічного аналізу довільних колекцій документів; у вищій школі як інструмент бібліографічного відбору для студентів випускних курсів та аспірантів.

Файли

Схожі дисертації