Дорошенко А. Ю. Інформаційна технологія інтелектуального аналізу фактографічних текстових ресурсів

English version

Дисертація на здобуття ступеня кандидата наук

Державний реєстраційний номер

0419U002027

Здобувач

Спеціальність

  • 05.13.06 - Інформаційні технології

04-04-2019

Спеціалізована вчена рада

Д 64.050.07

Національний технічний університет "Харківський політехнічний інститут"

Анотація

У дисертаційній роботі вирішена актуальна науково-практична задача ро-зробки моделей та інформаційної технології інтелектуального аналізу факто-графічної інформації. На основі аналізу моделей та методів обробки фактогра-фічних даних у мережевих потоках сформульовано основні вимоги до розробки інформаційної технології інтелектуального аналізу фактографічних ресурсів. У якості математичного інструментарію моделювання фактів визначено теорію категорій, її проективну та предикатну інтерпретації. Запропоновано для опису фактографічної інформації використовувати теорію інтелекту, метод компара-торної ідентифікації та апарат алгебро-логічних рівнянь. Розроблено моделі те-матичного пошуку та екстракції фактографічної інформації на основі інтелектуальної процедури оцінки текстової інформації. Запропоновано для опису фактів використання двох типів триплетів: «Суб’єкт -Предикат - Об’єкт» та «Предмет - Атрибут - Значення», що дозволяє вилучати поняття зі слабоструктурованих текстових ресурсів та описувати відношення між ними у струк-турованому вигляді. Сформовано підхід до видобування фактографічних даних з текстових джерел, запропоновано використання онтологій для опису процесів інтеграції фактографічної інформації. Запропоновано використання нового на-півавтоматичного методу для розширення базової онтології на прикладі пред-метних областей «радіаційна безпека» та «обробка патентно-кон’юнктурної ін-формації». Проведено апробацію розроблених моделей, підходів та інформа-ційної технології та впроваджено результати дослідження у реальні інформа-ційні системи. Розроблено еталонну архітектуру, програмні компоненти серверної частини програмної системи, що дозволяє проводити екстракцію даних на основі використання гнучкого конфігурування та предикатної моделі видобу-вання даних.

Файли

Схожі дисертації