Голуб М. С. Формування масиву чисельних ознак для класифікації україномовних текстів в інформаційній технології інтелектуального моніторингу

English version

Дисертація на здобуття ступеня кандидата наук

Державний реєстраційний номер

0418U003339

Здобувач

Спеціальність

  • 05.13.06 - Інформаційні технології

10-10-2018

Спеціалізована вчена рада

К 73.052.04

Черкаський державний технологічний університет

Анотація

Дисертація присвячена розв’язанню наукової задачі підвищення адекватності класифікації україномовних текстів шляхом розробки методів і засобів ефективного формування масиву їх чисельних ознак для побудови моделей-класифікаторів в інформаційних технологіях багаторівневого інтелектуального моніторингу. Інформаційна технологія реалізується у вигляді моніторингової інтелектуальної системи (МІС). В результаті удосконалення методу формування словника ознак, розробки нового методу побудови точок спостереження і координації їх із синтезатором моделей-класифікаторів, базою модельних знань та іншими елементами МІС, вдалося досягнути системного ефекту (емерджентності). Емерджентність отримано у формі здатності класифікувати україномовні текстові повідомлення та збільшення кількості правильно класифікованих текстів у порівнянні з аналогами. Їх частка сягнула 98-100%. Одночасно зменшився до 500 знаків розмір текстового повідомлення, яке може бути класифікованим правильно. Результати, отримані в ході дослідження, були підтверджені експериментально при визначенні місця проживання авторів друкованих текстових повідомлень, при розв’язанні задач атрибуції та профілювання текстів. Інформаційна технологія багаторівневого інтелектуального моніторингу набула здатності розв’язувати завдання інтелектуального аналізу україномовних текстів, зокрема їх класифікації.

Файли

Схожі дисертації