Яхимович О. В. Інформаційна технологія пошуку ключових слів на основі парсингу англомовних текстів

English version

Дисертація на здобуття ступеня кандидата наук

Державний реєстраційний номер

0421U100900

Здобувач

Спеціальність

  • 05.13.06 - Інформаційні технології

08-04-2021

Спеціалізована вчена рада

Д 05.052.01

Вінницький національний технічний університет

Анотація

Робота присвячена розробці інформаційної технології пошуку ключових слів на основі автоматизації процесів парсингу англомовних текстів. Удосконалено модель пошуку ключових слів, яка, на відміну від існуючих, побудована на основі інформаційної оцінки результатів парсингу тексту та враховує результати аналізу зв’язків між лексичними одиницями тексту, що дозволило формалізувати критерій якості процесу пошуку ключових слів. Уперше розроблено метод пошуку ключових слів, який, на відміну від існуючих, базується на знаходженні синтаксичних зв’язків між словоформами у реченнях англомовного тексту за допомогою технологічних можливостей парсингу сучасних лінгвістичних пакетів. Запропонований метод дає змогу підвищити чисельні характеристики якості пошуку ключових слів, а саме повноту і точність. Удосконалено метод зменшення впливу вербального шуму на пошук ключових слів, який, на відміну від існуючих, побудовано на основі стенфордської класифікації зв'язків між лексичними одиницями речення, що дозволило підвищити якість результатів пошуку ключових слів у порівнянні з основним методом. Набула подальшого розвитку інформаційна технологія пошуку ключових слів, яка, на відміну від існуючих, враховує додаткову інформацію процесів парсингу речень у межах послідовного застосування двох запропонованих методів, що дозволило уточнити чисельні оцінки змістовних параметрів тексту та підвищити якість пошуку його ключових слів. Прикладні результати дисертаційного дослідження полягають у формальному описі методики пошуку ключових слів англомовного тексту, створенні алгоритму її реалізації та розробці програмного забезпечення, що знаходить ключові слова на основі врахування значимих зв’язків між словоформами у реченнях англомовного тексту та подальшої фільтрації вербального шуму.

Файли

Схожі дисертації