Куроп'ятник О. С. Конструктивно-продукційні моделі природомовних текстів для виявлення запозичень у структурованих документах

English version

Дисертація на здобуття ступеня кандидата наук

Державний реєстраційний номер

0420U100992

Здобувач

Спеціальність

  • 01.05.02 - Математичне моделювання та обчислювальні методи

22-06-2020

Спеціалізована вчена рада

Д 08.084.01

Національна металургійна академія України

Анотація

Дисертаційну роботу присвячено вирішенню актуальної науково-прикладної задачі розробки моделей природомовних текстів для виявлення запозичень у структурованих документах На основі розроблених конструктивно-продукційних моделей мови, мовних конструкцій (текстів) та їх графового представлення запропоновано метод і алгоритми зіставлення текстів та структурованих документів для виявлення за-позичень. Запропонована модель процесу маскування запозичень дозволила формалізувати сценарії маскування, створити платформу для моделювання нових змін тексту, автоматизувати побудову тестів для систем антиплагіату. Розроблено програмні засоби виявлення запозичень у текстових фрагментах та структурованих документах. Розроблено програмний засіб автоматизованого формування тестів для перевірки здатності демаскування запозичень систем анти плагіату. Комплексне використання отриманих у роботі результатів дозволяє виконувати автоматизовану перевірку текстових фрагментів і структурованих документів на наявність запозичень; тестувати системи антиплагіату та постійно збільшувати тестову базу, будуючи нові сценарії маскувань.

Файли

Схожі дисертації