Крамов А. А. Проектування і застосування нейронних мереж для створення методів оцінки когерентності україномовних текстів

English version

Дисертація на здобуття ступеня доктора філософії

Державний реєстраційний номер

0822U100531

Здобувач

Спеціальність

  • 123 - Комп’ютерна інженерія

18-01-2022

Спеціалізована вчена рада

ДФ 26.001.242

Київський національний університет імені Тараса Шевченка

Анотація

Робота присвячена дослідженню проектування і застосування різнотипних нейронних мереж для створення методів оцінки когерентності україномовних текстів. Здійснення оцінки когерентності документу в автоматизований спосіб відноситься до категорії задач обробки природної мови. Формування вихідної оцінки когерентності передбачає аналіз тематичної цілісності всіх частин тексту на основі відповідності змісту документу фоновим знанням читача та різнотипної узгодженості текстових фрагментів. Врахування наведених властивостей тексту протягом обчислення оцінки його когерентності обумовлює застосування відповідних методів розрахунку цілісності документу для вирішення задач різних галузей (медичної діагностики, пошукових систем тощо). Варто зазначити, що аналіз методів оцінки когерентності для текстів української та інших слов’янських мов знаходиться на початковому етапі. Доцільним є здійснення водночас експериментальної перевірки ефективності застосування існуючих методів для україномовного корпусу, а також створення нових моделей для детального аналізу процесу формування оцінки когерентності текстів української мови. Відсутність фіксованої структури тексту, сформованого згідно з процесом мислення конкретної особи, а також складність однозначної оцінки когерентності документу (суб’єктивність сприйняття тексту читачем на основі власних вражень та фонових знань), унеможливлюють розрахунок зазначеного показника тематичної цілісності тексту за допомогою визначеного набору інструкцій. Наведені проблеми оцінки когерентності тексту обумовлюють доцільність застосування різних засобів машинного навчання з метою вирішення поставлених задач. У зв’язку з приростом обчислювальної потужності пристроїв та розвитком технологій паралельних і розподілених обчислень, сучасні методи оцінки когерентності тексту основані на проектуванні багатошарових нейронних мереж різної архітектури. Застосування моделей глибокого навчання дозволяє підвищити точність вирішення поставленої задачі за допомогою узагальнення різнотипних властивостей текстів вхідного корпусу. Однак у зв’язку зі складністю однозначного визначення критеріїв когерентного документу, крім досягнення встановленої точності відповідних методів доцільно з’ясувати причини отримання вихідного результату. Актуальною задачею є дослідження формування ознак вхідного тексту та проектування елементів нейронних мереж з метою виявлення характеристик тексту та типів зв’язку між його елементами, що аналізуються протягом обчислення вихідної оцінки когерентності україномовного документу. В роботі здійснено аналіз існуючих методів оцінки когерентності текстів на основі застосування методології машинного навчання. Детально розглянуто принцип роботи методів Entity Grid, Entity Graph та теорії риторичних структур, що полягає в аналізі закономірності зміни синтаксичних та дискурсивних ролей в межах сусідніх речень та всього тексту в цілому. Основними недоліками застосування зазначених методів є відсутність врахування інших елементів тексту, семантичних властивостей компонентів; залежність точності вирішення задач від зовнішніх інструментів. Наведено аналіз методів оцінки локальної та глобальної когерентності документу на основі використання різнотипних нейронних мереж для формалізованого представлення елементів тексту та обчислення його цілісності на рівні семантичної узгодженості речень. Зазначено доцільність використання рекурентних та згорткових шарів для проектування моделі нейронної мережі водночас для оцінки локальної та глобальної когерентності документу. На основі проведеного порівняльного аналізу методів показано ефективність застосування моделей нейронних мереж для вирішення поставлених задач оцінки когерентності тексту.

Файли

Схожі дисертації