Обʼєктом дослідження є оброблення текстових даних українською мовою, охоплюючи створення та використання баз знань для логічного виведення висновків та аналізу несуперечності даних за допомогою онтології.
Метою роботи є заповнення прогалин, що є в доступних на сьогодні ресурсах для самонавчання, за допомогою створення рекомендаційної системи, зокрема в контексті перевірки точності та коректності математичних задач, уможливлення роботи із задачами, що подано українською мовою та автоматизацією процесу формування кроків розвʼязку задач.
Методи наукового дослідження, що використано в роботі: емпіричний та евристичний методи. Також використано методи математичної логіки, математичного аналізу, дискретної математики, функційного програмування. Додатково: методи системного підходу, зокрема аналіз, синтез (структурний, параметричний) та декомпозиція.
У науковій роботі використано також спеціальні методи. А саме: токенізація, лематизація, розмічування частин мови, видобування інформації.
У процесі проведених досліджень, отримано такі наукові результати:
• уперше розроблено метод видобування значущої інформації з текстів українськомовних планіметричних задач, що сформовано на основі проведеного кількісного аналізу зібраних планіметричних задач та за допомогою інструментів обробки природної української мови, для реалізації автоматичного розвʼязування українськомовних планіметричних задач;
• уперше запропоновано метод автоматичної перевірки на правильність та несуперечність даних, які отримано під час розвʼязування задачі та даних, що подано користувачем, формуючи внутрішнє представлення розвʼязку задачі як побудову терма в теорії типів за допомогою функційної мови програмування Lean.
• уперше побудовано метод автоматичного генерування кроків для розвʼязування математичних задач, який розроблено на основі логічного виведення висновків, що отримано від використання онтологій з інструментами логічного виводу.
Створено рекомендаційну систему, що уможливлює підвищення ефективності навчального процесу для учнів, абітурієнтів, студентів, вчителів і викладачів. Фактично розроблено систему, що здатна автоматизовано проаналізувати умову математичних задач, поданих українською мовою, та генерувати кроки їхнього розв’язку у формі, що є зрозумілою. Це уможливлює спростити та унаочнити процес навчання та допомогти уникнути типових помилок під час розв’язування задач.
Запропоновано методи та підходи роботи з українським текстом планіметричних задач, які базуються на використанні засобів обробки природної української мови та на проведеному кількісному аналізі текстів планіметричних задач.
Реалізовано метод, який аналізує текст задачі та використовує предметну планіметричну онтологію. Під час апробації результатів дослідження показано, що середній результат розвʼязання 50 планіметричних задач великими мовними моделями становить 53,67 %, тоді як запропонована рекомендаційна система розвʼязує всі ці 50 задач. Тому запропоновані методи для вичленення інформації з тексту та застосування планіметричної онтології надають майже вдвічі краще справляється з розвʼязанням планіметричних задач, ніж доступні на сьогодні великі мовні моделі.
Також запропоновано метод виправлення помилок лематизації в українській мові за допомогою використання словника, що сприяло підвищенню фінальної точності лематизації на 1,66 %.
Застосування онтологій та методів логічного виведення уможливило створеній системі перевіряти отримані розв’язки на несуперечність, що є критичним у точних науках. Впровадження методу з використанням функційної мови програмування для цих цілей надало коректність даних.
Отже, результати дослідження мають практичне застосування та здатні сприяти покращенню освітніх стандартів в Україні, збільшенню кількості високоякісних рішень для математики, а також наданню інструмента для підтримування користувачів у процесі навчання.
Науково-практичні результати дослідження впроваджено в навчальну діяльність факультету інформатики Національного університету «Києво-Могилянська академія», зокрема на кафедрі мультимедійних систем. Надалі, результати дисертаційної роботи також планується впровадити під час вивчення інших дисциплін, аби сприяти поглибленню знань та аналізу автоматизованих систем за допомогою використання запропонованої рекомендаційної системи, що здатна працювати з українськомовними текстами математичних задач, розв’язувати їх самостійно та допомагати з розв’язуванням кінцевим користувачам.