Касілов О. В. Інформаційна технологія автоматизованої переробки текстової інформації при створенні електронних словників-тезаурусів

English version

Дисертація на здобуття ступеня кандидата наук

Державний реєстраційний номер

0408U005667

Здобувач

Спеціальність

  • 05.13.06 - Інформаційні технології

11-12-2008

Спеціалізована вчена рада

Д 64.050.07

Національний технічний університет "Харківський політехнічний інститут"

Анотація

Об’єкт дослідження: структуровані тексти природної мови, їх електронні версії і зв’язок між ними. Метою роботи є підвищення ефективності розробки електронних словників шляхом побудови інформаційної технології спеціалізованої обробки текстів природної мови. Методи дослідження: теорія формальних аналітичних граматик, синтаксичні діаграми, правила продукцій, апарат скінченних автоматів, теорія графів. Наукова новизна - вперше розроблено спеціалізовану інформаційну технологію, що реалізує автоматизоване перетворення структурованих текстів природної мови в їх електронну форму, що дозволило підвищити ефективність лексикографічного процесора; удосконалено модифікацію мови відкритої розмітки тексту XML для представлення словників-тезаурусів в електронній формі за рахунок введення спеціальних елементів розмітки; отримала подальший розвиток методика перетворення XML опису словника в базу даних різних форматів. Результат – інформаційна технологія автоматизованої переробки текстової інформації при створенні електронних словників-тезаурусів як складова частина лексікографічног прцессора. Ступінь впрвадження - в бібліотеці ІПМаш НАН України, та в навчальному процесі на кафедрі СI НТУ «ХПІ». Сфера використання – для структуризації даних, що містяться в словниках в системах призначених для лінгвістів-лексикографів, яка єлемент підготовки данніх для пошукових, библіотенчних, систем перкладу та ін.

Файли

Схожі дисертації