Загваздін О. С. Автоматизація комп'ютерного документування мовної голосової інформації на основі обробки, сегментації і аналізу сигналів

English version

Дисертація на здобуття ступеня кандидата наук

Державний реєстраційний номер

0413U000611

Здобувач

Спеціальність

  • 01.05.02 - Математичне моделювання та обчислювальні методи

21-02-2013

Спеціалізована вчена рада

Д 26.194.02

Інститут кібернетики імені В.М. Глушкова Національної академії наук України

Анотація

Дисертацію присвячено створенню засобів автоматизації документування мовних голосових фонограм з використанням математичних моделей представ-лення мовних звукових сигналів і методів їх сегментації і цифрової обробки. У роботі запропоновано метод адаптивного визначення пауз і голосової активності у мовному голосовому сигналі з адаптивним порогом шуму, який дозволяє з високою надійністю визначати паузи у голосових сигналах з високим рівнем стороннього шуму і нестаціонарним шумом. Запропоновано метод визначення позиції зміни диктора у мовному голосовому сигналі на основі байєсівського інформаційного критерію порівняння моделей диктора в околі паузи у голосовому сигналі, і запропоновано методи сегментації сигналу за ознакою зміни диктора. Покращено методи фільтрації мовного сигналу від сторонніх шумів з використанням інформації, отриманої про шум з ділянок без голосової активності, визначених за допомогою адаптивного методу визначення пауз. Покращено методи зміни швидкості відтворення голосового сигналу з використанням методики PSOLA без змін до акустичних характеристик сигналу. На основі запропонованих моделей і методів створено інформаційну систему для автоматизованого розподіленого комп'ютерного документування мовних голосових фонограм, яка показала високу ефективність у підвищенні продуктивності роботи груп операторів-стенографістів.

Файли

Схожі дисертації