Щербінін К. С. Методи та моделі сегментації відео для систем метричного пошуку

English version

Дисертація на здобуття ступеня кандидата наук

Державний реєстраційний номер

0412U000075

Здобувач

Спеціальність

  • 05.13.23 - Системи та засоби штучного інтелекту

07-12-2011

Спеціалізована вчена рада

Д64.052.01

Анотація

Об’єкт дослідження – процеси сприйняття і контекстна інтерпретація динамічних просторових сцен. Мета дослідження – розробка моделей і методів сегментації відеоданих, обробки, аналізу й індексації результатів сегментації в часі та просторі для підвищення ефективності систем метричного пошуку і розпізнавання динамічної візуальної інформації в базах даних із запитами за зразком. Методи дослідження – основні положення математичного апарату розпізнавання образів, штучних нейронних мереж, теорії множин, алгебри, елементів математичної статистики. Апаратура для досліджень – персональний комп’ютер, фотокамера, відеокамера. Теоретичні та практичні результати – розроблені методи і моделі сегментації відеоданих, знайдені умови елімінації відеосегментів, отримано уявлення «просторового змісту» відеокадрів і відеоряду в цілому можуть використовуватися для вирішення широкого кола завдань пошуку й інтерпретації візуальної інформації. Наукова новизна – уперше запропоновані методи виявлення зміни властивостей багатовимірних часових рядів на основі багатовимірної модифікації процедури експонен-ціального згладжування у формі адаптивного контролю характеристик, що створює передумови для виявлення відеосегментів у процесі послідовного аналізу динамічної візуальної інформації; набули подальшого розвитку методи метричного пошуку, які, на відміну від відомих, враховують у загальному вигляді необхідні і достатні умови елімінації відеосегментів без порівняння із запитом, що при довільній кількості опорних точок у фазовому просторі забезпечує суттєве підвищення швидкодії; удосконалено методи усунення семантичного конфлікту між низькорівневою обробкою відеоданих і цілями перцептивного сприйняття, які, на відміну від відомих, враховують «просторовий зміст» у вигляді результатів сегментації окремих кадрів відеопослідовностей, що створює достатні підстави для валідного пошуку відеосегментів у ряді предметно-орієнтованих зон. Результати дисертаційної роботи у вигляді комплексів програмних засобів для баз відеоданих впроваджено у системах медичної діагностики, зокрема, в процесі пошуку в ендоскопічних відеоархівах Інституту загальної та невідкладної хірургії АМН України та під час вирішення пошукових завдань у відеоархівах коронарної ангіографії Центральної клінічної лікарні «Укрзалізниці». Наукові положення, що викладені в дисертації, використовувалися в навчальному процесі в Харківському національному університеті радіоелектроніки, що підтверджено актами впровадження. Наукові теоретичні та практичні результати дисертаційної роботи можуть бути використані: в організаціях, що займаються проблемами розробки, дослідження, впровадження та експлуатації інтелектуальних систем комп’ютерного зору, систем обробки відеоданих у режимі реального часу; систем ідентифікації та інших сферах промислової і науково-практичної діяльності.

Файли

Схожі дисертації