Дібрівний О. А. Методика підвищення ефективності передачі відеопотоку при стисненні методом компенсації руху

English version

Дисертація на здобуття ступеня доктора філософії

Державний реєстраційний номер

0821U100476

Здобувач

Спеціальність

  • 123 - Комп’ютерна інженерія

22-03-2021

Спеціалізована вчена рада

ДФ 26.861.001

Державний університет телекомунікацій

Анотація

Дібрівний О.А. Методика підвищення ефективності передачі відеопотоку при стисненні методом компенсації руху. – Кваліфікаційна наукова праця на правах рукопису. Дисертація на здобуття наукового ступеня доктора філософії за спеціальністю 123 – «Комп’ютерна інженерія». – Державний університет телекомунікацій. – Київ, 2021. Дисертаційна робота присвячена дослідженню методики компенсації руху, яка використовується в більшості сучасних технологіях стиснення відеопотоку і базується на передачі кадрів у вигляді скомпенсованої міжкадрової різниці, з ціллю зменшення часу затраченого на стиснення відеопотоку. Проаналізовано поточний стан та перспективи розвитку технологій стиснення відеофайлів, визначено основні алгоритми та методики, що входять до їхнього складу. Виявлено основні проблемні області таких технологій. На основі аналізу наукової літератури було визначено основні метрики, які використовуються для оцінки ступеня схожості зображень. Було виявлено, що в сучасних системах відеостиснення в якості основної метрики використовується SAD, обчислення якої, при всій її простоті та невеликій обчислювальній складності може займати від 40 до 80% загального часу кодування відеопотоку. Для усунення даного недоліку було запропоновано використання шаблонів порівняння за характерними точками, які дозволяють зменшити обрахунку метрики за рахунок зменшення кількості точок порівняння. Такий підхід зумовлений унікальністю розподілу піксельних значень на різних частинах зображення. Аналіз алгоритму оцінки схожості зображень на основі характерних точок, показав, що зменшення кількості контрольних точок призводить до різкого зменшення показника PSNR. Запропоновано для усунення втрати інформації в областях високої ентропії (на границях об’єктів та областях різкого переходу кольору) використання алгоритмів виділення країв зображення і проведення уточнення блоків кандидатів на карті країв зображення. Зручність такого підходу зумовлена тим, що процес пошуку векторів руху відбувається для відеопотоку в форматі YUV, а саме для яскравісної компоненти зображення (Y) та частковим ігноруванням кольорових компонент (людське око більш чутливе до зміни яскравості зображення чим до зміни кольору). При цьому яскравісна компонента Y є зображенням в сірих тонах. Такий підхід дозволив суттєво скоротити втрати PSNR при відносно незначних зменшеннях швидкості обрахунку векторів руху. Вдосконалено методику існуючих методів блочного пошуку, для усунення основних недоліків використання шаблонного порівняння. Було проведено аналіз сучасних методів блочного пошуку. Формування методу блочного пошуку, для результуючої методики було проведено за рахунок вдосконалення чотирьох основних частин алгоритмів блочного пошуку: 1. Попередня обробка відеокадру, шляхом обрахунку нескомпенсованої різниці з попереднім кадром, та занулення векторів руху блоків, максимальне значення якої не перевищує заданий поріг (2% глибини кольору), для усунення неоднозначності в областях низької ентропії. 2. Формування розширеного набору більш точних предикатів, для скорочення часу уточнення блоків кандидатів та виключення впливу випадкових співпадінь значень пікселів на формування вектору руху. 3. Розширення умов формування порогових значень для умов ранньої зупинки пошуку. 4. Формування набору адаптивних шаблонів для уточнення блоків з яких будуть формуватися вектори руху. Основним підходом для формування цих чотирьох частин методу було використання суміжних блоків не тільки поточного та попереднього кадрів, а також наступного кадру, за рахунок попередньої обробки частини блоків всіх кадрів відео послідовності (пар кадрів у випадку обробки відеопотоку в реальному часі). Такий підхід обумовлений постійністю руху об’єктів на коротких проміжках часу. В результаті комбінації шаблонного порівняння для оцінки схожості блоків, алгоритмів виділення країв та вдосконаленого методу блочного пошуку було сформовано результуючу методику знаходження векторів руху. Протестовано модифікації методики згідно комплексних рекомендацій тестування міжнародної комісії MPEG по оцінці складних відеоінструментів, на прикладі 13 відеопослідовностей, з різними бітрейтами. Досліджено вплив збільшення розмірів блоків на які розбивається зображення на значення PSNR та максимального прискорення. Проведено порівняння результатів роботи запропонованої методики з сучасними методами формування векторів руху, в результаті визначено, що запропонована методика дозволяє отримати прискорення на рівні 15-17% (рівень прискорення залежить від бітрейту оброблюваної відеопослідовності: вищий бітрейт – вище прискорення) від найближчого аналога при втратах на рівні 0.3-1.2%значень PSNR від значень еталонного методу пошуку векторів руху для модифікації А і прискорення на рівні 27-31% при втраті 1.1%-2.1% в залежності розміру блоку та бітрейту відеопослідовності, для модифікації S.

Файли

Схожі дисертації