Дисертаційна робота присвячена вирішенню актуального наукового завдання,
сутність якого полягає в підвищенні ефективності застосування безпечного
розпізнавання та параметризації результатів обробки голосової інформації завдяки
комбінуванню підходів розпізнавання природної мови та голосової інформації для
побудови систем голосової автентифікації, виявлення намірів та визначення
емоційного стану суб’єктів в інформаційно-комунікаційних системах (ІКС), а
також впровадженню заходів управління кібербезпекою на державних
підприємствах та в приватних організаціях.
Методологія обробки голосової інформації є потужним інструментом, який
має значний вплив на безпеку держави та роботу комерційних організацій через
автоматизацію процесів моніторингу електронних комунікацій та аудіоархівів, на
основі розпізнавання в реальному часі мови, емоцій та намірів, чому сприяють
декілька факторів, які змушують звернути увагу на методології, на актуальність їх
удосконалення, а саме:
1. Зміна ландшафту кіберзагроз. Із появою генеративних моделей та
збільшенням обчислювальних можливостей традиційні моделі безпеки, які
покладаються на високо структуровані дані перестають адекватно виявляти та
реагувати на підроблені аудіодані. Тому актуальними стають задачі по виявленню,
реєстрації та реагуванню на нові виклики, а також швидкий розвиток даної галузі.
2. Перехід голосової інформації із телефонних розмов в телеконференції. При
використанні традиційних телефонних переговорів до їхнього вмісту потенційно
мав доступ оператор зв’язку та державні органи. Тому тривалість та зміст розмов
були меншими та піддавалися самоцензуруванню. Із переходом до
телеконференцій вартість розмов зменшилася, а розповсюдження методів
наскрізного шифрування створило уяву безпечності середовища, то абоненти стали
вести більш відверті та довгі розмови, що стало особливо актуальним в епоху
віддаленої роботи. Також через збільшення об’єму голосової інформації необхідно
швидше зі сторони держави опрацьовувати її для вчасного виявлення, до прикладу,
терористичних загроз, а зі сторони приватних підприємств – для виявлення витоку
конфіденційних даних.
3. Порушення даних і зовнішні загрози. Діпфейки та введення спотворень в
оригінальні аудіодані абонента створюють загрози для перенасичення
інформаційної системи запитами. Виявлення та протидія фроду при аналізі намірів,
в тому числі, генерації великої кількості фейкових намірів, призводять до
перенавантаження зовнішніх пов’язаних системи та обмеженню ресурсів
реагування, що створює загрозу недоотримання уваги легітимними суб’єктами.
4. Розширення ролі хмарних служб. Оскільки підприємства та організації все
частіше використовують хмарні послуги для зберігання конфіденційних
аудіоданих, то виникає потреба в додатковій обробці, в тому числі,
деперсоналізації та видалення чутливих даних із аудіопотоку.
5. Вимоги відповідності. До персональних даних абонентів висуваються
вимоги щодо їхньої конфіденційності в межах держаних стандартів (GDPR,
HIPAA), комерційних (PCI DSS) та/або етичних обмежень. В свою чергу, аудіодані
є важким видом інформації для структурованого пошуку та аналізу стосовно
висунутих вимог та обмежень.
6. Безперервний моніторинг і адаптивна безпека. Обробка голосових даних
може проводитися як архівних, так і в режимі реального часу, але вузьким місцем
ІКС є потокова обробка даних. Тому реагування на інциденти може проводитися у
два способи: невідкладні дії та розслідування інцидентів, але обидва підходи мають
свій набір невирішених завдань.
7. Реагування на інциденти та виявлення загроз. Системи розпізнавання
голосової інформації не мають в своєму складі механізмів щодо реагування на
інциденти, тому повинні сигналізувати іншим системам в режимі реального часу.
Інтеграція із зовнішніми ІКС для забезпеченні безпеки має обмеження на
швидкодію та затримки на час обробки запитів, але все одно зменшує потенційну
шкоду. Також слід зазначити, що актуальність реагування різко зменшується з
плином часу.