ФУНКЦІОНАЛЬНА МОДЕЛЬ КЛАСИФІКАЦІЇ ПСЕВДОВИПАДКОВИХ ПОСЛІДОВНОСТЕЙ ЗАШИФРОВАНИХ ТА СТИСЛИХ ДАНИХ ЗАПОБІГАННЮ ВИТОКУ КОНФІДЕНЦІЙНОЇ ІНФОРМАЦІЇ
DOI:
https://doi.org/10.17721/2519-481X/2023/81-09Ключові слова:
псевдовипадкові послідовності, функціональна модель, інформаційна безпека, точність класифікації, ашифровані, стислі даніАнотація
Розглянута задача побудови формалізованої моделі інсайдера, яка може застосовуватись як у комерційних так і державних компаніях. Показано, що загрози безпеки даних характеризуються набором векторних показників, якісних та кількісних, для їх формалізації необхідне застосування теорії нечітких множин та дискретної математики. Показано неможливість застосування експертних традиційних методів оцінок для визначення більшості розглянутих показників.
Для мінімізації ризику витоку конфіденційної інформації пропонується формувати групи співробітників та розраховувати ризик витоку конфіденційних даних для кожної з них.
Розробка моделі псевдовипадкових послідовностей дозволить оцінити ступінь впливу статистичних ознак, що витягуються з псевдовипадкових послідовностей і використовуються в процесі формування класифікатора, на точність проведення процедури класифікації. Отримані кількісні значення ознак дозволять оптимізувати кількість параметрів за умови дотримання необхідної точності, оцінити складність виконання процедури видалення ознак. На основі отриманих результатів моделювання, виявлених особливостей класифікатора необхідно обґрунтувати вибір математичного апарату, що в подальшому дозволить перейти до практичної реалізації алгоритму класифікації послідовностей, сформованих алгоритмами стиснення та шифрування даних.
Проведений аналіз досліджень у даній предметній області дозволив виявити практичну проблему наявних механізмів захисту: низька точність виявлення зашифрованої інформації, через їх схожість з типовими високоентропійними послідовностями, використання службової інформації притаманної процесу передачі, зберігання конфіденційної інформації. Таким чином задача класифікації зашифрованих та стислих даних є актуальною.
Для вирішення поставленої задачі необхідно: провести аналіз особливостей функціонування перспективних засобів запобігання та виявлення витоку конфіденційних даних, виявити обмеження, пов'язані з виявленням стислої та зашифрованої інформації, обґрунтувати вибір відповідного ознакового простору для моделювання, сформованих алгоритмами стиснення та шифрування інформації, псевдовипадкових послідовностей; розробити модель, сформованих алгоритмами стиснення та шифрування даних, псевдовипадкових послідовностей, що відрізняється від відомих, врахуванням їх статистичних характеристик.
Представлена модель псевдовипадкових послідовностей, відрізняється від аналогів з врахуванням розподілу байт та з врахуванням частот бітових підпослідовностей довжини 9 біт. Для оцінки адекватності запропонованої моделі проведені експерименти щодо визначення точності класифікації псевдовипадкових послідовностей алгоритмами машинного навчання.