У роботі представлено підхід до створення високоточної адаптивної моделі для виявлення шкідливих URL-адрес із використанням технологій штучного інтелекту. Запропонована система базується на ансамблевих методах машинного навчання, що поєднують переваги кількох класифікаторів для підвищення точності та стійкості моделі. У ході експериментів випробувано дев’ять алгоритмів, серед яких 3 найкращі було об’єднано у один ансамбль. Використання ансамблю (VotingClassifier) забезпечило стабільне покращення точності класифікації. Отримані результати підтвердили ефективність ансамблевого підходу у виявленні зловмисних адрес, що має значну практичну цінність для підвищення рівня кібербезпеки та може бути інтегроване у сучасні системи захисту від фішингових чи інших атак.
Чому розглянуті тільки ці 4 методи машинного навчання?
У дослідженні було розглянуто приблизно 15 поширених алгоритмів класифікації, з яких було обрано 8 найкращих експериментальним шляхом та тестовому наборі даних. Дев’ятим алгоритмом став примітивний KNN, який використовувався переважно для порівняння з іншими більш ефективними алгоритмами. Це дослідження має характер proof-of-concept, тому вибір алгоритмів здійснювався експериментально, без проведення глибокого теоретичного аналізу.