PROJECT/인공지능과 정보보호

[네트워크 환경에서 악성 트래픽 탐지를 머신러닝 알고리즘 성능 비교]

myejinni 2022. 12. 2. 20:59

참고 논문: http://koreascience.or.kr/article/JAKO202127948196938.page

 

A comparative study of the performance of machine learning algorithms to detect malicious traffic in IoT networks -Journal o

Abstract Although the IoT is showing explosive growth due to the development of technology and the spread of IoT devices and activation of services, serious security risks and financial damage are occurring due to the activities of various botnets. Therefo

koreascience.or.kr

 

데이터셋: Bot-IoT 데이터셋

알고리즘: 침입탐지를 위해 대부분의 연구에서 주로 사용하는 아래 알고리즘

-KNN(K-Nearest Neighbor),

-Naïve Bayes,

-Decision Tree,

-Random Forest

 

로 탐지 성능을 평가

실험 성능평가 지표: 

-Accuracy(정확도),

-Precision(정밀도),

-Recall(재현율),

-F1-score

성능 측정 방법 수식

실험결과:

전반적으로 KNN 알고리즘의 성능이 가장 높고, Naive Bayes 알고리즘이 가장 좋지 않은 것으로 연구

 

-KNN: DDoS, DoS 공격 및 Normal 트래픽을 분류하는 정확도가 가장 높음.

-Naïve Bayes는 Normal 트래픽은 거의 탐지를 못하는 반면, Data theft 공격은 100% 탐지.

 

<각 알고리즘에서의 정밀도>

=> KNN과 Random Forest의 성능이 대체로 높음.

 

DDoS와 DoS 공격에 대한 성능

: KNN > Random Forest

 

Normal과 Data theft 공격에 대한 성능

: KNN < Random Forest

 

Dos 공격에 대한 정밀도

: Naïve Bayes > 다른 알고리즘들

 

본 연구의 결론

: 효과적인 탐지를 위하여 데이터 전처리로 상관 계수와 엔트로피를 이용하여 10개의 특성을 추출, 최대최소 정규화를 실시

: 정확도, 정밀도, 재현율, f1-score로 알고리즘의 성능을 평가한 결과 KNN 알고리즘이 가장 성능이 좋은 것으로 나타남

* 특히 DDoS, DoS, Data theft에 대한 탐지 성능이 99% 이상인 것으로 확인