Comparación de algoritmos para detección de intrusos en entornos estacionarios y de flujo de datos

  • MSc. Jorge Luis Rivero Pérez Universidad de Coimbra
  • MSc. Bernardete Ribeiro Universidad de Coimbra
  • MSc. Kadir Héctor Ortiz Universidad de Metropolitana

Resumen

La detección de intrusos en redes de computadoras a partir del enfoque de aprendizaje automático presenta algunas deficiencias dadas por la propia naturaleza de la aplicación. La principal viene dada por el modesto despliegue de sistemas de detección basados en algoritmos de aprendizaje bajo las restricciones impuestas por los entornos reales. En este artículo se describen y proponen tres variantes de pre procesamiento sobre el conjunto de datos KDD99, incluye selección de atributos. Luego la experimentación se realiza primeramente a partir de evaluar algoritmos representativos en entornos estacionarios sobre las variantes obtenidas a partir de pre procesar KDD99. Por último, dado que el tráfico de red es un flujo constante de datos, en el cual pueden existir variaciones de conceptos relacionadas con las tasas de falsos positivos, unido al hecho de que no se encuentran muchas investigaciones que aborden la detección de intrusos en entornos de flujos de datos nos conduce a realizar una comparación de varios algoritmos también representativos de flujos de datos. Como resultado se obtiene cuáles son los algoritmos que mejores resultados ofrecen en la detección de intrusos sobre las variantes de pre procesamiento propuestas, tanto para entornos estacionarios como de flujos de datos.

Palabras clave:

Aprendizaje automático, detección de intrusos en redes, flujos de datos, KDD99.

 

ABSTRACT

Intruders detection in computer networks has some deficiencies from machine learning approach, given by the nature of the application. The principal problem is the modest display of detection systems based on learning algorithms under the constraints imposed by real environments. This article focuses on the machine learning approach for network intrusion detection in batch and data stream environments. First, we propose and describe three variants of KDD99 dataset pre processing including attribute selection. Secondly, a thoroughly experimentation is performed from evaluating and comparing representative batch learning algorithms on the variants obtained from KDD99 pre processing. Finally, since network traffic is a constant data stream, which can present concept drifting with high rate of false positive, along with the fact that there are not many researches addressing intrusion detection on streaming environments, lead us to make a comparison of various representative data stream classification algorithms. This research allows determining the algorithms that better perform on the proposed variants of KDD99 for both batch and data stream environments.

Keywords:

Data stream, KDD99, machine learning, network intrusion detection.

Publicado
2017-01-03
Cómo citar
Rivero Pérez, M. J. L., Ribeiro, M. B., & Ortiz, M. K. H. (2017). Comparación de algoritmos para detección de intrusos en entornos estacionarios y de flujo de datos. Universidad Y Sociedad, 8(4). Recuperado a partir de https://rus.ucf.edu.cu/index.php/rus/article/view/453