Análisis automatizado de conversaciones pedófilas usando Machine Learning
Palabras clave:
Acoso sexual en línea, Aprendizaje automático, Clasificación automática, Mensajería móvilResumen
El presente proyecto de investigación se basa en implementar una solución informática para detectar mensajes de texto con intenciones pedófilas a través de aplicaciones de mensajería móvil. Se analiza un corpus de este tipo de conversaciones para seleccionar las características más relevantes utilizando técnicas del procesamiento del lenguaje natural y lograr un mejor desempeño en el modelo predictivo con algoritmos de clasificación supervisada de Machine Learning. Se adoptó el algoritmo de Máquinas de Vectores de Soporte como modelo de clasificación del texto, con las pruebas realizadas a este modelo se obtuvieron resultados muy prometedores con una precisión del 80% en la clasificación de estos mensajes, algunos de estos presentaban mucho ruido y errores gramaticales por lo que se veía afectada la capacidad de aprendizaje del modelo, por lo que luego de realizar una etapa de procesamiento del conjunto de datos y los ajustes necesarios se logró optimizar un poco más el modelo y llegar hasta un 84% en cuanto a precisión y exactitud, además del puntaje F1 que indica un desempeño del 86% para el modelo de clasificación construido. Finalmente, el modelo se implementa en un Bot que se agrega a un grupo de Telegram conectando con su API para el análisis de conversaciones de prueba con el fin de observar que tan bien realizaba la clasificación automática de los mensajes que se enviaban en el grupo.
Descargas
Publicado
Cómo citar
Número
Sección
Licencia
Derechos de autor 2025 Editorial "Universo Sur"

Esta obra está bajo una licencia internacional Creative Commons Atribución-NoComercial-SinDerivadas 4.0.
La editorial "Universo Sur", de la Universidad de Cienfuegos, publica el contenido de la Revista "Universidad y Sociedad" bajo una Licencia Creative Commons Atribución-NoComercial-SinDerivar 4.0 Internacional.
© Podrá reproducirse, de forma parcial o total, el contenido de esta publicación, siempre que se haga de forma literal y se mencione la fuente.