Sistema de deteccioÌn de phishing basado en machine learning
Contenuto principale dell'articolo
Abstract
Las redes informaÌticas se han convertido en una herramienta importante para todo tipo de organizaciones. Sin embargo, el crecimiento del uso de las redes informaÌticas e internet ha conllevado al crecimiento del nuÌmero de ciberataques, que afectan a la intimidad e integridad de los datos confidenciales de las personas, organizaciones y gobiernos. Uno de los ciberataques maÌs comunes que crece continuamente en el mundo es el phishing; en el PeruÌ seguÌn la DivisioÌn de InvestigacioÌn de Delitos de Alta TecnologiÌa, se ha duplicado el nuÌmero de denuncias de ciberdelitos en el 2021, siendo la modalidad maÌs frecuente el phishing.
Se han desarrollado modelos de seguridad para la deteccioÌn de phishing, pero son insuficientes, seguÌn reportes de seguridad de Trend Micro y Kaspersky la deteccioÌn de phishing de los modelos actuales representan una menor cantidad de deteccioÌn de años anteriores y ademaÌs el 50% de profesionales consideran que son ineficientes las teÌcnicas utilizadas. En este trabajo de investigacioÌn se desarrolla un sistema eficiente en la deteccioÌn de phishing, basado en modelos de machine learning.
Este trabajo estaÌ estructurado en tres partes. En la primera parte se revisa las teoriÌas relacionadas a la deteccioÌn de phishing y machine learning, se analiza la realidad problemaÌtica de la deteccioÌn de phishing, los trabajos previos, las teoriÌas de la ciberseguridad, la detencioÌn de phishing, el ciclo de vida y las teÌcnicas de machine learning; y la inteligencia de amenazas. En la segunda parte se describe el sistema de deteccioÌn de phishing, se detalla el modelo de machine learning en que se sustenta el sistema y se describe las fases del desarrollo del sistema de deteccioÌn de phishing. En la tercera parte se detalla la implementacioÌn del sistema de deteccioÌn de phishing; utilizando Python como lenguaje de programacioÌn y siguiendo paso a paso las seis fases del sistema desde la recoleccioÌn de datos, hasta la evaluacioÌn del rendimiento del sistema en la deteccioÌn de sitios web phishing.
Dettagli dell'articolo
La biblioteca establece los derechos de autor según la licencia Creative Commons "Attribution-NonCommercial-NoDerivs" CC BY-NC-ND.