La web está repleta de sitios maliciosos que fueron creados con un único propósito: robar nuestra información. O también para instalar malware en nuestros equipos y así robar nuestra información. De la forma que sea, quieren hacerse con nuestros datos.
Las compañías de seguridad informática suelen ir actualizando de manera regular sus listas negras para mantenerse al día. Lo hacen tan rápido como pueden, pero como están apareciendo nuevos sitios maliciosos de manera constante, es un esfuerzo considerable el que hay que hacer a la hora de detectarlos y monitorizarlos.
Es esta un área que está en constante búsqueda de una optimización significativa. Al fin y al cabo, está en juego la seguridad de todos los usuarios. Y aunque se han hecho progresos importantes, uno de los que más ha llamado la atención últimamente ha sido un sistema de inteligencia artificial denominado URLnet.
Un enfoque nuevo que mejora métodos anteriores
No es la primera vez que se usa machine learning con el propósito de identificar direcciones de sitios maliciosos. Sin embargo, los enfoques que se han utilizado con más frecuencia tienen algunas limitaciones importantes que hacen que los resultados obtenidos no sean tan buenos como deberían ser.
Lo que hace URLNet es utilizar redes neuronales para examinar las direcciones de los sitios (o sea, lo que se conoce como URL) a nivel de caracteres y combinaciones de palabras para detectar su riesgo. Y es que las direcciones suelen contener pistas sobre si un sitio es malicioso, ya sea por su longitud o por tener nombres de dominio mal escritos.
URLNet ha sido desarrollado por investigadores de la Universidad de Administración de Singapur y lo pusieron a prueba con extensos experimentos usando conjuntos de datos a gran escala. Concretamente, alimentaron a las redes neuronales con, por un lado, un millón de direcciones legítimas y maliciosas y, por otro, con 5 millones. Los resultados que obtuvieron en ellos demostraron una ganancia de rendimiento significativa sobre los métodos ya existentes para identificación de URLs.
Por el momento, todo lo que hay disponible de URLNet es un paper que se puede descargar del repositorio de la Universidad de Cornell. Por lo tanto, es un sistema que todavía no ha recibido una explotación más allá de la que han expuesto los investigadores. Sin embargo, si se confirma la capacidad que dicen que tiene, no sería de extrañar que alguna compañía de seguridad se interesase en él para ponerlo en acción lo antes posible. Y la verdad, ojalá sea así, que las amenazas en la web no dejan de crecer con cada día que pasa.