Hace un tiempo una amiga que estaba estudiando criminología @Andriana me planteó una idea que tenía para su TFG (Trabajo de final de grado). Esta consistía en el análisis de un mapa de criminalidad de España.
Dado que me pareció una muy buena idea y no existe nada parecido en España (como buen estudiante de Ciencia de Datos en la Universidad Politécnica de Valencia) me puse manos a la obra.
——-SALTA ESTA PARTE SI TE DA IGUAL LA PARTE DE CIENCIA DE DATOS—-
La primera fase del proyecto fue la obtención de los datos, la cual fue bastante complicada puesto que los datasets que proporciona el ministerio del interior sobre delitos no cuentan de datos relevantes como población de cada municipio ni las coordenadas donde se encuentran estos. Por ello, fue necesario buscar diferentes bases de datos e incluso recopilar los datos de forma propia.
Las fuentes de datos obtenidas fueron:
- Datos del Ministerio del interior de delitos por tipología de municipios de más de 30.000 habitantes
- Datos del INE del censo de la población de todos los municipios de España de distintos años
- Datos de coordenadas de los municipios presentes en el dataset de delitos por tipología. Estos fueron recopilados utilizando un script de python que automatiza el proceso de recolección de coordenadas con la librería Selenium. Este script fue de elaboración propia.
La segunda fase del proyecto fue la integración de los datos, en la cual se juntaron las tres diferentes fuentes de datos. Para ello, se utilizó la librería difflib de Python puesto que los nombres de los municipios varían en los tres diferentes datasets y era necesario encontrar los nombres mas parecidos en los tres diferentes datasets.
Por ejemplo:
Dataset1 = València
Dataset2 = Valencia\València
Dataset3 = Valencia
Era necesario una forma de ver cuáles eran los nombres más parecidos para integrar los tres datasets. Y para ello se utilizó la librería difflib en un script de elaboración propia.
La tercera y última fase del proyecto fue la elaboración del mapa del crimen en España y la personalización de este para que fuese lo más sencillo posible.
Al principio este mapa fue elaborado en R utilizando Shiny y leaflet, sin embargo, la poca personalización que permitían estas librerías hizo que fuese necesario una versión nueva.
Esta nueva versión fue realizada en typescript utilizando React y leaflet en el frontend y javascript con Express en el backend.
——–FINAL DE LA PARTE DE CIENCIA DE DATOS——————————————-
El mapa del crimen en España es un mapa de calor en el que se reflejan la cantidad de delitos cometidos cada cuatro trimestres en más de 240 municipios de España.
Este ayuda a identificar a simple vista los territorios y trimestres con mayor y menor actividad delictiva, así como algunas de las tipologías más y menos comunes.
Además se puede filtrar la visualización para elegir la tipología delictiva que se desea observar, el gránulo de visualización (municipio, provincia o comunidad autónoma) o bien, la relatividad de los delitos (cantidades absolutas o cada 100.000 habitantes)
Quería agradecer a @Andriana por haberme compartido su idea. Gracias a ella he aprendido muchas tecnologías, librerías y lenguajes de programación que desconocía.
Además de eso hemos desarrollado una herramienta que permite ver la criminalidad de España según la tipología del delito, lo que en un futuro no muy lejano, permitirá implantar nuevas políticas que hagan de los lugares más problemáticos en sitios más seguros.