Tableau de bord du terrorisme dans le monde

tableau de bord-données-terrorisme

Projet porté par:

Code du tableau de bord: https://github.com/alvaro-mazcu-herreros/terrorism

Brève explication du projet: https://www.youtube.com/watch?v=IkTyzmrT-1w&feature=youtu.be

INTRODUCTION

Les guerres se produisent année après année, conflits et émeutes faisant des dizaines de morts, détruire des villes, régions et pays. Ils laissent aussi un grand troupeau de blessés, saturer les hôpitaux et les centres médicaux dans les zones de conflit.

Quand une attaque se produit et est racontée à la télévision, le spectateur peut poser des questions telles que: « Où sont les attentats terroristes les plus concentrés ??", « Quels pays sont les plus touchés ??", "Quels types d'attaques sont les plus populaires?". Ces questions n'ont pas de réponse instantanée., mais grâce à ce projet il est possible de résoudre ces questions.

PHASES D'AFFICHAGE

Une fois l'objectif de ce travail présenté, nous pouvons maintenant passer à la partie importante de ce, la description de chacune des phases de visualisation.

ACQUISITION

La base de données choisie provient du Web bien connu Kagglé (https://www.kaggle.com/START-UMD/gtd) . ladite base, stocke des informations sur les attaques terroristes de l'année 1970 jusqu'au 2017. Obtenir de telles données était facile. Téléchargé au format csv. avec la base de données, un PDF a également été obtenu qui expliquait quel type d'information chaque variable stockait (métadonnées).

FILTRÉ

Compte tenu du grand volume de données stockées dans la table "terrorisme", Il a fallu réduire ce poids pour accélérer les calculs nécessaires aux phases suivantes. Pour lui, toutes les données sauf celles pertinentes ont été supprimées.

Cette phase a été réalisée en Python, puisqu'il s'agit d'un outil puissant pour les tâches de filtrage et de formatage des données. Avant d'apporter des modifications, la base de données avait 135 colonnes pour 176330 attaques. Il fallait absolument réduire les dimensions de ce.

Pour lui, seules les variables qui seraient utiles pour les analyses futures ont été sélectionnées. Ces variables en question sont:

"chaque année": stocke l'année de l'attaque. Prendre des valeurs de 1970 jusqu'à ce que 2017.

"un mois": stocke le mois de l'attaque.

"mouton": sauver le jour de l'attaque.

"critique1", "critique2", "critique3": stocker des informations sur la raison pour laquelle l'attaque a été menée.

"pays_txt": dans quel pays l'attaque a eu lieu.

"région_txt": région où l'attaque s'est produite.

"état probatoire": province/état où l'attaque s'est produite.

"ville": ville d'attaque.

"latitude« e »longitude": point géographique exact où l'attaque s'est produite.

"type d'attaque1": type d'attaque. Variable quantitative catégorielle indiquant les types d'attaques terroristes telles que les attentats à la bombe, meurtre, ravissement…

"suicide": Variable quantitative catégorielle qui dit si l'attaque était suicidaire ou non.

"type d'arme1": Variable quantitative catégorielle qui rapporte le type d'arme utilisée dans l'attaque.

"nkill« e »blessé": nombre de morts et de blessés lors d'un attentat, respectivement.

"succès": Variable quantitative catégorielle. L'attaque a-t-elle réussi ou non ??

"propétendre": Variable quantitative catégorielle qui rend compte de l'impact économique de l'attaque. Stocke si l'attaque a causé moins de 1 million de dollars de dégâts, inférieur un 1 milliards de dollars ou plus que ce montant.

Certaines de ces variables ont été utilisées à des fins exploratoires uniquement et n'ont pas été incluses dans l'ele tableau de bord final. C'est le cas de "critique1", "critique2", "critique3", "région_txt« e »succès", entre autres.

FORMAT

Beaucoup de ces variables sont entrées dans le mauvais format. Tous ceux qui étaient quantitatifs catégoriques prenaient des valeurs flotter, ayant le caractère décimal sans fournir aucune information. Pour lui, converti en chaîne. En outre, certaines chaînes comme l'année, le mois et le jour étaient des nombres entiers et devaient changer le type. Alors, toutes les variables deviennent chaîne, A l'exception de "nkill« e »blessé” qui sont des entiers.

Avoir de nombreuses observations, il est normal de trouver des données manquantes. Un test a été réalisé pour supprimer toutes ces valeurs, mais la base de données est passée de 170000 attaque juste 40000. Combien d'informations ont été perdues, ces valeurs manquantes ont été laissées. Comme une exception, dans les deux variables numériques mentionnées ci-dessus, au lieu de laisser ces valeurs manquantes, ces écarts ont été imputés par la moyenne de chaque colonne.

Toutes ces modifications sont rassemblées dans le fichier "Clean_And_Recode.ipynb", où le processus de formatage de ces variables est expliqué étape par étape.

En outre, représenter les pays dans l'un des graphiques, il fallait que les territoires du monde aient un code exact pour pouvoir les peindre sur la carte en question. À cause de, un changement de nom était nécessaire. Pour faire ce changement, s'est emparé de la librairie code postal qui a transformé le nom du pays en code correspondant. Par exemple, il est passé de "Espagne" à "ESP".

EXPLOITATION MINIÈRE

Le projet est déjà passé à R. Dans ce langage, le code a été préparé pour faire de chaque graphique. De nombreux recodages mis en œuvre, filtres et obtention de statistiques pour la mise en œuvre correcte des éléments graphiques. Par exemple, Pour la création de nombreux graphiques, certaines informations spécifiques étaient nécessaires pour un pays dans une période de temps spécifique.. Pour cela, l'utilisation de sommes a été essentielle pour obtenir les données requises.

Au début, vous aviez tout dans le même document mais le temps d'exécution a dépassé le 3 minutes chaque fois que vous vouliez obtenir le tableau de bord final. À cause de, tous les calculs d'exploration de données ont été séparés du code dans Rmarkdown et l'a exécuté une fois sur un autre document, enregistrant ainsi dans un CSV la sortie des algorithmes créés pour simplifier les informations de cette étape. En enregistrant ces tableaux dans un fichier séparé, Il a été possible de réduire le temps d'exécution de 3 quelques minutes 10 secondes. Ainsi, aucune exploration de données n'apparaîtra dans le code final., mais cette couche de visualisation des informations a été prise en compte.

comme remarque, on voit bien que, dans le dernier onglet du tableau de bord, la couche de minage a été implémentée, étant donné que les sommes sont faites à la fois du nombre de morts et de blessés dans le pays sélectionné.

REPRÉSENTATION

Avant d'effectuer la tableau de bord en question, chacun des graphes qu'il contient a été exécuté séparément. Le premier d'entre eux, et le plus important, C'est la visualisation d'une carte du monde sur laquelle certains points sont tracés dessus.. Ces points traitent de chacun des attentats terroristes survenus entre l'année 1970 et le 2017.

On pense qu'en faisant ce graphique une visualisation très générale du sujet traité peut être obtenue dès le début et, de cette façon, lors de la visualisation du reste des éléments graphiques de la tableau de bord, la nature des données utilisées sera pleinement connue.

Au début, ils voulaient peindre ces points en rouge. Cependant, dans la phase suivante (Raffiné) les raisons pour lesquelles il est finalement passé à une couleur jaune seront expliquées.

Illustration – cartographier les attaques terroristes

Ensuite, une fois qu'un aperçu des attaques a été obtenu via la carte du monde, On passe maintenant à la réalisation d'une autre carte, dans ce cas un Choroplèthe, dans lequel les pays sont ombrés de différentes couleurs, souvent dans la même gamme de couleurs. Cette représentation graphique est destinée à montrer le nombre total de décès par pays.

Illustration – attaques terroristes choroplèthes

La séquence de couleurs qui a été choisie pour représenter cette information est la "YlOrRd" contenant du jaune très clair au rouge foncé. Cette palette a été choisie car des données sur le terrorisme sont en cours de traitement et il convient d'utiliser des couleurs "chaudes" pour représenter lesdites informations..

Illustration – séquence de couleurs (palettes)

Nous allons maintenant passer au graphique des informations plus détaillées. Pour commencer, la même carte est implémentée à nouveau qu'au début mais avec une nuance qui sera expliquée dans la phase d'interaction. à côté de cette carte, deux autres graphiques apparaissent.

Le premier d'entre eux est un graphique à barres qui contient des informations sur les attaques les plus populaires survenues entre les années disponibles dans la base de données.. Pour représenter cette information, la variable "type d'attaque1". Dans chacun des bars, affiche le nombre d'attaques effectuées de ce type. Plus tard, Dans les sections Affinage et Interaction, chacune des améliorations apportées à cette représentation sera expliquée..

[1]

Illustration – graphique à barres des attaques populaires

alors, avec le graphique qui vient d'être présenté, un autre graphique à barres est joint. Dans ce cas, la variable "prolonger ». ladite variable, comme expliqué dans la section Phase de filtrage, explique l'impact économique de cette attaque particulière. De manière similaire au graphique précédent, le nombre d'attentats a été compté pour chacun des impacts économiques qu'ils ont entraînés.

Illustration – Graphique à barres impact économique des attentats terroristes

Finalement, dans le dernier onglet du tableau de bord, des informations encore plus détaillées sont décrites, dans ce cas, les données sont affichées pour un pays spécifique. D'une part, la carte est présentée avec les attaques peintes en haut et, en bas, Trois types de graphiques sont créés pour représenter les personnes décédées et blessées lors d'attaques terroristes.

  • Le premier d'entre eux est un élément graphique appelé ValueBox quoi, comme son nom l'indique, C'est une case qui indique une valeur spécifique. Pour ce cas, Deux de ces graphiques seront utilisés pour montrer le nombre de décès et le nombre total de blessés pour un pays spécifique..
  • Le deuxième type est un graphique linéaire qui indique l'évolution des décès/blessures dans ce pays spécifique.. Pour cela, la somme de ces variables a été obtenue pour chaque année..
  • Et le troisième est un autre graphique à barres lié à celui discuté ci-dessus.. Cependant, dans ce cas, au lieu de compter le nombre d'attaques faites de chaque type, la somme des décès/blessures causés par chacun d'eux pour chaque année est obtenue.

Illustration – Graphique linéaire des décès et des blessures en Espagne

Illustration – Diagramme à barres des décès et des blessés par type d'attaque au Nigéria

INTERACTION

Rendre les graphiques beaucoup plus dynamiques et permettre à l'utilisateur d'enquêter et d'observer les informations qu'il souhaitait, de nombreux boutons et sélecteurs ont été implémentés.

d'abord, dans l'onglet dans lequel les informations sont discutées plus en détail, Cette sous-section consiste à afficher les informations selon le type d'attaque. A gauche des graphiques, une liste déroulante apparaît pour sélectionner le type d'attaque. En sélectionnant, par exemple, "Meurtre", la carte montrera maintenant les attaques qui ont été des meurtres. Dans ce même onglet, Un bouton est implémenté dans les deux graphiques ci-dessous pour initialiser l'interaction au fil des années et visualiser ces informations de manière beaucoup plus ludique.

Dans le cas du dernier onglet, la procédure est très similaire mais varie dans le sélecteur, que maintenant ce sera par pays et non par type d'attaque. En outre, ce changement affecte tous les éléments graphiques présents dans ledit onglet. Le bouton a le même usage que dans l'explication précédente.

Il est opportun de dire que le trieur utilisé n'est pas celui qui offre comploter, mais c'est celui proposé par la librairie Brillant. Afin de l'utiliser, la fonction est utilisée sélectionnezEntrée sélectionner et, plus tard, comprend le code de comploter sous fonction renderPlotly. Pour que la valeur sélectionnée prenne effet sur le graphique, l'élément en question sera invoqué avec entrée$Type (étant Taper le nom donné au sélecteur).

Illustration – Tableau de bord informations complètes par pays

RAFFINÉ

Finalement, une fois que chaque graphique a été obtenu et que l'interaction entre eux a été ajoutée, il irait à la dernière phase de visualisation, celui du raffiné, qui consisterait à améliorer chacune des représentations proposées depuis le début.

En phase de rendu, le premier graphique introduit était la carte avec les points (en référence aux attentats) peint dessus. Au début, ils avaient été colorés en rouge mais, il a fini par virer au jaune. Cette décision est rendue lors de la réalisation du dernier onglet du tableau de bord, dans lequel les graphiques des personnes décédées et blessées sont représentés avec la carte. Si la couleur rouge restait sur les pointes, quiconque voit le tableau de bord Je pourrais l'associer à des morts et non à une attaque en général.

Concernant les nuances dans l'onglet graphismes détaillés, puisque la carte est affichée en jaune, il était destiné à impliquer que ce qui était représenté dans les deux graphiques en bas est un autre type d'information différente de celle de la carte mais, Dans une certaine mesure, en rapport. Pour lui, il a été décidé d'utiliser des couleurs similaires au jaune de la carte pour les autres graphiques, prendre des valeurs orange.

Enfin il serait temps de parler des couleurs des graphiques du dernier onglet, faisant référence aux blessés et aux personnes décédées dans chacune des attaques. Comme mentionné précédemment, la carte (situé en haut de l'onglet) il sera peint avec les points en jaune. Donc, Il a été décidé de choisir des couleurs similaires qui représentent des informations très similaires. Par conséquent, une couleur rouge peu saturée est choisie pour représenter les informations sur le défunt et un orange peu foncé pour les blessés.

Il faut ajouter que dans leBoîte de valeur » mentionné ci-dessus, deux icônes sont ajoutées pour clarifier davantage ce que chacun de ces graphiques représente. Pour le défunt, un crâne et, pour les blessés, une ambulance.

CONCLUSION

Se référant aux questions de l'introduction, ce projet rapproche l'utilisateur des réponses possibles.

pour la question « Où sont les attentats terroristes les plus concentrés ??" la réponse est claire, à première vue, L'Inde et le Bangladesh emmènent le chat à l'eau. Il suffit de regarder la carte mondiale des attaques, la superficie de ces pays n'est guère appréciée par le nombre d'attaques qu'ils ont subies.

"Qu'en est-il des pays les plus touchés?" observer la Choropeth on peut voir que ceux peints dans une couleur plus foncée sont les plus touchés. De ceux-ci, L'Irak est celui qui a enregistré le plus de morts (la valeur peut être spécifiquement observée en se positionnant sur ledit pays → 79565)

et pour la question "Quels types d'attaques sont les plus populaires?" Les agressions armées et les bombardements sont les plus courants, surtout au Moyen-Orient et en Asie.

Code du tableau de bord: https://github.com/alvaro-mazcu-herreros/terrorism

Brève explication du projet: https://www.youtube.com/watch?v=IkTyzmrT-1w&feature=youtu.be

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *