Dashboard des Terrorismus in der Welt

Dashboard-Daten-Terrorismus

Projekt durchgeführt von:

Dashboard-Code: https://github.com/alvaro-mazcu-herreros/terrorism

Kurze Erläuterung des Projekts: https://www.youtube.com/watch?v=IkTyzmrT-1w&feature=youtu.be

EINFÜHRUNG

Jahr für Jahr kommt es zu Kriegen, Konflikte und Revolten, die Dutzende von Leben vorausbringen, Städte zerstören, Regionen und Länder. Sie hinterlassen auch eine große Herde Verwundeter, Sättigung von Krankenhäusern und medizinischen Zentren in Konfliktgebieten.

Wenn ein Angriff passiert und es im Fernsehen erzählt wird, Der Betrachter kann Fragen wie stellen: „Wo sind die Terroranschläge am konzentriertesten??”, "Welche Länder sind am stärksten betroffen??”, Welche Angriffsarten sind am beliebtesten??”. Diese Fragen haben keine sofortige Antwort, Dank dieses Projekts ist es jedoch möglich, diese Fragen zu lösen.

VISUALISIERUNGSPHASEN

Sobald das Ziel dieser Arbeit eingegeben wurde, Sie können zum wichtigen Teil davon übergehen, die Beschreibung jeder der Visualisierungsphasen.

ERWERB

Die ausgewählte Datenbank stammt von der bekannten Website Kaggle (https://www.kaggle.com/START-UMD/gtd) . Die Basis, speichert Informationen über Terroranschläge seit dem Jahr 1970 bis zum 2017. Das Abrufen dieser Daten war einfach. Es wurde im CSV-Format heruntergeladen. Zusammen mit der Datenbank, Es wurde auch ein PDF erhalten, das erklärte, welche Art von Informationen jede Variable speicherte (Metadaten).

AUSGEFILTERT

Angesichts des großen Datenvolumens, das in der Tabelle gespeichert wird "Terrorismus", Dieses Gewicht musste reduziert werden, um die für die folgenden Phasen erforderlichen Berechnungen zu beschleunigen. So, Alle Daten außer denen von Interesse wurden gelöscht.

Diese Phase wurde in durchgeführt Python, da es ein leistungsstarkes Tool zum Filtern und Formatieren von Daten ist. Bevor Sie Änderungen vornehmen, Die Datenbank hatte 135 Spalten für 176330 Anschläge. Es war absolut notwendig, die Abmessungen zu reduzieren.

So, Es wurden nur die Variablen ausgewählt, die für zukünftige Analysen nützlich wären. Diese fraglichen Variablen sind:

iyear”: speichert das Jahr des Angriffs. Nimm Werte von 1970 bis um 2017.

imonth”: speichert den Monat des Angriffs.

iday”: Speichern Sie den Tag des Angriffs.

krit1”, ”krit2”, „krit3”: Sie speichern die Informationen darüber, warum der Angriff ausgeführt wurde.

country_txt”: In welchem ​​Land fand der Angriff statt?.

region_txt”: Region, in der der Angriff stattgefunden hat.

provstate”: Provinz / Staat, in dem der Angriff stattgefunden hat.

Stadt”: Angriffsstadt.

Breite"Y"Längengrad”: genauer geografischer Punkt, an dem der Angriff stattgefunden hat.

Angriffstyp1”: Art des Angriffs. Kategoriale quantitative Variable, die die Arten von Terroranschlägen wie Bombenangriffen angibt, Mord, Entrückung…

Selbstmord”: Kategoriale quantitative Variable, die angibt, ob der Angriff selbstmörderisch war oder nicht.

Weaptype1”: Kategoriale quantitative Variable, die den im Angriff verwendeten Waffentyp angibt.

nkill"Y"nwound”: Anzahl der Toten und Verwundeten bei einem Angriff, beziehungsweise.

Erfolg”: Kategoriale quantitative Variable. War der Angriff erfolgreich oder nicht??

vorwegnehmen”: Kategoriale quantitative Variable, die die wirtschaftlichen Auswirkungen des Angriffs angibt. Speichert, wenn der Angriff weniger als 1 Mio. USD Schaden verursacht hat, weniger als 1 Billionen Dollar oder mehr als dieser Betrag.

Einige dieser Variablen wurden ausschließlich zu Erkundungszwecken verwendet und gingen nicht in e einl Armaturenbrett Finale. Es ist der Fall von "krit1”, ”krit2”, „krit3”, „region_txt"Y"Erfolg”, unter anderem.

FORMATIERUNG

Viele dieser Variablen hatten das falsche Format. Alle quantitativen Kategorien nahmen Werte an schweben, mit dem Dezimalzeichen ohne Angabe von Informationen. So, wurden in Zeichenfolgen umgewandelt. Ebenfalls, Einige Saiten mögen das Jahr, Monat und Tag waren ganze Zahlen und mussten den Typ ändern. So, Alle Variablen werden Zeichenfolge, außer "nkill"Y"nwoundWelches sind ganze Zahlen.

Durch viele Beobachtungen, Es ist normal, fehlende Daten zu finden. Es wurde ein Test durchgeführt, um alle diese Werte zu entfernen, aber die Datenbank ging von 170000 greift nur an 40000. Wie viele Informationen gingen verloren, Diese fehlenden Werte wurden belassen. Als eine Ausnahme, in den beiden oben genannten numerischen Variablen, anstatt diese fehlenden Werte zu belassen, Diese Lücken wurden durch den Mittelwert jeder Spalte unterstellt.

Alle diese Änderungen sind in der Datei enthalten "Clean_And_Recoding.ipynb", Hier wird Schritt für Schritt erklärt, wie diese Variablen formatiert werden.

Ebenfalls, um die Länder in einem der Diagramme darzustellen, Dies erforderte, dass die Gebiete der Welt einen genauen Code hatten, um sie auf die fragliche Karte malen zu können. Aus diesem Grund, Eine Änderung ihres Namens war erforderlich. Um diese Änderung vorzunehmen, er besorgte sich die Buchhandlung Ländercode wodurch der Name des Landes in den entsprechenden Code umgewandelt wurde. Beispielsweise, es ging von "Spanien" zu "ESP".

GEBAUT

Das Projekt geht jetzt an R.. In dieser Sprache wurde der Code vorbereitet, um jedes Diagramm zu erstellen. Zahlreiche Rekodierungen wurden implementiert, filtert und erhält Statistiken für die korrekte Implementierung grafischer Elemente. Beispielsweise, Für die Erstellung vieler Diagramme wurden bestimmte spezifische Informationen für ein Land in einem bestimmten Zeitraum benötigt. Dafür, Die Verwendung von Beträgen war der Schlüssel zum Erreichen der erforderlichen Daten.

Am Anfang, Alles befand sich im selben Dokument, aber die Ausführungszeit wurde überschritten 3 Minuten jedes Mal, wenn Sie die bekommen wollten Instrumententafel Finale. Aus diesem Grund, Alle Data Mining-Berechnungen wurden vom Code in getrennt Rmarkdown und es wurde einmal in einem anderen Dokument ausgeführt, wodurch in a gespeichert wurde csv die Ausgabe der Algorithmen, die erstellt wurden, um die Informationen dieses Schritts zu vereinfachen. Durch Speichern dieser Tabellen in einer separaten Datei, Es war möglich, die Ausführungszeit von zu reduzieren 3 Minuten nur 10 Sekunden. Daher wird im endgültigen Code nichts Data Mining angezeigt, Diese Informationsanzeigeebene wurde jedoch berücksichtigt.

Als Beobachtung, es ist deutlich zu sehen, dass, in der letzten Registerkarte der Instrumententafel, Die Mining-Schicht wurde implementiert, da die Beträge sowohl aus der Anzahl der Todesfälle als auch aus den Verletzungen im ausgewählten Land bestehen.

DARSTELLUNG

Vor dem Ausführen der Instrumententafel fraglich, Jedes der darin enthaltenen Diagramme wurde separat ausgeführt. Der erste von ihnen, und das wichtigste, ist die Visualisierung einer Weltkarte, auf der einige Punkte grafisch dargestellt sind. Diese Punkte befassen sich mit jedem einzelnen Terroranschlag, der zwischen dem Jahr stattgefunden hat 1970 und das 2017.

Es wird angenommen, dass durch die Erstellung dieses Diagramms von Anfang an eine sehr allgemeine Visualisierung des diskutierten Themas erhalten werden kann, so, beim Anzeigen der restlichen grafischen Elemente des Instrumententafel, Die Art der verwendeten Daten ist vollständig bekannt.

Zuerst wollten sie diese Punkte rot streichen. jedoch, in der nächsten Phase (Raffiniert) Die Gründe, warum es sich endlich in eine gelbe Farbe verwandelt hat, werden erklärt.

Illustration – Karte der Terroranschläge

Dann, sobald man sich über die Weltkarte einen Überblick über die Angriffe verschafft hat, jetzt gehen wir zur Realisierung einer anderen Karte über, in diesem Fall a Choropleth, in denen Länder in verschiedenen Farben schattiert sind, oft im gleichen Farbraum. Mittels dieser grafischen Darstellung soll die Zahl der Gesamttoten nach Ländern dargestellt werden.

Illustration – Choroplethen-Terroranschläge

Die Farbreihenfolge, die gewählt wurde, um diese Informationen darzustellen, ist die „YlOrRd“ enthält von sehr hellgelb bis dunkelrot. Diese Palette wurde gewählt, da Daten zum Terrorismus verarbeitet werden und es ratsam ist, "warme" Farben zu verwenden, um diese Informationen darzustellen..

Illustration – Farbfolge (Paddel)

Jetzt würden genauere Informationen angezeigt. um anzufangen, dieselbe Karte wie zu Beginn wird neu implementiert, jedoch mit einer Nuance, die in der Interaktionsphase erklärt wird. Neben dieser Karte, zwei weitere Grafiken erscheinen.

Das erste ist ein Balkendiagramm, das Informationen zu den beliebtesten Angriffen enthält, die zwischen den in der Datenbank verfügbaren Jahren aufgetreten sind.. Um diese Informationen darzustellen, wird die Variable „Angriffstyp1“. In jeder der Bars, die Anzahl der Angriffe dieser Art wird angezeigt. Später, In den Abschnitten Verfeinert und Interaktion werden alle Verbesserungen erläutert, die in dieser Darstellung vorgenommen wurden..

[1]

Illustration – Balkendiagramm für beliebte Angriffe

Dann, zusammen mit der eben vorgestellten Grafik, ein weiteres Balkendiagramm ist beigefügt. In diesem Fall ist die Variable „prolongieren“. Besagte Variable, wie im Abschnitt über die Filterphase erklärt, erklärt die wirtschaftlichen Auswirkungen dieses speziellen Angriffs. Ähnlich wie in der vorherigen Grafik, die Anzahl der Angriffe wurde für jede der damit verbundenen wirtschaftlichen Auswirkungen gezählt.

Illustration – Balkendiagramm wirtschaftliche Auswirkungen Terroranschläge

Schließlich, in der letzten Registerkarte der Instrumententafel, noch detailliertere Informationen werden beschrieben, in diesem Fall, die Daten werden für ein bestimmtes Land angezeigt. Auf der einen Seite, die Karte wird mit den oben gemalten Angriffen angezeigt und, auf der Unterseite, Es werden drei Arten von Grafiken erstellt, die sowohl die Verstorbenen als auch die Verletzten der Terroranschläge darstellen.

  • Das erste davon ist ein grafisches Element, das als . bekannt ist ValueBox das, wie der Name schon sagt, es ist ein Kästchen, das einen bestimmten Wert angibt. Für diesen Fall, Zwei dieser Grafiken werden verwendet, um die Zahl der Toten und die Gesamtzahl der Verwundeten für ein bestimmtes Land darzustellen.
  • Der zweite Typ ist ein Liniendiagramm, das die Entwicklung des Verstorbenen / Verletzten in diesem bestimmten Land anzeigt.. Dazu wurde für jedes Jahr die Summe dieser Variablen ermittelt.
  • Und das dritte ist ein weiteres Balkendiagramm, das mit dem zuvor besprochenen verwandt ist. jedoch, in diesem Fall, anstatt die Anzahl der Angriffe jedes Typs zu zählen, die Summe der Todesfälle/Verletzungen durch diese wird für jedes Jahr ermittelt.

Illustration – Liniendiagramm der Todesfälle und Verletzungen in Spanien

Illustration – Balkendiagramm Tote und Verletzte nach Art des Angriffs in Nigeria

INTERAKTION

Um die Grafiken viel dynamischer zu gestalten und der Benutzer die gewünschten Informationen untersuchen und beobachten kann, zahlreiche Knöpfe und Wahlschalter wurden implementiert.

zuerst, in der Registerkarte, in der Informationen detaillierter behandelt werden, Dieser Unterabschnitt besteht aus der Anzeige der Informationen nach der Art des Angriffs. Links neben der Grafik, ein Dropdown erscheint, um die Art des Angriffs auszuwählen. Durch die Auswahl, beispielsweise, „Mord”, Die Karte zeigt jetzt die Angriffe, bei denen es sich um Morde handelte. In derselben Registerkarte, In den beiden folgenden Grafiken ist eine Schaltfläche implementiert, um die Interaktion über die Jahre zu initialisieren und diese Informationen auf eine viel unterhaltsamere Weise zu visualisieren.

Bei der letzten Registerkarte, die Vorgehensweise ist sehr ähnlich, variiert jedoch im Selektor, dass es jetzt nach Ländern und nicht nach Angriffsart sein wird. Ebenfalls, diese Änderung wirkt sich auf alle grafischen Elemente aus, die in dieser Registerkarte vorhanden sind. Die Schaltfläche hat die gleiche Verwendung wie in der vorherigen Erklärung.

Es ist angebracht zu bemerken, dass der verwendete Selektor nicht der ist, der bietet Handlung, wenn nicht, wird es von der Buchhandlung angeboten Glänzend. Um es nutzen zu können, die Funktion wird verwendet selectInput auswählen und, später, der Code von Handlung unter der Funktion renderPlotly. Damit sich der ausgewählte Wert auf die Grafik auswirkt, das fragliche Element wird aufgerufen mit Eingabe$Tipo (Sein Kerl der Name des Trainers).

Illustration – Vollständiges Informations-Dashboard nach Land

RAFFINIERT

Schließlich, sobald jeder einzelne Graph erhalten wurde und die Interaktion zwischen ihnen hinzugefügt wurde, die letzte Visualisierungsphase wäre nun bestanden, die raffinierte, was darin bestehen würde, jede der von Anfang an erhobenen Darstellungen zu verbessern.

In der Repräsentationsphase, die erste eingegebene Grafik war die Karte mit den Punkten (in Bezug auf Angriffe) drauf gemalt. Zuerst waren sie rot gefärbt, aber, Am Ende wurde es gelb. Diese Entscheidung wird beim Ausfüllen des letzten Tabs des Instrumententafel, in dem die Grafiken von Verstorbenen und Verletzten zusammen mit der Karte dargestellt werden. Wenn die rote Farbe auf den Punkten geblieben ist, jeder, der das visualisiert hat Instrumententafel Ich könnte es mit dem Verstorbenen in Verbindung bringen und nicht mit einem Angriff im Allgemeinen.

Zu den Tönen im Reiter der Detailgrafik, da die Karte gelb angezeigt wird, Es sollte andeuten, dass es sich bei dem, was in den beiden Diagrammen unten dargestellt ist, um eine andere Art von Informationen handelt, die sich von der auf der Karte unterscheidet, aber, Bis zu einem gewissen Grad, verbunden. So, Es wurde beschlossen, für die anderen Grafiken Farben analog dem Gelb der Karte zu verwenden, orange Werte nehmen.

Zum Schluss müsste ich noch über die Farben der Grafiken des letzten Tabs sprechen, in Bezug auf die Verwundeten und Verstorbenen bei jedem der Angriffe. Wie vorab erwähnt, die Karte (oben auf der Registerkarte zu finden) es wird mit den Punkten in Gelb bemalt. So, Es wurde beschlossen, analoge Farben zu wählen, die sehr ähnliche Informationen darstellen. Deshalb, ein nicht sehr gesättigtes Rot wird gewählt, um die Informationen des Verstorbenen darzustellen und ein nicht sehr dunkles Orange für den Verletzten.

Es sollte hinzugefügt werden, dass in der "ValueBox“ oben erwähnt, zwei Symbole werden hinzugefügt, um weiter zu verdeutlichen, was jede dieser Grafiken darstellt. Für den Verstorbenen ein Totenkopf und, für die Verwundeten, ein Krankenwagen.

FAZIT

In Anlehnung an die Fragen in der Einleitung, dieses Projekt bringt dem Nutzer mögliche Antworten näher.

Für die Frage „Wo sind die Terroranschläge am konzentriertesten??” Die Antwort ist klar, bloßes Auge, Indien und Bangladesch bringen den Wagenheber ins Wasser. Allein durch einen Blick auf die globale Karte der Angriffe, Die Fläche dieser Länder wird aufgrund der Anzahl der Angriffe, die sie erhalten haben, kaum geschätzt.

„Was ist mit den am stärksten betroffenen Ländern??” Beobachten Choropeth Es wird geschätzt, dass diejenigen, die in einer dunkleren Farbe lackiert sind, am stärksten betroffen sind. Von diesen, Der Irak hat die meisten Todesfälle verzeichnet (der Wert kann gezielt beobachtet werden, indem man sich auf dieses Land positioniert → 79565)

Und zur Frage Welche Angriffsarten sind am beliebtesten??” Bewaffnete Überfälle und Bombenanschläge sind die häufigsten, vor allem im Nahen Osten und in Asien.

Dashboard-Code: https://github.com/alvaro-mazcu-herreros/terrorism

Kurze Erläuterung des Projekts: https://www.youtube.com/watch?v=IkTyzmrT-1w&feature=youtu.be

Kommentar verfassen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert