Dashboard del COVID-19 en España

mapa-cloropético-fallecimientos-covid-19

El #COVID19 es un virus aterrador y son muchas las dudas que nos asaltan cada día… ¿Pero y si tuviéramos un dashboard  del COVID-19  en España que actualiza su información diariamente con toda la información que necesitas saber acerca del virus en #España dividida por comunidades?

Esto es lo que os presentamos hoy, un dashboard que sin duda no dejará indiferente a nadie, desarrollado junto a mi compañero de carrera y amigo del grado en Ciencia de Datos de la Universitat Politècnica de València (UPV) #UPV

Resumen:

El Dashboard del COVID-19 en España contiene una serie de datos sobre el COVID-19 de vital importancia como el número de casos o bien, el número de fallecimientos. Estos indicadores son esenciales para determinar el estado del virus en España.

Datos:

Además, los datos vienen presentados en magnitudes absolutas y relativas en función de la población por lo que podemos saber cuál es el grado de incidencia. Estos datos vienen agrupados por Comunidad Autónoma por lo que podremos conocer el estado de nuestra Comunidad Autónoma.

Gráficos

Por último, los datos vienen representados en diferentes formatos (mapas, gráficos de barras) interactivos por lo que el usuario podrá jugar con estos y seleccionar/ modificar el gráfico a su gusto.

Enlace al dashboard:

https://entredatos.es/dashboard/covid-19-spain/

Video explicativo:


Para el desarrollo del dashboard del COVID-19 en España se han seguido una serie de pasos. En concreto, se han desarrollado siguiendo las 7 fases de la visualización.

Explicación del dashboard del COVID-19 en España detallada (para frikis)

1. Introducción

La visualización de los datos es una herramienta muy potente que permite observar la realidad de forma objetiva y así poder extraer conclusiones o conocimiento útil de forma rápida y sencilla.

Es importante saber que en todo proceso de visualización se responde a una o varias preguntas y que a partir de éstas, se han de realizar las visualizaciones necesarias que permitan responderlas de forma fácil.

2. Pregunta inicial

En este caso se quiere saber cuál es el estado y evolución del COVID-19 en España. Concretamente, se quería conocer cuántas personas han sufrido el COVID-19, cuántas han fallecido y también cuál es la letalidad de este virus. También, interesa saber cuál ha sido la evolución y el estado del virus por Comunidad/ Ciudad autónoma. Por todo esto, la pregunta que se plantea es la siguiente:

– ¿Cuál es el estado del COVID-19 en España en la actualidad y cómo ha evolucionado este a lo largo del tiempo tanto a nivel nacional como por comunidad autónoma?

Una vez se conoce la pregunta que se desea responder se puede comenzar a describir las 7 fases de la visualización.

3. Las 7 fases de la visualización

A continuación, se describirán cada una de las fases de la visualización por las que se ha pasado a la hora de realizar este proyecto.

3.1 Adquisición

La primera fase consiste en la obtención de los datos, en este caso, se busca datos que recojan los casos y fallecimientos por COVID-19 en España separados por comunidad / ciudad autónoma. Además, se busca que los datos se actualicen diariamente para así poder realizar visualizaciones en tiempo real.

Estos datos han sido encontrados en el repositorio de Github oficial del equipo de Sistemas de Ciencia e Ingeniería de la Universidad de Johns Hopkins

Datos COVID-19, 2020

También, es necesaria información geográfica de cada una de las comunidades/ciudades autónomas de España, para luego realizar un mapa de calor (Choropleth) con datos del COVID-19. Estos datos los hemos encontrado en un repositorio de Github de la organización ‘Code for America’

Datos geográficos, 2014

Por último, con el fin de realizar nuevas métricas que sean útiles para saber el estado el COVID-19 y evolución de este en las diferentes comunidades/ ciudades autónomas, son necesarios datos del censo del censo de población de estas regiones. De esta forma, se puede saber a qué porcentaje de la población ha afectado el COVID-19. Estos datos se han encontrado en la página del INE (Instituto nacional de estadística de España)

Datos del censo de España

3.2 Formateado

En este apartado se ha cambiado los nombres de las columnas de los datos de COVID-19 traduciéndolos al español.

También, se ha formateado el censo de la población española, ya que la población venía expresada en una cadena de texto separada por puntos cada tres números. Se ha pasado a un número entero.

3.3 Filtrado

En esta parte se han eliminado los datos de menor interés. En el caso de los datos del COVID-19 se han eliminado todas las observaciones que no pertenecían a España, también, se han eliminado columnas como casos recuperados y casos activos ya que eran meras estimaciones y no eran de nuestro interés.

En los datos geográficos de España, se ha reducido el detalle de la representación para optimizar su visualización (reducir el tiempo de carga) a través de una herramienta de libre distribución muy útil llamada ‘mapshaper’ que se puede encontrar en el siguiente enlace: https://mapshaper.org/

Esta herramienta permite aplicar algoritmos de simplificación que reducen el tamaño del archivo de datos eliminado observaciones y simplificando los polígonos que forman cada una de las regiones. De esta forma, se obtiene un fichero mucho menor tamaño y a efectos prácticos dicha simplificación apenas es perceptible a simple vista.

En cuanto a los datos del censo de España se ha eliminado la columna correspondiente al sexo de la población ya que en este caso solo es interesante el total de hombres y mujeres.

3.4 Minado

En el minado se busca discernir patrones o bien colocar los datos en un contexto matemático. En este caso, el minado que se ha realizado es básico.

Primero de todo, se han juntado las fuentes de datos de COVID-19 y el censo.

Segundo, se han formado 3 nuevas medidas o columnas para cada una de las comunidades autónomas, estas son:

% de letalidad: Indica el porcentaje sobre 100 de personas que mueren a causa del COVID-19.

Su cálculo sería el siguiente: (Fallecimientos / Casos confirmados) * 100

% Población contagiada total: Indica el porcentaje sobre 100 de la población que ha sufrido el COVID-19.

Su cálculo sería el siguiente: (Casos confirmados / Población) * 100

% Población fallecida total: Indica el porcentaje sobre 100 de la población que ha fallecido a causa del COVID-19:

Su cálculo sería el siguiente: (Fallecimientos / Población) * 100

Respecto a los datos geográficos, la posición de las islas Canarias hacía que al representarlas en un mapa, estás estuvieran muy alejadas de España. Por ello, se ha decidido desplazar las coordenadas originales de las islas Canarias para que estén más cerca de la península (como en los mapas meteorológicos de las noticias). Esto se ha conseguido creando una función recursiva que recorre cada una de las coordenadas de las islas Canarias y le suma un constante a la latitud y otra constante distinta a la longitud.

También, se ha modificado el tamaño de las ciudades autónomas de Ceuta y Melilla haciéndolas mucho más grandes para que puedan identificarse a simple vista en el mapa, ya que su tamaño original era demasiado pequeño para ser identificado.

3.5 Representación

En la representación se escogen los distintos tipos de gráficos para poder visualizar los datos y por tanto contestar la pregunta. En este caso, se han escogido formas bastantes simples ya que son las más fáciles de comprender y transmitir información al usuario. Se han elegido mapas de color (Choropleth), gráficos de barras y gráficos de líneas. Además, se ha hecho uso de callouts que indican los KPI (key performance indicators), que en este caso son métricas que indican el estado del COVID-19 en España.

Mapa cloropético COVID-19 por comunidad autónoma en España
Mapa cloropético COVID-19 por comunidad autónoma en España

Gráfico 1: Mapa de calor del número de fallecimientos acumulado

población contagiada y fallecida por covid-19 por comunidad autónoma en España
población contagiada y fallecida por covid-19 por comunidad autónoma en España

Gráfico 2: Barras acumuladas de % de población contagiada y % de letalidad por comunidad autónoma

evolución covid-19 casos confirmados fallecimientos
evolución covid-19 casos confirmados fallecimientos

Gráfico 3: Evolución acumulada de casos y fallecimientos por COVID-19 en España

métricas claves COVID-19
métricas claves COVID-19

Gráfico 4: Uso de callouts que indican el estado del COVID-19 en España

3.6 Refinado

En el refinado se busca mejorar la representación y hacerla más atractiva al ojo humano. Los gráficos presentados arriba ya han sido refinados. El proceso que se ha seguido ha sido:

1º. Crear una paleta de colores para cada uno de los indicadores:

– Fallecimientos: Rojo

– Casos confirmados: Verde turquesa

– % Población contagiada: Lavanda

– % Población letalidad: Salmón

– % Población fallecida: Rosa palo

2º. Crear una paleta de colores y tipografía para los gráficos y letras:

Color de fondo: Azul oscuro

Color de letra: Blanco

Tipografía: Open Sans

La paleta de colores de los indicadores ha sido definida para mejorar la representación de forma que el usuario pueda asociar un color a un tipo de indicador, de esta forma, el usuario tiene más facilidad para identificar cada uno de los indiciadores.

La paleta de colores y tipografía para los gráficos y letras ha sido escogida para que las visualizaciones sean más atractivas al ojo humano.

3.7 Interacción

La interacción permite al usuario involucrarse en el gráfico ya sea para seleccionar de forma interactiva información relevante o incluso para generar nuevos gráficos a gusto del propio usuario.

En este dashboard la interacción es fundamental debido a la elevada cantidad de comunidades autónomas. En vez de realizar un gráfico por comunidad, se prefiere que el usuario elija la comunidad en la que está interesado y así pueda ver la evolución de la comunidad elegida sin sobrecargar el dashboard con otras tantas comunidades que no son de su interés.

En el mapa cloropético y en los gráficos de barras, el usuario puede ver la información detallada por comunidad con solo pasar el ratón por encima de ella. Además, en el mapa de color, el usuario puede elegir que representar en el mapa a través una serie de ventanas (muertes, casos confirmados, porcentajes…)

En los gráficos que muestran la evolución (time series), el usuario puede escoger entre las diferentes comunidades autónomas haciendo uso del seleccionador de comunidad autónoma.

4. Conclusión

La visualización de los datos es una herramienta que cada vez está más presente en nuestra sociedad ya que permite obtener información y, a través de esta, sacar conclusiones y conocimiento útil de forma rápida y eficaz.

En este caso, se ha querido reflejar el estado del COVID-19 y su evolución en las distintas comunidades/ ciudades autónomas de España. Para esta tarea, se ha realizado un dashboard que reúne las visualizaciones de diferentes indicadores de interés para saber el estado y evolución del COVID-19. Este puede consultarse en el siguiente enlace:

https://entredatos.es/dashboard/covid-19-spain

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *