Datos de COVID en Extremadura
May 9, 2021 · View on GitHub
You can read this README in English by clicking on this link.
En este repositorio se recogen los datos de casos de COVID proporcionados por al Junta de Extremadura para cada núcleo de población.
Además de los datos de cada día por separado, también figuran los datos de incidencia acumulada calculada a partir de ellos.
Estructura de archivos
En la carpeta raw es posible encontrar los archivos pdf originales proporcionados por la Junta de Extremadura.
En la carpeta csv es posible encontrar los archivos csv generados a partir de los archivos originales.
Cabe destacar que los archivos en pdf proporcionados por la Junta contienen un gran número de errores ortográficos en los nombres de las poblaciones/provincias/zonas de salud, además de ser inconsistentes en varias ocasiones, con errores a la hora de presentar los datos --como por ejemplo repetición de algunas poblaciones--.
En los archivos csv se han intentado corregir todos estos errores en la medida de lo posible, para también facilitar la automatización de su análisis.
Por último en la carpeta munDATA figuran los datos de población de las unidades poblacionales de Extremadura, extraídos de datos del Instituto Nacional de Estadística (INE) del 2019 y 2020 (ver nota al final).
Además de los datos proporcionados por el INE, también figura, en la provicia de Cáceres, la población de Valdelamantanza. Aunque pertenezca a la provincia de Salamanca, la Junta la incluye en los informes por tener un acuerdo en materia de salud.
Archivo de datos
En el archivo data.csv figura la recopilación de casos e incidencias de todas las unidades poblacionales de Extremadura.
Es importante destacar que no se trata de valores por municipios, sino por unidades poblacionales, tal y como la Junta proporciona estos datos.
Dicho archivo está concebido con la estructura de un DataFrame, presente en varias librerías para diversos lenguajes de programación.
Sus valores son:
| Valor | Descripción |
|---|---|
| day | Día para el que figuran los datos. En los informes de la Junta se publican los casos notificados el día previo, así que se indica de la misma manera en el archivo de datos. Por ejemplo, los datos proporcionados el 2 de octubre aparecen con la fecha 2020-10-01. |
| location | Unidad poblacional referida, con el nombre dado por el INE. |
| cases | Casos notificados el día indicado. |
| cases7 | Suma de los casos notificados los 7 días anteriores, incluyendo el día indicado. |
| IA7 | Incidencia acumulada de 7 días, es decir, la suma de los casos de los 7 días anteriores al indicado por 100.000 habitantes con los datos de 2019. |
| IA7_2020 | Incidencia acumulada de 7 días, es decir, la suma de los casos de los 7 días anteriores al indicado por 100.000 habitantes con los datos de 2020. |
| cases14 | Suma de los casos notificados los 14 días anteriores, incluyendo el día indicado. |
| IA14 | Incidencia acumulada de 14 días, es decir, la suma de los casos de los 14 días anteriores al indicado por 100.000 habitantes con los datos de 2019. |
| IA14_2020 | Incidencia acumulada de 14 días, es decir, la suma de los casos de los 14 días anteriores al indicado por 100.000 habitantes con los datos de 2020. |
Los valores de casos e incidencia acumulada toman el valor de -1 los primeros días de la serie, donde no hay datos durante el suficiente número de días para obtenerlos.
Los valores de la serie con datos actualizados también tienen el valor de -1 para los días anteriores al 1 de enero de 2021.
Además, los datos de incidencia acumulada también tomarán ese valor en el caso de la unidad de población de Monfragüe, que la Junta indica en uno de los reportes pero para la que no figuran datos de población.
Series de 2019 y 2020
Los datos recogidos parten de septiembre de 2020, cuando se usaron los datos de población del INE del 1 de enero de 2020, los más actualizados por entonces.
A principios de año el INE publicó los datos actualizados a 1 de enero de 2021, que también se recogen en el repositorio y en el archivo de datos.
Para respetar la serie completa, se incluyen para todos los días disponibles la incidencia normalizada con los datos de ambos años, tal y como se indica en la tabla de la sección anterior.
Este cambio se produjo a partir del 9 de mayo de 2021, por lo que los commits anteriores no incluyen los datos actualizados.
Licencia
Los datos originales han sido publicados por la Junta de Extremadura y el Instituto Nacional de Estadística.
El trabajo posterior realizado sobre ellos queda en el dominio público.