Open Data no es, en absoluto, algo nuevo. Este movimiento fomenta la apertura de datos de diversa índole para su posterior utilización de manera libre. Ya en 2010 conseguía uno de sus primeros hitos con la liberación de una licencia para la libre utilización de datos del Archivo Nacional del Reino Unido. Esta misma web, en 2011, dedicaba un interesante artículo explicando en qué consiste Open Data y se citaba una lista de sitios con recursos abiertos.
Para el Data Scientist o científico de datos actual la liberación de datos supone un pilar fundamental de su trabajo y una fuente inagotable de la que obtener información.
Ejemplo de utilización de datos abiertos
Una de las grandes entidades que abre sus datos es el NOAA (National Oceanic and Atmospheric Administration) de EEUU. Si echamos un vistazo a su web de datos abiertos, podemos visualizar y descargar colecciones de los más diversos datos meteorológicos imaginables: desde recuento de especímenes de peces detectados a informes de salud del coral en EEUU, pasando por datos de la temperatura de la superfície del agua.
Como muestra os dejamos este informe, elaborado con R y publicado en Rpub's para un curso virtual de Data Science, que analiza los datos de desastres meteorológicos sucedidos en Estados Unidos entre los años 1950 y 2011, para obtener un informe sobre el tipo de evento que ha causado más fallecidos, el que ha causado más heridos y el que causado mayores impactos económicos.
Presentamos el resultado de los eventos que han causado mayor número de muertes, que según nuestro estudio fueron el calor, los tornados y las inundaciones, en ese orden.
En segundo lugar echamos un vistazo a los eventos que han causado más heridos. Los resultados son muy similares a los anteriores, pero con el tornado como causa más importante, seguido del calor y las inundaciones.
Y para acabar con el ejemplo también mostramos el análisis del impacto económico por causas climatológicas y meteorológicas.
En él se señalan las inundaciones y huracanes como los eventos más dañinos económicamente hablando. Surgen, no obstante, las marejadas como tercer evento con mayor impacto económico.
Así, con un poco de imaginación y las herramientas adecuadas, podemos obtener interesantes informes derivados de la apertura de datos.
Recursos Open Data
Para ayudaros a crear vuestros propios estudios queremos compartir con vosotros nuestra lista de portales Open Data preferidos. Para empezar, una pequeña lista de organismos públicos.
Fuente | Qué ofrece | URL |
---|---|---|
CIS (Centro de Investigaciones Sociológicas) | Acceso a los resultados de encuestas de tendencias políticas, de confianza del consumidor y de opinión de los ciudadanos, entre otros. Ficheros disponibles para descarga con datos desde 1998. | https://www.analisis.cis.es/cisdb.jsp |
Gobierno de España | Datos oficiales de diversos ministerios (ingresos medios, informes de pensiones, datos demográficos y evolución de los mismos...) | https://datos.gob.es/ |
Generalitat de Catalunya | Datos oficiales de la Generalitat de Catalunya (Indicadores de salud, contrataciones y licitaciones, presupuestos...) | https://dadesobertes.gencat.cat/es/ |
Comunidad Autónoma de Euskadi | Acceso a los datos públicos del Gobierno Vasco en formato reutilizable. Ofrecen concursos de ideas de utilización de datos abiertos y de creación de aplicaciones móviles que los usen | https://opendata.euskadi.eus/w79-home/es/ |
Gobierno de los Estados Unidos | Plataforma con datos abiertos de una de las mayores potencias económicas (Listado de ayudas a emprendeduría, datos climáticos, sanitarios...) | https://www.data.gov/ |
Unión Europea | Datos macroecónomicos de la Unión Europea, informes sobre condiciones laborales, producción industrial... | https://open-data.europa.eu/en/data/ |
Y para finalizar listamos algunos recursos más, desde agregadores web hasta relacionados con las redes sociales
Fuente | Qué ofrece | URL |
---|---|---|
Organización Mundial de la Salud | Datos de esperanza de vida, indicadores sobre la salud física y mental, cambio climático, a nivel mundial | https://www.who.int/gho/es/ |
Directorio de datos públicos de Google, con los datos más populares destacados | https://www.google.com/publicdata/directory | |
Arizona State University | Colección de datos sobre bloggers y blogs, redes sociales como Delicious, Twitter o Youtube | https://socialcomputing.asu.edu/pages/datasets |
StatSilk | Mapa mundial interactivo de datos abiertos | https://www.statsilk.com/maps/world-stats-open-data |
Esperamos que os sirvan de ayuda estos recursos que se citan y que nos ayudéis a ampliar la lista con nuevas y curiosas entradas.
Descargad datos, usadlos, reutilizadlos, todo gracias al Open Data.