Herramientas para Open Data

Herramientas para Open Data

Ayer tuve la oportunidad de asistir a una charla de Marc Torres (del Institut Cartogràfic i Geològic de Catalunya) en el que hizo un pequeño taller explicando algunas fuentes de datos y sobre todo herramientas para tratarlos.

Los que me conocéis un poco sabéis que me encanta jugar con APIs y por tanto con datos, y esta charla era un lugar plerfecto para aprender de alguna herramienta que desconociera; obviamente el objetivo estuvo más que superado.

Para comenzar, voy a dejar una serie de sitios desde los cuáles conseguir extraer datos abiertos. Algunos son conocidos y otros no tanto:

Aunque hay cientos de lugares en España (y el resto del mundo) de donde sacar datos, estas fueron las fuentes que usamos en el taller, y la verdad es que hay información muy interesante sobre nuestro entorno y que permiten hacer muchísimas cosas.

Pero quizá lo más interesante para mi (y seuramente para vosotros) son algunas de las herramientas que se trataon y explicaron. Voy a intentar hacer un pequeño resumen de ellas:

  • Tabula is a tool for liberating data tables locked inside PDF files.
    Como bien dice su explicación, esta herramienta lo que permite es subir un fichero PDF, seleccionar un contenido o zona y te lo convierte a datos estructurados (más o menos es 100% fiable, pero depende del PDF).
  • OpenRefine (formerly Google Refine) is a powerful tool for working with messy data: cleaning it; transforming it from one format into another; and extending it with web services and external data.
    Esta herramienta, que como se indica anteriormente era un producto Google, permite subit datos estructurados y filtrarlos y generar un subset más refinado de elementos. Creo que se va a convertir en una de mis herramientas de referencia a partir de ahora.
  • InstaMaps, fes un mapa amb les teves dades fàcilment.
    Con esta herramienta se pueden crear mapas usando como fuente datos abiertos (entre otras cosas). Es una herramienta similar a Google MyMaps o a BatchGeo.
  • import.io: Extract data from almost any website
    Esta herramienta ya la conocía, me parece útil pero creo que sólo para cosas pequeñas, porque si necesitas hacer algo grande se queda corta (la parte gratis, y la de pago me parece cara).
  • Overview Search, visualize, and review your documents. Up to hundreds of thousands of them, in any format.
    Esta es seguramente la herramienta que menos utilizaría, pero es muy interesante para extraer datos de documentos, ya sean metadatos como un extracto de conceptos y temas en los que se hablan en él.
  • vizydrop Data visualization software
    me parece una herramienta increíble para generar gráficos a partir de datos estructurados. Incluso se hizo un ejemplo de datos geográficos que acabana haciendo una especie de mapa virtual de la ciudad de barcelona en los que añadiendo volúmenes en los pntos generaba un para interactivo muy interesante.

Y para acabar, como bonus track del que seguro que con tiempo saco muchas herramientas interesantes, es el Keshif (Data made explorable), una galería de herramientas y datos que te pueden ayudar a encontrar lo que necesitas para visualizar tus datos de la mejor forma. Hay centenares de herramientas y te puedes perder horas viendo ejemplos y galerías.

Deja un comentario