Desde hace tiempo venimos comentando que Google no quiere dejar ningún 'palo suelto' en su estrategia acaparadora. Y, como no, parece que Google se acerca el mundo analítico, del Business Intelligence, etc... y la buena noticia es que se acerca a través del mundo Open Source, que se deriva de la compra que hicieron hace un tiempo de Metaweb. Esta herramienta va muy en la linea de la política de fuentes abiertas por parte de Administraciones Públicas y Medios de Comunicación del que ya hemos hablado varias veces. aquí, aquí y aquí.
Esto tiene un nombre: Google Refine
Realmente se trata de una herramienta para la limpieza y organización de datos no estructurados, algo mucho más común de lo que uno podría pensarse en nuestras organizaciones.
Además, estos datos de partida podrán ser modificados a otros formatos y mejorados con la inclusión de nueva información proveniente de diferentes bases de datos.
La aplicación se ejecuta en el desktop, aunque (como todas las herramientas de Google) se acceda a través de un browser.
Se trata de una herramienta que ya puede irse empezando a usar en entornos empresariales, que conforme vaya mejorando el interfaz irá siendo más potente.
A continuación, os ponemos unos videos que muestran lo siguiente:
1. Introducción (identificando problemas de valores con cero, diferencias en valores, aplicar ciertas reglas para agrupar valores similares, etc...)
2. Transformación de datos (separar filas, identificar campos en negrita, extraer valores a otras columnas...)
3. Data Augmentation (Llamar a web services para añadir geolocalización a las direcciones, hacer joins con datos de fuentes externas, etc...)
The project is open source and its code and downloads are available here. Changes from version 1.1 to 2.0 are listed here.