Construyendo un Sistema de Business Intelligence con datos estructurados y no estructurados

Hadoop y KettleUno de los puntos que han cambiado la forma en que se hace y hará Business Intelligence es la eclosión de una gran cantidad de datos que anteriormente no se analizaban. Ahora es posible combinar y analizar de forma conjunta, tanto datos estructurados (relacionales, legacy, dbcolumn, etc...) con no estructurados (Hadoop, MapReduce, NoSQL), permitiendo alcanzar cantidades enormes de datos.

Pentaho Data Integration 4 Cookbook: Reseñas

Luego de un par de semanas de lectura y prueba, he concluido la lectura de Pentaho Data Integration 4 Cookbook, a continuación las reseñas:

1) Reseña general: este nuevo libro de Maria Carina Roldan se compone básicamente de muchas recetas que resuelven todo tipo de problemas con los que nos podemos (y de hecho es así) encontrar en situaciones reales. El libro agrupa las recetas por temáticas, brinda ejemplos muy ingeniosos y cuenta con explicaciones muy sencillas, pero de gran calibre..

Leyendo Pentaho Data Integration 4 Cookbook

Buenas.

Hace unos días he recibido el libro Pentaho Data Integration 4 Cookbook, gracias a Richard Dias (Packt Publishing) y a Maria Carina Roldan (co-autora).

  Imagen eliminada.     Según cuenta Maria Carina en su blog, "...Es un libro para leerlo mientras se va aprendiendo con la computadora. El Cookbook es un libro de consulta para tenerlo a mano siempre que estamos desarrollando. En algún momento tenemos una duda (cómo hago para adjuntar este archivo?, cómo paso datos de una transformación a otra?, etc.). Y ahí está el libro, siempre con una receta lista para ayudarnos a resolver esa duda o problema...".       Así que en las próximas semanas estaré probando las recetas con mi propia cuchara (spoon) y ya les contaré más.   Saludos.

Pentaho 3.2 Data Integration: Beginner's Guide (fin de lectura)

Estimados,

luego de un tiempo considerable he finalizado la lectura de  "Pentaho 3.2 Data Integration: Beginner's Guide" escrito por María Carina Roldán.

En pocas palabras, un muy buen libro!

La cantidad de ejemplos, sobre todo de procesos no triviales y poco utilizados, hacen de este libro una opción inteligente a la hora de aprender sobre PDI e integración de datos.

Uno de los capítulos que más ha llamado la atención es el dedicado a Javascript embebido.

También podrán leer sobre como armar datamarts mediante la utilización de los pasos necesarios y su configuración.

No intento hacer un resumen del libro ni mucho menos, pero considero que su lectura es fundamental para aquellos que se inician con PDI e integración de datos y muy recomendable para aquellos que ya lo conocen y quieren profundizar.

Saludos

Mariano García Mattío

Ejemplo Kettle para conectarnos a Sap (con el plugin ProERPConn)

Ejemplo Kettle para conectarnos a Sap (con el plugin ProERPConn)En una entrada anterior del blog vimos que con Talend nos podiamos conectar a Sap sin necesidad de comprar ningún plugin o complemento adicional en la versión Open Studio. Tan solo habia que disponer del conector Java sapjco.jar, que Sap ofrece libremente a sus clientes, y utilizar los componentes de Talend tSapInput y tSapOutput. La comunicación con Sap era en ambas direcciones, permitiendo tanto la lectura como la escritura en el través de los módulos de función (las llamadas RFC). Ademas, en las versiones de pago de Talend, hay funciones adicionales que incluyen asistentes, la lectura directa del metadata de Sap (diccionario de datos, módulos de función y bapis, recuperación de la documentación de las RFC y su test online) y por tanto, una mayor facilidad de uso, ya que en la versión Open es muy dificil de configurar el componente y la documentación al respecto brilla por su ausencia...