PDI.4
Primeros pasos con Pentaho Data Integration 4
Pentaho continua su andadura para ser una excelente solución de Business Intelligence !!!
De entre las novedades que incorpora Data Integration (a.k.a. Kettle) en su versión 4 sin duda la mas significativa es el Agile BI.
Pero vamos por partes.
Como era de esperar, Matt Casters (y todo el equipo que hay alrededor de Kettle) ha hecho un excelente trabajo.
- Han resuelto muchos bugs
- Han realizado muchas mejoras
- Han añadido muchas novedades
Todas las mejoras y novedades se pueden resumir en una: Mejorar la experiencia de usuario. Hacer de Kettle una herramienta mas amigable y fácil de usar si cabe.
Vemos varias mejoras visuales como los diálogos contextuales que te proponen todas las opciones para cada paso:
También es interesante la gestión de los errores propuesta.
Y los nuevos iconos e información visual:
Pero sin duda los cambios mas significativos son los referentes al Agile BI. Y que es el Agile BI? Pues no es nada mas (y nada menos) que realizar todo el trabajo de diseño desde kettle. Para que usar el Schema Workbench para crear nuestros cubos y el Metadata Editor para crear nuestro sistema de metadata si, una vez tenemos los datos, lo que queda por hacer es muy automatizable? Si ya tenemos los datos no podemos empezar a visualizar como quedan?
Pues precisamente de eso se trata. Vamos a verlo siguiendo el getting_started_with_pdi ejemplo que viene con la documentación
Tras instalar instalar la versión Comunity de Data integration nos damos cuenta de que tenemos todas las novedades excepto el Agile BI.
Está disponible para la versión comunity pero como un plugin extra a instalar.
Cito:
The Modeling and Visualization perspective plugin for Pentaho Data Integration (Kettle) is available for download here:
ftp://download.pentaho.org/client/agile-bi/pmv-1.0.0-stable.zip
To install - unzip the file into the data-integration/plugins/spoon directory. It will create a folder in there named agile-bi. Start spoon and the new capabilities will automatically be available.
Why the separate download?
Pentaho Analyzer (formerly LucidEra ClearView) is used for OLAP analysis and is not open source. Pentaho has decided to make the functionality available to the Kettle community without charge for use within spoon.
For more information go to:
https://wiki.pentaho.com/display/AGILEBI/Agile+BI+Kettle+4.0+Plugin+-+R…
Tras descargar el plugin y descomprimirlo en data-integration/plugins/spoon ya podemos volver a arrancar Kettle y tener todas las funcionalidades disponibles. De entre las cuales, destacan a primera vista, las 3 vistas posibles.
Nuestra primera transformación con Data Integration 4 será leer de un archivo y volcar a tabla. Es aqui donde empezamos a notar los cambios visuales comentados:
Pero lo realmente nuevo viene ahora. Si nos ponemos sobre la salida a tabla y sacamos el menú contextual (click con el botón derecho del ratón) nos aparecen, entre otros, la posibilidad de crear un modelo de metadatos o, directamente visualizar el resultado en una vista de Pentaho Analyzer o un informe. ¡El sólo crea el modelo de metadatos y el cubo OLAP!
Y ya puedes realizar tu vista OLAP basada en el modelo de metadatos propuesto!
Como si estuvieras utilizando el Pentaho Analyzer.
Y todo esto basado en un modelo de metadatos que puedes modificar a tu antojo y publicar para ver via web.
Como he dicho al principio. Pentaho se está convirtiendo en una gran solución de BI Enterprise.
Sobre Stratebi
Stratebi es una empresa española, radicada en Madrid y oficinas en Barcelona, creada por un grupo de profesionales con amplia experiencia en sistemas de información, soluciones tecnológicas y procesos relacionados con soluciones de Open Source y de inteligencia de Negocio.
Esta experiencia, adquirida durante la participación en proyectos estratégicos en compañías de reconocido prestigio a nivel internacional, se ha puesto a disposición de nuestros clientes a través de Stratebi.
En Stratebi nos planteamos como objetivo dotar a las compañías e instituciones, de herramientas escalables y adaptadas a sus necesidades, que conformen una estrategia Business Intelligence capaz
de rentabilizar la información disponible. Para ello, nos basamos en el desarrollo de soluciones de Inteligencia de Negocio, mediante tecnología Open Source.