Consideraciones procesos ETL en entornos Big Data: Caso Hadoop

Procesos de ETLEn el presente post pretendemos mostrar la problemática que con frecuencia encontramos en los procesos de extracción, validación y carga de datos en los entornos Big Data. Un proceso ETL tradicional, extrae datos desde múltiples fuentes origen, después los valida, normaliza, realiza determinadas transformaciones y vuelca los mismos en un entorno datawarehouse para su posterior análisis. Cuando en los datos fuentes, tenemos volúmenes altos, una frecuencia de actualización alta en origen o bien son datos no estructurados, estos procesos ETL suelen tener problemas.. 

Superar el reto de la Tecnología Actual. El sector en la actualidad

CTO de SageEl mercado actual vive un cambio de lo antiguo a lo nuevo. Por un lado, tenemos empresas actuales que operan con soluciones instaladas. Sus soluciones han de modernizarse para que puedan aprovechar las ventajas que ofrecen las nuevas tecnologías, y garantizar, a su vez, que mantienen las cualidades que resultaron atractivas para el cliente en primer lugar..

Por Klaus-Michael Vogelberg, Group Chief Technology Officer de Sage

Y los ganadores de los 3 ejemplares del libro "Big Data Analytics with R and Hadoop" son...

Sorteo de ebooks de DataprixTenemos el placer de anunciar que acabamos de realizar el sorteo de 3 eBooks de Big Data Analytics with R and Hadoop en la web de sorteos 'sortea2', y de entre los 8 participantes que han aportado con un usuario registrado sus comentarios sobre el interés que para ellos tiene el libro, los 3 ganadores son...

SQL Server: Auditoría de datos personalizada mediante triggers

 Los triggers o desencadenadores son disparadores que saltan cuando realizamos la acción o evento al que van asociados. En MS SQL Server, además de los triggers clásicos relacionados con acciones DML (insert, update, delete) que se ejecutan en su lugar (instead of) y después (after triggers), desde SQL Server 2008 (por lo menos) existe otro tipo que son los triggers asociados a acciones que se producen por consultas DDL. Este segundo tipo de trigger está más pensado para labores administrativas como la propia auditoria, para el control de cierto tipo de operaciones e incluso evitar esos cambios.

Primeros pasos como administrador de SQL Server sobre un entorno heredado

Por el motivo que sea, un día puede que cambiamos de trabajo o de funciones dentro de nuestra empresa y de repente heredemos un entorno de base de datos Microsoft SQL Server con un servidor o clúster de bases de datos para que nos encarguemos de él. Antes de empezar a cambiar cosas, es totalmente necesario conocer el uso que se hace de la base de datos, la criticidad de las aplicaciones que la usan, las dependencias entre ellas etc... A continuación una lista de las primeras cuatro tareas que podríamos llevar a cabo para empezar a hacerlo nuestro.

¿Cómo se pueden beneficiar los directores financieros de los sistemas ERP?

Elección de ERP

Los directores financieros (CFOs) están cada vez más solicitados para involucrarse en más proyectos diversos dentro de sus organizaciones y para contribuir al crecimiento estratégico con sus habilidades y experiencia. Sin embargo, esto supone un reto importante para los responsables de finanzas, que necesitan utilizar todas las herramientas a su disposición para tomar decisiones sólidas basadas en evidencias cuantitativas.

SQL Server: Cómo saber cuándo se han borrado datos y recuperarlos usando el registro de transacciones

Estructura de backupEn el post anterior explicaba como examinar el registro de transacciones de una base de datos para ver poder ver el detalle de los cambios realizados en la misma, ya sean consultas DML como DDL. En este post se explica como usar la misma herramienta en otro caso práctico para poder detectar en que momento se han borrado unos datos y como recuperarlos haciendo una restauración point-in_time de la base de datos para poder copiarlos de nuevo.