Soy el fundador de Dataprix, y doy la bienvenida a todos los visitantes del portal, y os animo a registraros y participar.

A nivel profesional soy Ingeniero Informático, con muchos años de experiencia en entornos de bases de datos y Business Intelligence, y bastantes kilómetros hechos ya con herramientas como Cognos, MicroStrategy, SQL Server Integration Services, PowerBI o Tableau.

Últimamente experimentando con Python.

e-mail de contacto
carlos.fernandez@dataprix.com

Miembro desde hace

18 años 8 meses

Publicaciones

  • Open Data en el Web Congress de Barcelona

    Open Data en Web Congress BarcelonaEn el Web Congress de Barcelona, asistí a una mesa redonda sobre Open Data en la que Martín Alvarez Espinar, responsable de la Oficina Española de W3C, y Jordi Graells i Costa, coordinador de contenidos e innovación de la Generalitat de Catalunya, explicaron en qué consiste la iniciativa internacional Open Data, y cómo se está materializando en proyectos concretos en algunas comunidades de España, como Asturias y Catalunya.

    En DataprixTV hemos publicado dos videos de CTIC que resumen muy bien lo que es Open Data. El primero explica eso mismo, en qué consiste Open Data, y el segundo muestra un ejemplo de aplicación de Open Data y Linked Data en una aplicación web que permite visualizar online estadísticas INE sobre equipamiento y uso de las TIC y el comercio electrónico en hogares y empresas asturianas.

  • BI Beers BCN sigue creciendo

    Logotipo de BI BeersEl jueves celebramos finalmente otro BI Beers Barcelona, y volvimos a batir record de asistencia, y eso que a última hora tuvimos algunas bajas, que espero que puedan venir al siguiente. En total fuimos 13 o 14, no lo puedo asegurar porque estaba demasiado oscuro ;).

    Aparte de los ya habituales Pau, Xavi, Mara, Enric, Frederic, David... llegaron nuevas incorporaciones de Clearpeaks, Houndline y Solindata, que enriquecieron la conversación aportando su punto de vista basado en su experiencia con herramientas Oracle, Microstrategy, y también Informatica, que hasta ahora habían tenido poca representación en nuestro evento.

  • RHIPE: Utilizar Hadoop para analizar grandes cantidades de datos con R

     

    Video Link

    Hadoop es el proyecto de Apache que proporciona un entorno que soporta la gestión de grandes cantidades de datos. Este tipo de sistemas se suelen utilizar para soportar la gran cantidad de información que generan las grandes redes sociales, sobretodo cuando las bases de datos relacionales comienzan a presentar problemas de escalabilidad, o el coste del crecimiento es demasiado elevado.

    Una buena aplicación de Hadoop la encontramos en el proyecto RHIPE, una interfaz entre Hadoop y R, la herramienta open source de procesamiento estadístico, que permite utilizar Hadoop para soportar de manera eficiente sobre grandes cantidades de datos los análisis estadísticos que se pueden realizar con R..

  • Información sobre ODS (Operational Data Store)

    Aprovechando una consulta que he recibido, abro este tema para recopilar información y recursos sobre las estructuras llamadas ODS (Operational Data Store) de los Data Warehouse. Es cierto que no se habla mucho sobre los mismos, y ni siquiera hay una definición única que explique qué es lo que abarcan, ya que dependiendo del autor la consideración de lo que es el ODS puede diferir bastante.

    Detallo algunos enlaces para saber algo más sobre los ODS:

  • Algunos enlaces interesantes para desarrolladores

    Destaco algunos artículos que han ido apareciendo últimamente IBM developerWorks sobre migraciones entre bases de datos, y que me parecen especialmente útiles. Obviamente, las migraciones son siempre hacia bases de datos DB2 o Informix, pero tanto las descripciones de arquitecturas y características como las metodologías propuestas pueden resultar muy útiles para una gran variedad de situaciones y tecnologías.

  • Los sistemas de Backup Data Domain de EMC baten nuevos records de rendimiento

    EMC presentó los avances de backup basado en disco más significativos en la historia de la empresa. Estos nuevos productos, mejoras del sistema, iniciativas de integración y avances en rendimiento, modifican sustancialmente el panorama existente para backup y recuperación. El nuevo EMC Data Domain ®Global Deduplication Array (GDA) incorpora dos de los nuevos controladores EMC Data Domain DD890, que convierten GDA en el sistema de almacenamiento con deduplicación más rápido del mundo.

    EMC también anunció que GDA ahora proporciona soporte para la opción de software EMC Data Domain Virtual Tape Library, que amplía aún más la cantidad de aplicaciones de backup compatibles, entre ellas, IBM Tivoli Storage Manager (TSM)...