Reseña sobre economía de las nubes

Taxonomia Cloud computing“Economía de las Nubes” es una publicación con estructura de manual donde su autor, Matt Mayevsky, nos da la oportunidad de elevarnos entre las nubes y vivir entre conocimientos e información acerca de su computación. El libro consigue abarcar ampliamente este concepto que puede parecer complejo para transformarlo de una forma sintética en una herramienta útil para el usuario individual como para el empresarial..

Nuevo blog para seguir el proceso de creación de CentOS-7

CentOSDesde hace unas semanas y después del anuncio por parte de Red Hat de la disponibilidad de la Beta de la versión 7 de su sistema operativo, ha salido a la luz un nuevo blog. El blog en cuestión es seven.centos.org y en él podéis encontrar todas las noticias e informes relacionados con la construcción de CentOS-7 

Introducción a Apache Spark

Hoy vamos a hacer una introducción a Apache Spark, el nuevo motor del Big Data, se trata de un framework de computación paralela enfocando especialmente hacia la ciencia de datos.

Hay que destacar que Spark lleva incluidas librerías específicas para tratar datos estructurados (SparkSQL), integración con lenguaje R (Spark R), capacidades para el streaming de datos (Spark Streaming), machine learning (MLib) y computación sobre grafos (GraphX).

Esta primera introducción es una guía para su instalación, conceptos, estructura y el primer contacto que tendremos será la implementación de un Clúster Standalone con PySpark, las aplicaciones se ejecutan como un grupo independiente de procesos en el Cluster, dirigido por el programa principal.

 

 

 

Sorteamos 10 eBooks de Economía de las nubes

Cloud computingTan sencillo como subir una fotografía a flickr, acceder al gmail para leer nuestro correo o subir un fichero a dropbox para compartir. Si, así de sencillo va a ser participar en el nuevo sorteo de dataprix.

Un simple comentario y podrás ganar uno de los 10 eBooks que sorteamos este mes de diciembre...

Integración de Pentaho con MongoDB

Pentaho ofrece soporte para una gran variedad de bases de datos NoSQL diseñadas para trabajar con un gran volumen de datos. Estas bases de datos se están convirtiendo en una tecnología fundamental en el mundo del BigData. Ofreciendo una velocidad y escalabilidad mayor que en las bases de datos estructuradas.

Pero cual deberíamos elegir para nuestros proyectos?

Por este motivo queremos testear diferentes tecnologías, ver su integración con otras herramientas,  y analizar su rendimiento. Podeis seguir las diferentes comparativas desde nuestro blog https://www.jortilles.com/blog/

En este artículo empezamos Mongodb, desde su instalación, los primeros pasos, comandos.. hasta su integración con Pentaho para realizar un informe. A continuación podeis descargaros la guía en pdf

¿Por qué crear mi blog en Dataprix si ya tengo mi propio blog?

Escribir en un blogEn esta ocasión quiero comentar a nuestros usuarios bloggers las ventajas de participar en los blogs de Dataprix, aunque sea compaginándolo con la escritura en vuestro blog personal. 

Dataprix ofrece grandes ventajas a quien publique contenidos en el portal. La visibilidad, el prestigio de colaborar en un sitio de referencia hace muy interesante abrir un blog y publicar en Dataprix.

Las soluciones Cloud Sage One y Sage Murano ERP Online

Importancia de las nuevas tecnologias en la empresaLa eficiencia, la sencillez, la fiabilidad y la seguridad son las claves que aseguran la buena implementación de las nuevas tecnologías. Sage ha presentado sus soluciones en Cloud Computing Sage One y Sage Murano ERP Online durante el último “Sage Tech Event″, en el que se han mostrado los resultados de un gran esfuerzo de investigación y desarrollo..

Cómo medir y optimizar los procesos críticos de nuestra web

Optimizar procesos de negocioOptimizar los procesos de negocio que se ejecutan en el canal online es una de las vías para lograr la rentabilidad que todo empresario busca al invertir su tiempo y dinero. En función del tipo de negocio que sea (publicación de contenidos, tienda online, escaparate de servicios, etc.), el sistema que lo soporta integra unos procesos en los que intervienen los usuarios del sitio y cuyos resultados se pueden medir y observar..

 

SQL Server 2014 DQS (Data Quality Services)

Microsoft SQL Server Data Quality ServicesMicrosoft Sql Server Data Quality Services (DQS) es una herramienta, cliente-servidor, que se introdujo en Sql Server 2012 y que permite permite velar por la integridad de los datos basada en unos datos previos, la base de datos de conocimiento, que usamos para validar otros datos posteriores. Esta herramienta permite incluso limpiar datos entrantes en paquetes de SSIS. Su propósito es conseguir datos de calidad, construyendo primero una fuente de conocimiento sobre la calidad objetivo de nuestros datos, creando dominios (valores de referencia para asignar validez o no) y reglas para definir actuaciones..