Taller sobre Big Data en OpenAnalytics

Resource type

Manual

Video del Taller de Big Data, con Cassandra, Spark, Hadoop y R, uno más de los Talleres de OpenAnalytics, celebrado junto a Melialab Prado y la colaboración del Ayuntamiento de Madrid.

En este taller de Big Data se presentan estas tres charlas:

Modelado de series temporales con Cassandra

Modelado de series temporales. Motivos por los cuales Cassandra es la mejor elección para este tipo de aplicación y su uso en Smart cities. Introducción al datamining sobre Cassandra.

Por José Hernández, miembro de Isthari, primer partner en España de Cassandra.

Introducción a Spark y RDD

Spark es un motor para el procesamiento en memoria de grandes volúmenes de datos distribuídos, y que ha surgido para facilitar el paradigma MapReduce gracias a los RDDs, buscando solucionar algunos de los problemas de rendimiento que presentaba Hadoop en sus inicios.

Por Francisco Javier Pulido, de ExploraData

Introducción a Hadoop y MapReduce

La charla introduce Hadoop y las implicaciones que tiene trabajar con datos que ya no son locales tanto desde el punto de vista tecnológico como analítico. Se presentan los paquetes disponibles para manejar Hadoop desde R y se explica el paradigma MapReduce, y cómo pueden distribuirse los diferentes algoritmos para que se ejecuten sobre muchas máquinas en paralelo.

Por Santiago Basaldúa, PhD Senior Data Scientist en Sinergic Partners. Doctor en informática y estadístico.

Prueba Semrush gratis 14 días!