Video del Taller de Big Data, con Cassandra, Spark, Hadoop y R, uno más de los Talleres de OpenAnalytics, celebrado junto a Melialab Prado y la colaboración del Ayuntamiento de Madrid.
En este taller de Big Data se presentan estas tres charlas:
Modelado de series temporales con Cassandra
Modelado de series temporales. Motivos por los cuales Cassandra es la mejor elección para este tipo de aplicación y su uso en Smart cities. Introducción al datamining sobre Cassandra.
Por José Hernández, miembro de Isthari, primer partner en España de Cassandra.
Introducción a Spark y RDD
Spark es un motor para el procesamiento en memoria de grandes volúmenes de datos distribuídos, y que ha surgido para facilitar el paradigma MapReduce gracias a los RDDs, buscando solucionar algunos de los problemas de rendimiento que presentaba Hadoop en sus inicios.
Por Francisco Javier Pulido, de ExploraData
Introducción a Hadoop y MapReduce
La charla introduce Hadoop y las implicaciones que tiene trabajar con datos que ya no son locales tanto desde el punto de vista tecnológico como analítico. Se presentan los paquetes disponibles para manejar Hadoop desde R y se explica el paradigma MapReduce, y cómo pueden distribuirse los diferentes algoritmos para que se ejecuten sobre muchas máquinas en paralelo.
Por Santiago Basaldúa, PhD Senior Data Scientist en Sinergic Partners. Doctor en informática y estadístico.