Introducción a Hadoop y reflexión sobre lo que implica a nivel tecnológico y analítico trabajar con Big Data y datos distribuidos. Presentación de MapReduce, de herramientas del entorno BigData Open Source y de los paquetes necesarios para trabajar con Hadoop desde R, así como la ejecución algoritmos distribuídos para la ejecución en paralelo sobre diferentes máquinas.
Por Santiago Basaldúa, doctor en Informática y Estadístico. PhD Senior Data Scientist en Sinergic Partners.