Eventos vs batch: los fundamentos de la integración de datos que deciden el futuro de tu arquitectura
La integración de datos es la fontanería invisible sobre la que se sostiene toda la arquitectura: sin ella, el data lake del capítulo 8, los pipelines de los próximos capítulos y los dashboards de la Parte IV son cajas vacías. La decisión más importante no es qué herramienta comprar, sino cuándo mover los datos: en tiempo real, evento a evento, o agrupados en lotes a intervalos fijos.
Este capítulo desgrana las cuatro piezas fundamentales —eventos, mensajería, colas y Change Data Capture (CDC)— y ofrece criterios de consultoría para no caer en el error más caro de todos: aplicar streaming a problemas que el batch resolvía a una décima parte del coste, o forzar el batch donde el negocio exige inmediatez.

Looker, la herramienta principal de Business Intelligence de Google, integra una capa semántica flexible basada en LookML para modelar datos directamente en la base de datos. Permite la conexión a múltiples orígenes, facilitando la elaboración de dashboards interactivos y reportes personalizados. Además, optimiza la gobernanza y consistencia de métricas, promoviendo análisis colaborativos y de autoservicio en tiempo real..
