Hola, estoy haciendo un DW para un area de Diagnostico por imagenes donde en la Base de datos se registra el turno del paciente, cuando fue llamado por el medico, cuando demoro el medico, donde se atendio, etc......la duda que se me presenta es que me pidieron que la actualización de la información en el dw se realice cada 6 horas, como para conocer la info de la mañana a la tarde .....
Se puede hacer asi? o es demasiado poco tiempo?.....cuales son los tiempos recomendados de carga?
Muchas Gracias!!! :)
saludos,
Julio
- Inicie sesión para enviar comentarios
Más que de tiempo recomendado
Subido por Carlos el 23 Junio, 2012 - 11:33
Más que de tiempo recomendado tendríamos que hablar de tiempo disponible, que depende de factores como la complejidad de la carga, el volumen de datos y la disponibilidad o la carga de los sistemas implicados. También deberías tener en cuenta si hay algún momento en que no hay muchos cambios en los sistemas origen, parar poder capturar 'fotos' lo más consistentes posibles.
Para mi lo más habitual es lanzar las cargas por la noche, o los fines de semana para que haya el mínimo de interferencia con los sistemas de origen, y para que los usuarios puedan trabajar durante todo el día con los datos hasta el día anterior, pero todo depende de las necesidades del usuario.
Piensa también en el crecimiento de tu Data Warehouse, a medida que se vaya haciendo más grande los tiempos de carga van a ir aumentando, y te podrías llegar a 'comer' el tiempo disponible. Y por último recuerda que según cómo hagas la ETL, mientras estás cargando las tablas, los informes pueden no estar disponibles. Una práctica recomendable, pero no imprescindible, es programar las cargas del DWH para cuando los usuarios no están trabajando.
Si el usuario lo necesita, puedes recargar cada seis horas, o cada menos si hace falta, pero has de tener siempre en cuenta todos estos factores a la hora de calcular la 'ventana' disponible.
Por si no te lo has planteado, otra opción es cargar una parte del DWH en procesos nocturnos, y sólo la información que necesita más refresco en períodos más cortos, como las seis horas que propones.