Buenos días:
Soy nueva en esto de la BI y estoy buscando información relevante para realizar mi proyecto final de carrera.
Me gustaría, por favor, que me ayudarais para saber donde puedo encontrar más información sobre el Staging Area y el ODS. ¿Durante el Staging Area se realiza limpieza a los datos o se elimina algún tipo de datos (como datos erróneos o duplicados)? ¿Cómo mantiene el ODS la información referente a los cambios?
También he estado intentando encontrar información sobre diferentes tipos de datamarts. La clasificación más extendendida que he encontrado ha sido la de datamarts dependientas e independientes. Leí algo, no encontré mucho, sobre datamarts olap y oltp. ¿Cuando es preferible usar cada tipo de datamart?
Un saludo y gracias!
- Inicie sesión para enviar comentarios
Te hago algunas
Subido por Dataprix el 30 Abril, 2010 - 19:37
Te hago algunas recomendaciones de lo que puedes encontrar en Dataprix sobre los temas que comentas:
Sobre lo que preguntas, en la Staging Area se suelen cargar los datos que se necesitan tal como vienen del sistema origen. La limpieza de datos, deduplicación y transformaciones se suelen realizar en la etapa siguiente, en el paso de la Stage al ODS y/o al Almacén Corporativo.
Datamarts OLTP? Seguro? Los Datamarts están orientados al análisis, y suelen apoyarse en estructuras OLAP (OnLine Analytical Processing).
OLTP (OnLine Transaction Processing) son las estructuras transaccionales de base de datos, las que se utilizan para crear los informes operacionales de toda la vida.
Muchas gracias por tu
Subido por SugarFree (no verificado) el 3 May, 2010 - 17:09
En respuesta a Te hago algunas por Dataprix
Muchas gracias por tu respuesta! Estoy leyendo tus enlaces aunque algunos ya los había leído con anterioridad.
En cuanto a lo que comentaba de los datamarts olap y oltp:
"Datamart OLTP
Pueden basarse en un simple extracto del datawarehouse, no obstante, lo común es introducir mejoras en su rendimiento (las agregaciones y los filtrados suelen ser las operaciones más usuales) aprovechando las características particulares de cada área de la empresa. Las estructuras más comunes en este sentido son las tablas report, que vienen a ser fact-tables reducidas (que agregan las dimensiones oportunas), y las vistas materializadas, que se construyen con la misma estructura que las anteriores, pero con el objetivo de explotar la reescritura de queries (aunque sólo es posibles en algunos SGBD avanzados, como Oracle).
Los datamarts que están dotados con estas estructuras óptimas de análisis presentan las siguientes ventajas:
Poco volumen de datos
Mayor rapidez de consulta
Consultas SQL y/o MDX sencillas
Validación directa de la información
Facilidad para la historización de los datos"
(Fuente: http://www.sinnexus.com/business_intelligence/datamart.aspx)
¿Sería esto un datamart dependiente?
Sinceramente, es la primera
Subido por Carlos el 3 May, 2010 - 18:40
En respuesta a Muchas gracias por tu por SugarFree (no verificado)
Sinceramente, es la primera vez que tengo noticias de esta definición, pero yo sigo sin verle la transaccionalidad a este tipo de Datamart para llamarle OLTP. A lo mejor la 'T' en este caso significa otra cosa, habría que preguntar a Sinnexus.
Estoy de acuerdo contigo en que parecen referirse más bien a un Datamart dependiente, pero no sé porqué le llaman OLTP.
Si alguien sabe algo más que nos lo cuente..