Estimados, mi duda es simple y se que muchos podrán responderla. El tema es el siguiente. Tengo una dimensión en el cual se cargarán datos desde el origen OLTP. El tema es que desde el OLTP vienen dos columnas: el id y la descripción. He aquí el problema ya que la estructura es la siguiente:
id descripcion
1 descrip1
2 descrip1
3 descrip1
4 descrip2
5 descrip2
6 descrip3
7 descrip4
Mi duda es de que manera manejo los datos en la dimensión, si las descripciones se repiten 'N' veces, algunas son idénticas a las otras con distinto id, o también se diferencian por mayúsculas o acentos.
Quedo atengo a sus aportes.
Gracias.
- Inicie sesión para enviar comentarios
Una sola pregunta: las
Subido por BertBrijs (no verificado) el 20 Agosto, 2013 - 18:20
BertBrijs agradezco tu
Subido por cgmuros el 21 Agosto, 2013 - 18:30
Hola, puedes hablar con los
Subido por cmateos el 30 Agosto, 2013 - 08:46
En respuesta a BertBrijs agradezco tu por cgmuros
Hola, puedes hablar con los propietarios (de IT y de negocio) de la información para unifiquen la información en origen que siempre es más limpio que hacerlo en el DW.
Si no es posible, siempre puedes generar un nivel superior en la dimensión con una descripción unificada que sea única para todos los registros.
Esto te permite asociar cada hecho a su valor válido de la dimensión en cada momento manteniendo la misma información que la fuente y, explotando la información por este nuevo campo, hace que los usuarios sólo vean una descripción. No modificas la información de origen por lo que en cualquier momento puedes trazarla y justificarla.