5.4.4 Definición del Movimiento y Transformación de Datos
5.4.4 Definición del Movimiento y Transformación de Datos alfonsocutro 27 Enero, 2010 - 13:20En esta sección, se definirá el modo en que el centro de depósito de datos debe mover y transformar datos para darles el formato adecuado al depósito de datos. En primer lugar, se definirá un proceso que contenga una serie de pasos que permitan la transformación y movimiento de los mismos. A continuación, se especificarán las tablas fuente que deben transformarse para el depósito. Finalmente, se definirán los pasos de transformación de datos de la siguiente manera:
• Se seleccionan los datos fuente que se unirán a las tablas a través de sentencias de SQL. Específicamente, se definirá el proceso llamado Introducir datos en el DW, que realiza lo siguiente:
— Se seleccionan los datos de la tabla USP_T105NUEVA y se los transfiere a sus respectivas tablas de destino, logrando el llenado total de las tablas.
Definición de un Proceso
Para la definicíon del ob jeto del proceso se debe realizar lo siguente:
• Desde la ventana del centro de depósito de datos, se expande el árbol Áreas temáticas .
• Se selecciona el Área temática Armando el DW de la EPH, que se ha definido con anterioridad.
• Se efectúa una pulsación con el botón derecho del ratón en la carpeta Procesos y luego se pulsa Definir.
• Se abrirá el cuaderno Definir proceso :
— Nombre: se escribe el nombre del proceso: Introducir datos en el DW. El mismo puede tener un máximo de 80 caracteres de longitud y es sensible a mayúsculas y minúsculas. El primer carácter del nombre debe ser alfanumérico. No puede utilizar un & como primer carácter. Este campo es obligatorio.
— Administrador: se escribe un nombre de contacto para la definición del proceso.
— Descripción: se escribe la descripción del proceso: este es un proceso que permitirá transportar los datos desde unas entidades fuentes a las entidades depósitos de datos (ver fig. 5.32).
Luego se deberá pulsar la pestaña Seguridad.
En la lista Grupos de seguridad disponibles, se selecciona el Grupo de depósito de la guía de aprendizaje pulsando el botón >.
El Grupo de depósito de la guía de aprendizaje se visualiza en el panel de Grupos de seguridad seleccionados. Pulsando el botón Bien.
Se cerrará el cuaderno definir proceso.
Apertura del proceso
Se abrirá el proceso de modo que se pueda definir gráficamente el flujo de datos del mismo.
Figura 5.32: Visualización de las propiedades del cuaderno definir proceso.
Para abrir el proceso en este caso, se debe Introducir datos en el DW :
• Efectuar una pulsación con el botón derecho del ratón en el proceso Introducir datos en el DW.
• Pulsar el botón Abrir, y se abrira el Modelador de proceso (ver fig. 5.33).
Adición de Tablas a un Proceso
Para definir el flujo de datos, es necesario unir cada fuente, transformadas previamente, con las tablas de destino resultantes..
En el proceso Introducir datos en el DW, se cargarán los datos de la Encuesta Permanente de Hogares EPH, precisamente del primer trimestre del 2005, por lo que es necesario unir la tabla fuente USP_T105NUEVA con las tablas de destinos (Asalariados, Independientes, Individuo,Nivel _ educativo, Ocupación _ principal, Pob_con_Plan_Jefes_y_Jefas, Pob_Desocupada, Pob _Desocupada_con_empleo_Anterior, Pob_Ocupado).
Figura 5.33: Visualización del Modelador de Proceso.
Figura 5.34: Visualización del icono añadir datos.
La tabla USP_T105NUEVA forma parte de la fuente de depósito, que se ha definido en el apartado Definición de una Fuente de Depósito Relacional y las definiciónes de las tablas destino de depósito en el apartado Definición de un Destino de Depósito.
Para añadir una tabla fuente al proceso se debe realizar lo siguiente:
• Pulsar el icono Añadir datos (ver fig. 5.34).
• Pulsar sobre la cuadrícula en el punto donde se desea colocar la tabla. Se abrirá la ventana Añadir datos.
• En la lista Tablas fuente y destino disponibles, expandir el árbol Fuentes de depósito. Se visualizará una lista de las Fuentes de depósito definidas en el depósito (ver fig. 5.35).
Figura 5.35: Visualizacion de las Tablas fuente disponibles y seleccionadas.
• Expandir el árbol para la fuente de depósito Fuente de Deposito Relacional de la EPH.
• Seleccionar la tabla USP_T105NUEVA.
• Pulsar el botón > para añadir la tabla USP_T105NUEVA a la lista Tablas fuente y destino seleccionadas.
Para añadir la tabla de destino:
• Pulsar el icono Añadir datos (ver fig. 5.34):
• Pulsar sobre la cuadrícula en el punto donde se desea colocar la tabla. Se abrirá la ventana Añadir datos.
• En la lista Tablas fuente y destino disponibles, expandir el árbol Destinos de depósito. Se visualizará una lista de los destinos de depósito definidos en el depósito.
• Desplegar el árbol de destino de depósito Destino de Encuesta Permanente de Hogares.
• Desplegar el árbol Tablas. Deberá verse en la lista tablas de fuente y de destino disponibles :
— Asalariados
— Independientes
— Individuo
— Nivel _ educativo
— Ocupación _ principal
— Pob_con_Plan_Jefes_y_Jefas
— Pob_Desocupada
— Pob_Desocupada_con_empleo_Anterior
— Pob_Ocupado
Ver fig. 5.36
Figura 5.36: Visualización de las tablas de Destino de Depósito.
• Seleccionar la tabla de destino Nivel _ educativo.
• Pulsar > para añadir la tabla de destino Nivel _ educativo a la lista Tablas fuente y destino seleccionadas.
Adición de Pasos al Proceso
Ahora, es necesario añadir los pasos que definen cómo deben transformarse los datos fuente (Fuente de Destino) en datos de destino (Destino de Depósito).
En el siguiente apartado, se definirán los pasos SQL Select e Insert que permitirán la tranformacion de datos.
Definición del paso intro de datos a nivel_educativo :
• Desde la paleta, pulsar el icono SQL (ver fig. 5.37).
Figura 5.37: Visualización del icono introducir SQL.
• Pulsar en el punto de la cuadrícula donde desee colocar el Paso. Se añadirá a la ventana un ícono para el Paso.
• Hacer clic con el botón derecho del ratón sobre el ícono Paso, creado previamente.
• Pulsar el botón Propiedades, de esta menera se abrirá el cuaderno Paso (ver fig. 5.38). Luego completar los siguientes datos:
— Nombre: nombre del paso: intro de datos a nivel_educativo.
— Administrador: nombre de contacto para el paso.
— Descripción: breve información indicando lo que realiza dicho paso.
• Luego pulsar el botón Bien. Se cerrará el cuaderno Paso.
Figura 5.38: Visualización de las propiedades del paso intro de datos a nivel_educativo.
Figura 5.39: Visualización del icono Flujo de Datos.
• Pulsar el ícono Herramientas de enlace (ver fig. 5.39).
• Luego pulsar el ícono Enlace de datos, (ver fig. ??).
Figura 5.40: Visualización del icono Enlaces de datos.
• Pulsar en el medio de la tabla fuente de USP_T105NUEVA y arrastrar el ratón hasta el medio del paso intro de datos a nivel_educativo. El centro de depósito de datos traza una línea que indica que la tabla fuente de USP_T105NUEVA contiene los datos fuente para el paso.
• Pulsar en el medio del paso intro de datos a nivel_educativo hasta la tabla destino de depósito NIVEL_EDUCATIVO.
Una vez enlazada una tabla de destino con el paso, el centro de depósito de datos traza una línea que indica que los resultados de la consulta del paso se alojarán en la tabla de destino de depósito (ver fig. 5.41).
• Pulsar con el botón derecho del ratón en el paso intro de datos a nivel_educativo.
• Pulsar la opción Propiedades y se abrirá el cuaderno Paso.
• Luego pulsar la pestaña Sentencia de SQL .
• Pulsar Crear SQL para que el Centro de depósito de datos genere automáticamente el código SQL correspondiente (de lo contrario, se podrá escribir la sentencia directamente).
• Se abrirá el Asistente de SQL.
• Se seleccionará la pestaña Tablas, se debe verificar si la tabla USP_T105NUEVA está seleccionada.
Figura 5.41: Visualizacion del esquema del paso, Introducir datos en el DW.
Figura 5.42: Selección de las columnas que deben unirse en la sentencia de SQL.
• Pulsar la pestaña Columnas (ver fig. 5.42).
• Pulsar el botón >> para añadir todas las columnas de la tabla USP_T105NUEVA.
• Luego seleccionar la pestaña Revisar, de esta manera se podrá visualizar la consulta SQL (ver fig.5,43).
Figura 5.43: Visualización de la sentencia de SQL, con los campos antes seleccionados.
• Al pulsar el botón Bien, se cerrará el Asistente SQL.
• Seleccionar la pestaña Correlación de columnas, verificando si las columnas fuente se correlacionan con las columnas de destino correctas (ver fig. 5.44).
• Luego se debe precionar el botón Acciones y la opción correlacionar todos por posición. De esta forma se podrá correlacionar las columnas de ambas tablas (ver fig. 5.45).
• Seleccionar la pestaña Opciones de Proceso y luego en Agregar en la opción Tipo de llenado.
• Para finalizar se debe seleccionar el botón Bien.
Figura 5.44: Visualización de las columnas fuente que se debe correlacionar con las columnas de destino.
Figura 5.45: Visualización de la acción correlación por posición.
Prueba de los pasos
En este apartado se ejecutará el paso intro de datos a nivel_educativo de manera que se pueda comprobar la correcta definición de los procedimientos realizados anteriormente.
Para promocionar el paso intro de datos a nivel_educativo :
• Desde la ventana Modelo de proceso correspondiente al proceso Introducir datos en el DW efectuar una pulsación con el botón derecho sobre el paso intro de datos a nivel_educativo.
• Pulsar en la opción Modalidad y luego en Prueba (ver fig. 5.46).
Figura 5.46: Visualización del cambio de Modalidad Desarrollo a la de Producción.
Una ventana de confirmación le solicitará si desea guardar el proceso.
• Pulsar Sí o de lo contrario guardar los cambios pulsando en el ícono con forma de diskette de la barra de herramientras (ver fig. 5.47)
Figura 5.47: Visualización del icono Diskette.
Figura 5.48: Visualizacion del Modelador de Proceso, que se encuentra bloqueado.
Luego se iniciará el centro de depósito de datos para crear la tabla de destino mostrando una ventana de progreso. Antes de iniciar el procedimiento siguiente, esperar a que el centro de depósito de datos finalice el proceso, esto puede tomar varios minutos. Una vez que el centro de depósito de datos finaliza, se visualiza un candado de seguridad indicando que no se podrán realizar modificaciones en el futuro (ver fig. 5.48).
• Luego se debe selecionar la opción Prueba.
El centro de depósito de datos muestra una ventana de progreso una vez que finalizado.
• Pulsar con el botón derecho del ratón y esco jer la opción muestreo de contenido en la tabla destino de depósito NIVEL_EDUCATIVO (ver fig. 5.49).
Figura 5.49: Visualización del contenido de la tabla destino de depósito NIVEL_EDUCATIVO.