6.2.4 Generación de los Modelos (1/8)
6.2.4 Generación de los Modelos (1/8) alfonsocutro 9 Febrero, 2010 - 13:50En esta sección se plasmarán todos los objetivos específicos, para su posterior extracción de información.
Describir la Composición del Empleo en la Ciudad de Corrientes
Para esta problemática puntual se utilizará un software de índole netamente estadístico: Infostat , este permite realizar análisis de variables con múltiples funcionalidades adicionales. Esta herramienta permitirá obtener resultados, en los cuales se podrá visualizar cuáles son los perfiles de esta población.
Visualizando la fig. 6.15, se puede comprobar el elevado número de empleos que depende del Gobierno de la Provincia.
Figura 6.15: Visualización del grafico de frecuencias, de la composición del empleo de Corrientes.
De la fig. 6.15 se pueden extraer los siguientes datos:
- Administración pública, defensa y seguridad social obligatoria: 16%.
- Enseñanza: 13 %.
- Servicios de esparcimiento y servicios culturales y deportivos: 4 %.
- Construcción: 8 %.
- Servicios de hogares privados que contratan servicio doméstico: 13 %.
- Servicios sociales y de salud: 10 %.
- Comercio al por mayor, en comisión y al por menor, excepto vehículos automotores y motocicletas: 16 %.
- Servicios de hotelería y restaurantes: 2 %.
- Intermediación financiera y otros servicios financieros: 1 %.
- Servicios empresariales N.C.P.: 5 %.
- Industria manufacturera INDEC: 2 %.
- Comercio al por mayor y al por menor, reparación vehículos automotores, motocicletas, efectos personales y enseres domésticos: 2 %.
- Servicios de correos y telecomunicaciones: 1 %.
- Servicios N.C.P.: 2 %.
- Servicios de transporte, de almacenamiento y de comunicaciones: 3 %.
- Servicios anexo al transporte; servicios de agencias de viaje: 1 %.
- Servicios inmobiliarios, empresariales y de alquiler: 1%.
Este gráfico permite sacar conclusiones, no solamente observando las frecuencias de los correspondientes rubros.
Conocer los Perfiles Socio Demográficos de los Planes Jefes y Jefas
Luego de obtener una visión general de las actividades económicas de la población en el punto anterior, se puede seguir con la investigación.
Es indispensable saber que hasta el momento no se han utilizado herramientas de extracción de conocimiento en bases de datos, KDD (Knowledge Discovery in Databases).
Lo que se realizará aquí es una descripción de perfiles de los individuos, en este caso los que posean planes asistenciales. Todo esto aplicando la técnica de Clustering Demográfico con el IBM DB2 Intelligent Miner for Data V8.1.
A partir de esta etapa se comienza a trabajar con Intelligent Miner for Data e Intelligent Miner Visualizer, el primero para el análisis en sí y el segundo para visualizar los resultados.
Para comprender la creación y utilización de los diferentes objetos de formulación es conveniente profundizar en primer lugar, con los conceptos claves que se explican en los Capítulos No4 “Introducción a Intelligent Miner for Data”.
Básicamente, los pasos a llevar a cabo son:
- Creación de los Objetos de Datos (datos de entrada).
- Transformación de los datos aplicando funciones (Discretización, Correspondencia de valores, Correspondencia de nombres).
- Creación de la Base de Minería PERSONAS.
- Creación de Objetos Adicionales.
Creación de los Objetos de Datos (Datos de Entrada) Una vez ingresado al servidor Intelligent Miner, es necesario configurar correctamente la conexión al mismo (ver fig. 6.16).
Ya configuradas las opciones de conexión, queda indicarle al servidor cuáles serán los datos de entrada. Para ello se tendrá que presionar la opción crear Datos, inmediatamente aparecerá el asistente que guiará con las opciones correspondientes (ver fig. 6.17).
El asistente orientará a lo largo de los siguientes pasos:
- Selección del tipo de datos para la definición de los datos de entrada o de los datos de salida.
- Selección de los nombres de las tablas de base de datos, vistas o archivos planos.
- Especificación de parámetros para los datos de entrada o salida.
- Especificación del nombre de los datos de entrada o salida.
Una vez seleccionado el formato y el nombre de la entrada de datos (ver fig.6.18).
Figura 6.16: Para acceder al Intelligent Miner, deberá ingresar (Servidor, ID de Usuario y Contraseña).
Figura 6.17: Iniciación del asistente de datos, este nos orientará a lo largo de todo esate paso.
Figura 6.18: En la definición de los datos, escogemos el formato de vista/tabla de base de datos.
El siguiente paso es de seleccionar el servidor de base de datos, con su correspondiente Tabla asociada, en este caso será la USP_T107 (Base usuaria Persona del primer trimestres del 2007) (ver fig. 6.19).
Como se podrá observar en la fig. 6.20, dentro de los parámetros de campo se encuentran:
- Nombre de campo en la Base de Datos en DB2.
- Tipo de datos del campo en la Base de Datos en DB2.
- Tipo de dato del campo en Intelligent Miner for Data (permite modificar).
- Correspondencia de nombres (permite aplicar una determinada correspondencia para un campo específico).
En el gráfico anterior se pueden visualizar los diferentes parámetros de campos (Nombre de campo, Tipo de datos y Correspondencia de nombres).
Figura 6.19: Selección del servidor, esquema, tablas/vistas de base de datos.
Figura 6.20: Selección o modificación de los parámetros de los campos.
Para finalizar, queda la etiqueta de “Campos calculados” (ver fig. 6.21). Estos son campos adicionales que contienen información resultante, ya sea mediante una:
- Discretización .
- Correspondencia de Valores .
- Correspondencia de Nombres .
- Función .
Los mismos son calculados por el Intelligent Miner for Data durante una ejecución de minería y serán profundizados más adelante.
Figura 6.21: Selección de una tecnica de campo calculado (Discretización, Función, Etc.).
Transformación de los Datos Aplicando Funciones En este apartado se crearán diferentes funciones con el fin de relacionarlos con los Datos de entrada correspondientes.
Correspondencia de Nombres Estos objetos convierten los valores una vez finalizada la ejecución de Minería de Datos, con lo cual es el Visualizador de Resultados el que muestra los valores convertidos.
Se utilizan para dar nombres más descriptivos a valores de campos, son especialmente útiles cuando se trata de campos que contienen códigos numéricos.
Por ejemplo: El campo ESTADO (Condición de Actividad) donde:
- 0 = Entrevista individual no realizada.
- 1 = Patrón.
- 2 = Cuenta propia.
- 3 = Obrero/Empleado.
- 4 = Trabajador familiar sin remuneración.
- 9 = Ns. /Nr.
Las correspondencia de nombres que se crean son:
- Analfabetismo: para el campo elemento de 1, el valor es “Si sabe leer y escribir”, para el campo elemento de 2, es “No” y para el campo elemento de 3, es “Menor de 2 años”.
- Asist. Educativa: para el campo elemento de 1, el valor es “Si, asiste a algún establecimiento educativo (colegio, escuela, universidad)”, para el campo elemento de 2, es “No asiste , pero asistió” y para el campo elemento de 3, es “Nunca asistió”.
- Categoría de Inactividad: para el campo elemento de 1, el valor es “Jubilado/Pensionado”, para el campo elemento de 2, el valor es “Rentista”, para el campo elemento de 3, el valor es “Estudiante”, para el campo elemento de 4, el valor es “Ama de casa”, para el campo elemento de 5, el valor es “Menor de 6 años”, para el campo elemento de 6, el valor es “Discapacitado” y el 7, para el valor “Otros”.
- Categoría Ocupacional: para el campo elemento de 1, el valor es “Patrón”, para el campo elemento de 2, el valor es “Cuenta propia”, para el campo elemento de 3, el valor es “Obrero o empleado”, para el campo elemento de 4, el valor es “Trabajador familiar sin remuneración” y para el campo elemento de 9, el valor “Ns./Nr.”
- Cobertura Médica: para el campo elemento de 1, el valor es “Obra social (incluye PAMI)”, para el campo elemento de 2, el valor es “Mutual /Prepaga/Servicio de emergencia”, para el campo elemento de 3, el valor es “Planes y seguros públicos”, para el campo elemento de 4, el valor es “No paga ni le descuentan” , para el campo elemento de 9, el valor "Ns./Nr." , para el campo elemento de 12, el valor es "Obra social y Mutual /Prepaga/Servicio de emergencia”, para el campo elemento de 13, el valor es “Obra social y Planes y Seguros Públicos”, para el campo elemento de 23, el valor es “Mutual /Prepaga/Servicio de emergencia/Planes y Seguros Públicos”, para 123, el valor es “Obra social, Mutual /Prepaga/Servicio de emergencia y Planes y Seguros Públicos”.
- Condición de Actividad: para el campo elemento de 0, el valor es “Entrevista individual no realizada”, para el campo elemento de 1, el valor es “Ocupado”, para el campo elemento de 2, el valor es “Desocupado”, para el campo elemento de 3, el valor es “Inactivo” y para el campo elemento de 4, el valor “Trabajador familiar sin remuneración” y para el 9 , el valor “Ns./Nr.”.
- Estado Civil: para el campo elemento de 1, el valor es “Unido”, para el campo elemento de 2, es “Casado” y para el campo elemento de 3, es “Separado/a o divorciado/a”, para el campo elemento de 4, es “Viudo/a” y el campo elemento de 5 , es “Soltero/a”.
- Nivel Educativo: para el campo elemento de 1, el valor es “Primaria Incompleta (incluye educación especial)”, para el campo elemento de 2, el valor es “Primaria Completa”, para el campo elemento de 3, el valor es “Secundaria Incompleta”, para el campo elemento de 4, el valor es “Secundaria Completa”, para el campo elemento de 5, el valor “Superior Universitaria Incompleta”, para el campo elemento de 6, el valor es “Superior Universitaria Completa”, para el campo elemento de 7, el valor es “Sin Instrucción” y para el campo elemento de 9 , el valor es “Ns./Nr.”.
- Sexo: para el campo elemento de 1, el valor es “Varón” y para el 2, es “Mujer”.
- Región: para el campo elemento de 01, el valor es “GBA”, para el campo elemento de 40, es “Noroeste”, para el campo elemento de 41, es “Nordeste”, para campo elemento de 43, es “Pampeana” y para campo elemento 44, es “Patagonia”. A las variables de entrada se las relaciona con el campo que corresponda en la pestaña Parámetros de campo, columna Correspondencia de Nombres, en el Objeto de Datos (ver fig. 6.22).
A las variables de entrada se las relaciona con el campo que corresponda en la pestaña Parámetros de campo, columna Correspondencia de Nombres, en el Objeto de Datos (ver fig. 6.22).
Figura 6.22: Selección de correspondencia de nombres, en la pestaña parámetros de campo.
6.2.4 Generación de los Modelos (2/8)
6.2.4 Generación de los Modelos (2/8) alfonsocutro 10 Febrero, 2010 - 12:22Creación de la Base de Minería Al finalizar los anteriores pasos, sedeben crear los Objetos de Minería , que no son más que funciones analíticasaplicadas a los datos.
Estos objetos generan Objetos de Resultados , que se pueden ver y analizarcon las herramientas de visualización incorporadas a Intelligent Miner Visualizer.Los resultados se analizan en páginas posteriores, aquí simplemente sedescriben los Objetos de Minería que se crean.
Considerando el análisis de carácter exploratorio que se desea realizar, seutiliza la Función de Clustering Demográfico.
Los objetos que se generan son:
- PJ1_1=1 and Aglomerado =12.
Clustering de los Perfiles de los Planes Jefes y Jefas de la Prov. de Ctes.
- personas EPH.
Contiene información de la tabla de personas de la tabla USB_T105 condatos, de la Base de Datos personas.
- Datos de la EPH, con Ctes.
Contiene información de las variables a trabajar, como así como tambiénde Ctes.
- Estudio de la Var CAES con respecto de la Población del NEA.
Contiene información de la población del NEA.
Los mismos se pueden visualizar, cuando se presiona Base de minería, Abrirbase de minería como se puede ver en la siguente fig. 6.23.
Figura 6.23: Visualización de las distintas bases de minería creadas en elIntelligent Miner.
Una vez seleccionada la base de minería a utilizar, se debe crear la funciónde minería propiamente dicha. Para ello se deben realizar los siguientes pasos:
- Selección de una Función de Minería.
- Selección de los Datos de Entrada.
- Especificación de Parámetros.
- Especificación de los Campos de Salida.
- Especificación del nombre de Datos de Salida.
- Especificación del nombre de Resultado.
Selección de una Función de Minería Para seleccionar una Funciónde Minería, se debe escoger una de ellas en la listas de Función de Minería disponibles.
Las funciones de minería disponibles, como se puede ver en la fig. 6.24, son las siguientes:
- Asociación.
- Clasificación - Árbol.
- Clasificación - Neuronal.
- Clustering - Demográfico.
- Clustering - Neuronal.
- Patrones secuenciales.
- Predicción - Función base radial.
La que se utilizará con más frecuencia en este apartado es la de Clustering- Demográfico.
Figura 6.24: Selección de la función de minería, Clustering-Demográfico.
Selección de los Datos de Entrada Como se puede ver en la siguientefig. 6.25 el Intelligent Miner for Data, nos permite seleccionarlos Datos de entrada, ya sea mediante los Datos de entrada disponibles o casocontrario se pueden crear Datos de entrada, presionando el botón Crear datos.
Figura 6.25: Selección de los Datos de entrada, 1 Trimestre del 2007.
Una vez seleccionados estos, se deberá realizar las Especificaciones de los Parámetros.
Especificación de Parámetros En la sección de Parámetros de modalidad (ver fig. 6.26), se pueden realizar numerosas modificaciones comoser las Pasadas máximas. Estas maximizan el número de veces que la funciónse aplica sobre los datos de entrada.
En este caso de estudio, en las secciones Especificación de parámetros yEspecificación de los campos de salida, no se realizan modificaciones.
Campos de Entrada Los campos de entrada son campos de datos que unafunción de minería utiliza para su posterior procesamiento (ver la fig. 6.27).
Objetos de Resultados En este apartado se expondrán todos los resultadosque proporcione el Intelligent Miner Visualizer. Esta herramienta per mitirá visualizar, analizar y hasta explorar los resultados obtenidos en cada ejecución.
Figura 6.26: Especificación de los parámetros de modalidad.
Figura 6.27: Selección de los campos de entrada (Campos activos y Campos adicionales).
Al ejecutar la función de minería, como se puede ver en la fig. 6.28, el Intelligent Miner proveerá de la siguiente información: horade inicio, tiempo transcurrido, información de estado adicional y criterio decondorcet. Este último permitirá encontrar la optimización en la seleccion delos Cluster.
Figura 6.28: El criterio de condorcet es de 0.614 (donde aceptable es 0,65).
Como se puede observar en fig. 6.28 de la pág. 32, el criterio de Condorcettoma el valor 0.614. Esta información es suficiente para determinar que lasimilitud de los registros dentro de cada cluster es excelente dado que un valormínimo usual que se considera aceptable es 0,65.
Esto no implica que no se puede obtener mejores resultados seleccionandolas variables de entrada.
Al visualizar los objetos de resultados (ver fig. 6.29) se nota la existencia de 8 clusters identificados por la ejecución de minería. En cada clúster, los diagramas y gráficos de barras representan los campos activos y msuplementarios utilizados.
Los campos con mayor influencia en la formación del cluster se visualizan a la izquierda (CH15, CH09, CH04, CH07, CH03), mientras que los campos con menor influencia se visualiza a la derecha (PP04A, Ch08. etc.).
Figura 6.29: Intelligent Miner nos provee los resultados mediante Visualizador de clústeres.
La primera columna contiene el nombre y el ID del cluster, la siguiente representa el tamaño de cluster en porcentaje con respecto a la muestra; por ejemplo: el cluster superior representa un 61,67% de los datos, el siguiente un 20,68%, el siguiente un 11,01% y así sucesivamente.
En este caso prácticamente un 93,36% de la población está representada sólo por estos tres primeros clústeres, dividiéndose el 6,64% restante entre los demás.
Al contemplar la figura 6.30 de la pág. 34 se obtienen las siguientes conclusiones:
El primer grupo está represento por una población en su mayoría formada por mujeres, de 25 a 30 años de edad, que son residentes de Corrientes Capital y se encuentran unidas o juntadas con su cónjugue (ver fig. 6.31).
Con respecto a lo laboral, estás personas trabajan en hogares privados como servicio doméstico (ver fig. 6.32), donde no paga ni le descuentan mensualmente una cobertura médica como se puede ver fig. 6.33, tampoco tiene contrato de trabajo ni obra social y mucho menos descuento jubilatorio (ver fig. 6.34), respectivamente (ver fig.6.35).
El ingreso total individual predominantemente de estas personas esta en promedio entre los 100 a 200 pesos (ver fig. 6.36), y es de 0 pesos el ingreso proveniente de otras actividades (ver fig.6.72).
Figura 6.30: Visualización general del Clúster No1 de 61,67% de la población total.
Figura 6..31: Visualización de las variables CH04 (sexo), CH15 (¿Donde nacio?).
Figura 6.32: Visualización, del contenido de la variable PP04B_COD (Clasificación de Actividades Económicas para Encuestas Socioeconómicas CAES).
Figura 6.33: Muestreo del contenido de la variable CH08 (¿Tiene algún tipo de cibertura médica por la que paga o le descuentan?).
Figura 6.34: En el resultado de la variable PP07G4 (obra social) se puede observar que en su gran mayoría estas personas no la poseen.
Figura 6.35: Visualización del resultado de la variable PP07H (¿Por ese trabajo tiene descuento jubilatorio?).
Figura 6.36: El monto del ingreso total individual de estas personas esta entre los 100 a 200 pesos.
En la segunda agrupación, del 20,68% de la población total, se puede observar que el sexo predominantemente es el masculino (ver fig. 6.38).
Sin diferenciarse con el primer clúster, en este en su mayoría siguen siendo de esta localidad o sea Corrientes como se puede apreciar en la fig. 6.39, con un estado civil de viudo/a y con una edad sobresaliente de 46 años (ver fig. 6.40) , respectivamente (ver fig. 6.40).
En la categoría ocupacional el rubro predominante se lo puede visualizar en la fig. 6.41 como el rubro de “ obrero o emplea”.
La actividad económica que resulta ser predominante es la construcción (ver fig. 6.42).
En relación a lo laboral se puede decir que estas personas no poseen cobertura medica, obra social, ni tampoco aportes jubilatorios e incluso no realizanaportes por sí mismos, todo esto se pude comprobar en las siguientes figuras:
(ver fig. 6.43), (ver fig. 6.44), (ver fig. 6.45), respectivamente en la fig. 6.46.
Figura 6.37: Visualización, de la variable TOT_P12 (ing. de otras ocupaciones).
Figura 6.38: En el segundo clúster, del 20,68% de la población total se puede apreciar el sexo masculino como el predominante.
Figura 6.39: La opción “en esta localidad” de la variable CH15 (¿Dónde nació?) sigue siendo la predominante.
Figura 6.40: Visualización de la variable CH07 ( estado civil).
Figura 6.41: Visualización de las variables CAT_OCUP(categoría ocupacional).
Figura 6.42: La variable PP04B_COD (rubro de las actividades económicas para el MERCOSUR).
Figura 6.43: Visualización de la variables CH08 (cobertura medica).
Figura 6.44: Visualización del diagrama circular de la variable PP07G4 (obra social).
Figura 6.45: La opción “No tienen descuento jubilatorio” es la predominante en la variable PP07H (¿Por ese trabajo tiene descuento jubilatorio?).
Figura 6.46: Resultado en formato de diagrama circular de la variable PP07I (¿Aporta por sí mismo a algún sistema jubilatorio?).
El tipo de contrato, con la opción no le dan ni le entregan nada cuando el empleado recibe sus haberes es la opción más frecuente, como puede verse en la fig. 6.47.
6.2.4 Generación de los Modelos (3/8)
6.2.4 Generación de los Modelos (3/8) alfonsocutro 15 Febrero, 2010 - 12:53
Figura 6.47: Muestreo del diagrama circular de la variable PP07K.
El ingreso de la ocupación principal (P21) contiene al rango 0 al 50 pesoscomo el predominante en dicha variable (ver fig. 6.48).
El ingreso total individual (P47T), contienen la misma distribución de losingresos como puede verse en la fig. 6.49.
El monto de ingreso de otras ocupaciones (TOT_P12), resulta ser predominantemente0 pesos (ver fig. 6.50).
El tercer cluster es de 11,01 % de la población total, tiene como predominantea la mujer en la variable sexo, la misma es separada con una edad queronda los 40 a 45 años y ha nacido en otra provincia (ver fig. 6.51), (ver fig. 6.5), respectivamente (ver fig. 6.53).
La categoría ocupacional que sobresale es la de “obrero o empleado” conun rubro de actividad económica como la “servicios de hogares privados quecontratan servicio domestico” (ver fig. 6.65), (ver fig. 6.55).
También en este grupo el empleo en negro sigue siendo el predominante(ver fig. 6.56).
Lo mismo sucede con la variable PP07G4 (obra social) ya que estas personas no la poseen (ver fig.6.57).
Figura 6.48: Visualización de la variable P21 (Monto del ingreso de la ocupación principal).
Figura 6.49: Visualización de la variable P47T (Monto del ingreso total individual).
Figura 6.50: El contenido de la variable TOT_P12, demuestra el predominio 0 pesos.
Figura 6.51: El sexo femenino es el predominante en el Clúster No3 (11,01 de la población total).
Figura 6.52: En este diagrama circular se puede observar que el rango de edadcon mayor frecuencia es el [40-45].
Figura 6.53: Visualización de las siguientes variables: CH15 (¿Dondé nació?) y CH07 (Estado Civil).
Figura 6.54: Diagrama circular de la variable CAT_OCUP (categoría ocupacional).
Figura 6.55: Visualización del resultado en formato tabla de la variable PP04B_CDO (rubro de actividades económicas).
Figura 6.56: El tipo de contrato en negro, es el de mayor presencia en lavariable PP07K.
Tampoco cuentan con un descuento jubilatorio con puede verse en la fig.6.58.
Y mucho menos un aporte a algún sistema jubilatorio (ver fig. 6.59).
El nivel de analfabetismo también se lo tiene en cuenta para agrupar los distintos perfiles de los individuos. Éste está contemplado en la variable CH09(sabe leer y escribir), como se puede ver en la fig. 6.60.
El cuarto cluster también contiene un 2,09 % población total.
En esta agrupación el sexo predominante es el femenino, con unos 25 a 30 años de edad y con un estado civil de soltero/a (ver fig. 6.61), (ver fig. 6.62) y (ver fig. 6.63).
Además, éstas ha nacido en otra provincia como se puede ver en la fig.6.64.
En cuanto a lo laboral, esta persona tiene una categoría de ocupación de obrero o empleado como puede visualizarse en fig. 6.65 perteneciendoal rubro de actividades económicas de “Servicios de Asociaciones” (ver fig. 6.64).
El tipo de contrato de este trabajo, como se puede observar no varía con respecto a los anteriores clústeres, ya que sigue siendo predominante el trabajoen negro (ver fig. 6.67)social (ver fig.6.68).
Figura 6.57: Visualizacíon de la variable CH08 (obra social).
Figura 6.58: Muestreó de la variable PP07H (si tiene descuento jubilatorio).
Figura 6.59: El aporte individual a algún sistema jubilatorio es nulo.
Figura 6.60: Visualización de la variable CH09 (sabe leer y escribir).
Figura 6.61: El sexo femenino es el predominante en la cuarta agrupación(2,09 % de la población total).
Figura 6.62: Visualización de la variable CH06 (años de edad).
Figura 6.63: La opción “soltero / a” es la más frecuente en la variable CH07(estado civil).
Figura 6.64: Resultado en formato de diagrama circular de la variable CH15(¿Donde nació?).
Figura 6.65: Visualización de la variable CAT_OCUP (Categoría Ocupacional).
Figura 6.66: La categoría “servicios de hogares privados que contratan servicio domestico” es la opción con más frecuencia en la variable PP04B_COD.
6.2.4 Generación de los Modelos (4/8)
6.2.4 Generación de los Modelos (4/8) alfonsocutro 15 Febrero, 2010 - 13:14En cuanto a las condiciones laborales se puede decir que no tiene obra social (ver fig.6.68). Tampoco descuento jubilatorio como se puede apreciar en la fig. 6.69, no obstante esta persona aporta por sí mismo a un sistema jubilatorio (ver fig. 6.70).
El ingreso de la ocupación principal no supera los pesos 350 como se pueden observar en la fig. 6.71.
El monto de ingresos de otras ocupaciones, que incluye ocupación secundaria,ocupación previa a la semana de referencia, duedas / retroactivos porocupaciones anteriores al mes de referencia, etc., se puede ver en la fig. 6.72; teniendo luego al ingreso total individual que es la sumatoria de ingresos laborales y no laborales con un monto que varia de los 100 a los 200 pesos (ver fig. 6.73).
En el quinto cluster se puede observar que el perfil predominante es del sexo varón de unos 20 años de edad, con un estado civil de soltero, con un elevado grado de analfabetismo y ha nacido en Corrientes (ver fig. 6.74), (ver fig. 6.75), respectivamente (ver fig. 6.76)
Figura 6.68: También es el cuarto clúster la opción “no tiene obra social” esla que posee mayor frecuencia.
Figura 6.69: Podemos observar que no posee descuento jubilatorio.
Figura 6.70: Visualizacíon de la variable PP07I (aporta por sí mismo a un S.J.).
Figura 6.71: El ingreso de la ocupación principal de esta agrupación esta entre los 100 a 200 pesos.
Figura 6.72: El ingreso de otras ocupaciones no supera los 120 pesos en esta agrupación.
Figura 6.73: Visualización de la variable p47t (monto del ingreso total individual).
Figura 6.74: Las variables CH04 (sexo) y CH07 (estado civil).
Figura 6.75: En la variable CH06 (años) el rango de edad con mayor representación es el de [20-25].
Figura 6.76: Estos individuos han nacido en su mayoría en esta localidad, es decir en Corrientes (Capital).
También se observa posee una actividad económica que resulta ser predominantemente “servicios de esparcimiento y servicios culturales y deportivos” (ver fig. 6.77).
En el aspecto laboral se tiene que agregar que estas personas no cuentan con obra social, ni descuentos jubilatorios (ver fig. 6.78).
El trabajo en negro también está presente en esta agrupación como se puede ver en la fig. 6.79.
En cuanto a los ingresos, se puede observar que el monto de ingreso de la ocupación principal es de 0 pesos (ver fig. 6.80).
El monto de ingreso de otras ocupaciones es de 150 pesos y por ende el monto de ingreso total individual es un valor entre 100 y 200 pesos como se puede visualizar en las siguientes fig. 6.81 y la fig. 6.82.
En el sexto cluster (1,14% de la poblacíon total) se puede visualizar un predominio del sexo femenino con una edad de 49 años, un estado civil de separado / al y además la misma no ha nacido en otra provincia (ver fig. 6.83), (ver fig. 6.84), respectivamente (ver fig. 6.85).
La categoría ocupacional predominantemente es la de “cuenta propia” como se puede observar en la fig. 6.86 de la pág. 65, dedicándose al rubro de la construcción (ver fig. 6.87).
En el séptimo cluster (0,76 % de la población total) se podrá observar que el sexo predominante es el masculino, de estado civil separado y el mismo ha nacido en otra localidad de Corrientes (Capital)
todo esto se puede visualizar en las siguientes graficas: (ver fig. 6.88), (ver fig. 6.89), respectivamente (ver fig. 6.90).
Con respecto al perfil de estas personas se puede decir que poseen un nivel de analfabetismo elevado como se puede comprobar en la (ver fig. 6.91).
La variable CAT_OCUP (categoría ocupacional) no existe un predominio de alguna categoría como se puede observar en la fig. 6.92,dedicándose estos al rubro de la “construcción” y a el “servicios empresariales”
de (ver fig. 6.93).
En esas tareas o labores estás personas no poseen cobertura médica como se puede contemplar en la siguiente fig. 6.97. También cabe destacar que no tienen obra social y mucho menos descuento jubilatorio (ver fig. 6.93), (ver fig. 6.95).
Figura 6.77: La construcción tambíen en esta agrupacion es la predominante.
Figura 6.78: Visualización, de las variables PP07G4 (O. S.), PP07H (Desc.Jubilatorio).
Figura 6.79: Visualización, de la variable PP07K (tipo de contrato laboral).
Figura 6.80: Visualización del monto del ingreso de la ocupación pincipal.
Figura 6.81: Visualización del monto del ingreso de otras ocupaciónes.
Figura 6.82: Visualización del monto del ingreso de total individual.
Figura 6.83: Visualización de la variable CH04 (sexo).
Figura 6.84: Visualización de la variable CH07(estado civil).
Figura 6.85: La opción “En otra localidad” es la predominante en la variable CH15 (¿Dónde nació?).
Figura 6.86: En la variable CAT_OCUP (Categoría Ocupacional) se pueden observar a la opción con mayor representación “Cuenta propia”.
Figura 6.87: Visualización, de las variables PP04B_COD.
Figura 6.88: Visualización de la variable CH04 (sexo).
Figura 6.89: Visualización del diagrama circular de la variable CH07 (estado civil).
Figura 6.90: La opcíon “En otra localidad” es la que posee más frecuencia en la variable CH15(¿Dónde nacio?).
Figura 6.91: En la siguiente figura se puede comprobar el nivel de analfabetismo que poseen las personas de está agrupación.
Figura 6.92: La visualización de la variable CAT_OCUP (categoría ocupacional) nos permite conocer las diferentes categorias que son predominantes.
Figura 6.93: En el siguiente diagrama circular se puede contemplar a las opciones que contienen mayor frecuencia en la variable PP04B_COD.
Figura 6.94: Muestreo del resultado de la variable CH08 (cobertura médica).
Figura 6.95: Visualización del resultado de la variable PP07H (Descuento Jubilatorio).
6.2.4 Generación de los Modelos (5/8)
6.2.4 Generación de los Modelos (5/8) alfonsocutro 15 Febrero, 2010 - 13:33En el octavo y último cluster se puede contemplar que también posee un 0,76 % de la población total como lo demuestra la siguiente fig.6.96.
Figura 6.96: Vista general de la octava agrupación con un 0,76 % de la población total.
Indagar los Perfiles Educativos de los Planes Jefes y Jefas
En este punto se estudiarán las principales variables relacionadas a la educación de las personas que poseen planes jefes/jefas.
Básicamente, los pasos a llevar a cabo son similares al de Conocer los Perfiles Socio Demográficos de los Planes Jefes y Jefas, con la diferencia que en este se toman variables de educación en cambio de variables socio-demográficas (ver fig. 6.97).
Al ejecutar la función de minería, como se puede ver en la fig. 6.98, el Intelligent Miner proveerá en este caso un criterio de condorcet de 0,629 siendo que el aceptable es 0,65.
Al visualizar los objetos de resultados (ver fig. 6.99) se nota la exitencia de 8 clústers identificados por la ejecución de minería.
La primera columna contiene el nombre y el ID del cluster, la siguiente representa el tamaño de cluster en porcentaje con respecto a la muestra.
Figura 6.97: Selección de las variables de educación en los campos activos y campos adicionales.
Figura 6.98: El cuadro de progreso del Intelligent Miner proveerá la siguiente información (2 Pase: 8 Agrupaciones, Condorcet = 0,629).
Figura 6.99: Visualización de los diferentes clústers identificados por el Intelligent Miner.
En este caso prácticamente un 97,92% de la población está representada sólo por los primeros cuatro clústeres, dividiéndose el 2,08% restante entre los demás.
La primer agrupación de 73,06 % de la población total, en ella se puede visualizar que sexo femenido es el predominante con un rango de edad de [20-25] años y de estado civil unido o juntado (ver fig. 6.100), (ver fig. 6.101), respectivamente (ver fig. 6.102).
Respecto a la dimensión educativa se puede observar la variable CH09 (Analfabetismo) que asume el valor “sabe leer y escribir” (ver fig. 6.103).
El nivel educativo predominante de estas personas es de primaria completa como se puede visualizar en la fig. 6.104.
En la variable CH10 (Asiste o Asistió a algún establecimiento educativo) se puede ver la opción sobresaliente de “no asiste, pero asistió” (ver fig.105).
El nivel más alto que cursan o cursaron estas personas puede observarse en la fig. 6.106 que es el “nivel primario”. Como se puede observar en la fig. 6.107 se puede contemplar a un elevado número de personas que finalizaron dicho nivel.
Figura 6.100: Visualización de la variable CH04 (sexo).
Figura 6.101: Muestreo del contenido de la variable CH06 (años).
Figura 6.102: La opción “unido” es la predominante en la variable CH07 (Estado Civil).
Figura 6.103: Visualización de la variable CH09 (analfabetismo).
Figura 6.104: El nivel educativo predominante es “Primaria Completa”.
Figura 6.105: Visualización de la variable CH10 (asistencia a algun establecimiento educativo).
Figura 6.106: Visualización de la variable CH12 (¿Cuál es el nivel más alto que cursa o cursó?).
Figura 6.107: Visualización de la variable CH13 (si finalizo el nivel más alto alcanzado o cursado).
Y para finalizar con el análisis de este cluster se visualizará la variable H14 (¿Cuál fue el último año que aprobó?), donde se puede observar que el máximo año aprobado por estos individuos es el segundo año (ver fig. 6.108).
Figura 6.108: En la variable CH14 (¿Cual fue el último año que aprobó?), la opción predominante es “Segundo año”.
En el segundo cluster (20,68% de la población total) se puede visualizar que el sexo predominante es el varón con un estado civil de unido o juntado y con la edad que varia de los 30 a 35 años (ver fig. 6.109), (ver fig. 6.110).
En la fig.111 se puede observar que el índice de analfabetismotiene 3,67% “No sabe, leer y escribir ” y un 96,33% “Sabe, leer y escribir”. El nivel educativo que resulta ser predominante es “primaria completa” como se puede ver en la fig. 6.112.
El nivel más alto que cursaron estas personas es el “nivel primario” como se puede observar en la fig. 6.113. También se puede observar en la fig. 6.114 la existencia de un elevado número de personas que no han finalizado dicho nivel. Teniendo a la opción “segundo año” como la predominante de la variable CH14 (¿Cuál fue el último año que aprobó?) (ver fig. 6.115).
En el tercer cluster de 2,47 % de la población total se puede encontrar que la variable CH04 (sexo) posee a la sexo masculino como el predominante (ver fig. 6.116).
También se puede observar en la fig. 6.116 de la pág. 82 el resultado de la variable CH07 (estado civil).
En la fig. 6.117 se puede comprobar que la opcion “No asiste, pero asistió” es la predominante en la variable CH10 (¿Asiste o asistió a algún establecimiento educativo?).
Se puede apreciar en la fig. 6.118 que no todos los establecimientos educativos a los que estas personas recurren son “Públicos”, si no que también se puede apreciar la existencia de los “Privados”.
En la fig. 6.119 se puede observar que la variable asume lasopciones de nivel secundario como las del nivel universitario.
En la fig. 6.120 se puede apreciar la cantidad de personas que abandonaron estos niveles educativos.
Siendo el nivel educativo alcanzado por estas personas los de “Superior Universitario Incompleta” y “Secundaria Incompleta”, como se puede vizualizar en el fig. 6.121.
En el cuarto cluster 2,47 % de la población total se puede encontrar que el sexo predominante es el femenino con una distribución de la variable edad con las misma frecuencia para el rango [35-40] como para [50-55] y sucediendo lo mismo pero en este caso con la variable CH07 (estado civil) donde esta asume las opciones de “separado/a” y de “unido” (ver fig. 6.122), (ver fig.6.123), respectivamente (ver fig. 6.124) .
Figura 6.109: Visualización del segundo cluster (20,68 % de la población) donde el sexo predominante es el varón.
Figura 6.110: Visualización del segundo cluster (20,68 % de la población) con un estado civil de unido o juntado.
Figura 6.111: Muestreo del los ìndices de analfabetismo obtenidos de la variable CH09 (Analbafetismo).
Figura 6.112: El nivel educativo predominante es de “Primaria completa”.
Figura 6.113: El nivel más alto que cursaron estas personas fue el “NivelPrimario”.
Figura 6.114: Visualización de la variable CH13 (¿Finalizó ese nivel?).
Figura 6.115: El “segundo año” es la opción con más representación en la variable CH14 (¿Cuál fue el último año que aprobó?).
Figura 6.116: Visualización de las variables CH04 (sexo) y CH07 (estado civil).
Figura 6.117: Visualización de la variables CH10 (¿Asiste o asistió a algún establecimiento educativo?).
Figura 6.118: Visualización de la variable CH11 (Tipo de establecimiento educativo).
Figura 6.119: Muestreo de la variable CH12 (¿Cuál es el nivel más alto que cursa o cursó?).
Figura 6.120: Visualización de la variable CH13 (¿Finalizó ese nivel?).
Figura 6.121: El nivel educativo alcanzado por estos individuos es “secundaria incompleta”, “primaria completa” y “superior universitaria incompleta”.
Figura 6.122: Visualización de variable CH04 (sexo).
6.2.4 Generación de los Modelos (6/8)
6.2.4 Generación de los Modelos (6/8) alfonsocutro 22 Febrero, 2010 - 14:52Sobre su educación se puede observar en la fig. 6.125 que “no sabe leer, ni escribir” es la opción que predomina la variable CH09 (Analfabetismo).
En el quinto clúster de 0,76 % de la población total se puede encontrar que la variable CH04 (sexo) posee a la sexo femenino como el predominante (ver fig. 6.126).
También se puede observar en la siguiente fig. 6.127 que el estado civil que predomina en el quinto clúster es el “soltero/a”, con un rango de edad de [20-25] años como se puede visulizar en la siguiente fig. 6.128.
A diferencia del cuarto clúster (ver fig. 6.125) en esté la opción con mayor presencia en la variable CH09 (Analfabetismo) como se puede apreciar en el siguiente (ver fig. 6.129) es la de “sabe leer y escribir”.
En la fig. 6.130 se puede comprobar que la opcion “No asiste, pero asistió” es la predominante en la variable CH10 (¿Asiste o asistió a algún establecimiento educativo?).
El nivel educativo predominante en esté clúster como se puede apreciar en la siguiente fig. 6.129 es de “secundaria incompleta”.
Teniendo como nivel máximo cursado por estos individuos el nivel “secundario” como se puede visualizar en la siguiente fig. 6.129.
Por último se puede apreciar en la siguiente fig. 6.129 que la opción “primer” año es que posee mayor representación en la variable CH14 (¿Cuál fue el último año que aprobó?).
La sexta agrupación de 0,57 % de la población total, en ella se puede visualizar que sexo masculino es el predominante con un estado civil separado con los respectivos rangos de edades [45-50], [60-65] y [65-∞+] (ver fig. 6.1352), (ver fig. 6.136), respectivamente (ver fig. 6.137).
En cuanto a la formación educativa de estas personas se puede apreciar en la siguiente (ver fig. 6.138) que poseen un elevado índice de analfabetismo y un nivel educativo sin instrucción (ver fig. 6.139).
En la variable CH10 ¿Asiste o Asistió a algún establecimiento educativo? (colegio, escuela, universidad) se puede observar a la opción sobresaliente de “Nunca asistió” (ver fig. 6.140).
Figura 6.123: Muestreo del resultado de la variable CH06 (años).
Figura 6.124: Visualización del resultado obtenido de la variable CH07 (estado civil).
Figura 6.125: Muestreo del contenido de la variable CH09 (Analfabetismo).
Figura 6.126: El sexo femenino es el predominante en el quinto clúster (0,76 % de la población total).
Figura 6.127: Muestreo del resultado de la variable CH07 (estado civil).
Figura 6.128: Visualización de los rangos de edades del quinto clúster (0,76 % de la población total).
Figura 6.129: La opción “sabe leer y escribir” es la de mayor frecuencia en la variable CH09 (Analfabetismo) a diferencia del clúster No4 que posee un elevado índice de analfabetismo.
Figura 6.130: La opcion “No asiste, pero asistió” es la predominante en la variable CH10 (¿Asiste o asistió a algún establecimiento educativo?).
Figura 6.131: Secundaria incompleta es el nivel educativo predominante en el clúster numero No5.
Figura 6.132: Visualización del resultado de la variable CH12 (¿Cuál es el nivel más alto que cursa o cursó?).
Figura 6.133: Muestreo del resultado de la variable CH13 (¿Finalizó ese nivel?).
Figura 6.134: La opción “primer” año es que posee mayor representación en la variable CH14 (¿Cuál fue el último año que aprobó?).
Figura 6.135: En sexo predominante es el masculino en el sexto clúster de 0,57 % de la población total.
Figura 6.136: La opción separado es la que posee mayor representación en la variable CH07 (estado civil).
Figura 6.137: Visualización del resultado de la variable CH06 (años) en formato histograma.
Figura 6.138: Visualización de la opción “No sabe leer y escrivir” es la predominante en este clúster.
Figura 6.139: Visualización del nivel educativo “sin instrucción” en la variable NIVEL_ED (Nivel Educativo).
Figura 6.140: En el clúster No6 se puede observar que estos individuos no poseen instrucción educativa.
En la séptima agrupación también con un 0,57 % de la población total como se puede observar la fig. 6.141 de la pág. 96 el sexo femenino es predominante con un estado civil soltero/a con un rango de edad [20-25] (ver fig. 6.142), (ver fig. 6.143), respectivamente (ver fig. 6.144).
Al igual que la formación académica de la anterior agrupación (ver fig. 6.138) estás personas no saben leer ni escribir ya que nunca han asistido a un establecimiento educativo teniendo un nivel educativo sin instrucción (ver fig. 6.145), (ver fig. 6.146), respectivamente (ver fig. 6.147).
En la octava y última agrupación (0,19% de la población total) en ella se puede visualizar al sexo masculino que es el predominante con un estado civil separado con el rango de edad [45-50] años (ver fig. 6.148), (ver fig. 6.149), respectivamente (ver fig. 6.150).
En ésta la última agrupación se puede observar que posee el nivel educativo más elevado de todos los clúster antes vistos como se puede comprobar en la fig. 6.151.
Figura 6.141: Visualización general del séptimo clúster con un 0,57 % de la población total.
Figura 6.142: La opción “mujer” posee mayor presencia en la variable CH04 (sexo) del clúster No7.
Figura 6.143: Visualización del resultado en formato de diagrama circular de la varible CH07 (estado civil).
Figura 6.144: El rango de edad [20-25] años es el predominante en la variable CH06 (años) de la séptima agrupación.
Figura 6.145: Muestreo del diagrama circular de la variable CH09 (Analfabetismo) con su correspondiente numero de analfabetos.
Figura 6.146: La opción “nunca asistió” es la de mayor representación en la variable CH10 (¿Asiste o asistió a algún establecimiento educativo: colegio, escuela, universidad?)
Figura 6.147: El nivel educativo en la séptima agrupación posee un nivel de sin instrucción.
Figura 6.148: Muestreo del resultado en formato de diagrama circular de la variable CH04 (sexo).
Figura 6.149: La opcíon “separado/a” es de mayor predomino en la variable CH07 (estado civil).
Figura 6.150: Histograma que representa la distribución de las edades en el clúster No8.
Asimismo se puede observar en la fig. 6.152 que en esta agrupación se posee el máximo año aprobado con respecto a los demás clúster.
Siendo el nivel educativo más elevado que cursó esta persona el universitario como se puede apreciar en la siguiente fig. 6.153.
Figura 6.151: El nivel educativo en la octava y última agrupación (0,19% de la población total), posee un nivel de superior universitaria incompleta.
Clasificación del Ingreso de Cada Individuo, en Base a sus Principales Características Sociodemográficas
Luego de obtener una visión detallada de los diferentes perfiles de los individuos, en este caso los que posean planes asistenciales, será de sumo interés conocer las relaciones existentes entre el ingreso total de cada individuo con sus respectivas características sociodemográficas.
La técnica que permitirá realizarlo, será la de “Árboles de Decisión” con el DB2 Intelligent Miner for Data.
Está es una técnica predictiva con supervisión, que permitirá obtener como resultado reglas que explican el comportamiento de una variable target con relación a otras predictoras.
En el apartado “Introducción de Intelligent Miner for Data” se describe con mayor precisión dicha técnica.
Figura 6.152: Muestreo del resultado de la variable CH14 (¿Cuál fue el último año que aprobó?).
Figura 6.153: Visualización del resultado obtenido de la variable CH14 (¿Cuál fue el ultimo año que aprobo?) del octavo clúster.
El resultado obtenido es un modelo que clasifica a los individuos con sus respectivos ingresos y sus principales características sociodemográficas.
Se identifican diecinueve reglas que explican el perfil de estos individuos, determinadas por los nodos de desarrollo del árbol (mayor cantidad de individuos y mayor pureza), como se puede observar en la siguiente fig. 6.154.
Figura 6.154: Visualización de las diecinueve reglas de que identifican los distintos nodos de del árbol.
Como se puede observar en la siguiente fig. 6.154, en cada nodo del árbol de decisión se evalúa un atributo.
Existe una rama por cada valor del atributo cuando los atributos son discretos y una rama por rango de valores cuando los atributos son continuos.
Nótese que en cada nivel, la rama que deriva a la izquierda es si, la derecha no.
A continuación se visualizarán las siguientes reglas extraídas del árbol de decisión (ver fig. 6.155).
En la fig.6.155 se puede visualizar así como la regla, también el valor de la etiqueta que es el ingreso total individual que en este caso posee un valor de 448.11, como el número de registros 131 que cumplen con las características de dichos atributos.
Figura 6.155: Regla No 1 Si el individuo de estudio es de sexo femenino, no es patrón, no tiene trabajo registrado, ni obra social, ni descuento jubilatorio y su estado civil no es el casados entonces el ingreso total individual es de 448.11.
Figura 6.156: Regla No 2 Si el individuo de estudio es de sexo femenino, no es patrón, no tiene trabajo registrado, ni obra social, ni descuento jubilatorio y su estado civil es el casados entonces el ingreso total individual es de 426.20.
Como se puede apreciar en la fig.6.156, el valor de la etiqueta es 426.20 siendo este el ingreso total individual, también se puede observar que el número de registros involucrados en dicha regla es de 35.
Figura 6.157: Regla No 3 Si el individuo de estudio es de sexo femenino, no es patrón, no tiene trabajo registrado, pero sí posee obra social, entonces el ingreso total individual es de 245.5.
El la fig.6.157 se puede observar que esta rama no posee dos niveles, esto significa que en la regla faltarán dos atributos Estado Civil y Descuento Jubilatorio precisamente.
Puede observarse en la fig.6.158 que la rama del árbol en el nivel No3 tiene hacia la izquierda lo que implicará la afirmación de dicho atributo en este caso trabajo registrado.
El la fig.6.159 se puede apreciar los 150 que es el valor del ingreso total individual, también se puede observar que existe un único registro que cumple con dichas características.
En la fig. 6.160 se puede visualizar que la rama no pasa por el nodo del atributo descuento jubilatorio y por ende se obtiene como resultado una regla más pequeña.
Además de apreciar en la fig. 6.161 el valor del ingreso total 372.30 también se puede visualizar el número total de registros que en este caso son 70.
Figura 6.158: Regla No 4 Si el individuo de estudio es de sexo femenino, goza de un trabajo registrado, no es patrón, no posee obra social, ni descuento jubilatorio y su estado civil no es casados entonces el ingreso total individual es de 237.69.
Figura 6.159: Regla No 5 Si el individuo de estudio es de sexo femenino, goza de un trabajo registrado, pero no posee descuento jubilatorio, ni posee obra social a su vez no es patrón y su estado civil no es casado entonces el ingreso total individual es de 150.
Figura 6.160: Regla No 6 Si el individuo de estudio es de sexo femenino, goza de un trabajo registrado, pero no posee obra social a su vez no es patrón y su estado civil es el de casado entonces el ingreso total individual es de 150.
Figura 6.161: Regla No 7 Si el individuo de estudio es de sexo femenino, goza de un trabajo registrado y posee obra social a su vez no es patrón y su estado civil no es el de casado entonces el ingreso total individual es de 372.30.
Figura 6.162: Regla No 8 Si el individuo de estudio es de sexo femenino, goza de un trabajo registrado y posee obra social a su vez no es patrón y su estado civil es el de casado entonces el ingreso total individual es de 318.666656941406.
En la fig. 6.162 se puede visualizar así como la regla el valor de la etiqueta que es el ingreso total individual, como el número de registros que cumplen con las características de dichos atributos.
6.2.4 Generación de los Modelos (7/8)
6.2.4 Generación de los Modelos (7/8) alfonsocutro 23 Febrero, 2010 - 22:18En este caso como se puede apreciar en la 6.163, el ingreso total individual es de 594.86 con los 28 registros que cumplen con esas condiciones.
A diferencia de la anterior fig.6.163 en la 6.164 se puede apreciar que la rama del árbol en el ultimo nodo atributo tiende hacia la derecha lo que implica que el individuo es casado.
En la fig.6.165 se puede apreciar además de las reglas obtenidas el valor del ingreso total individual que es de 502.5 y el numero de registros involucrados en dicha relación que en este caso son únicamente 4.
En la anterior fig.6.166 se pude visualizar el valor de la etiqueta que en este caso es el ingreso total individual tienen un monto de 497.11 con un total de 45 registros involucrados en dicha regla.
Figura 6.163: Regla No 9 Si el individuo de estudio es de sexo masculino, no es patrón, no goza de un trabajo registrado y su estado civil no es casado entonces el ingreso total individual es de 594.86.
Figura 6.164: Regla No 10 Si el individuo de estudio es de sexo masculino, no es patrón, no posee un trabajo registrado y su estado civil es el de casado entonces el ingreso total individual es de 549.9310302734375.
Figura 6.165: Regla No 11 Si el individuo de estudio es de sexo masculino, no es patrón, posee un trabajo registrado, pero no goza de descuento jubilatorio y su estado civil es el de casado entonces el ingreso total individual es de 502.5.
Figura 6.166: Regla No 12 Si el individuo de estudio es de sexo masculino, no es patrón, posee un trabajo registrado, goza de descuento jubilatorio y el estado civil no es el de casado entonces el ingreso total individual es de 497.11.
Figura 6.167: Regla No 14 Si el individuo de estudio es de sexo masculino, no es patrón, posee un trabajo registrado, goza de descuento jubilatorio y el estado civil es el de casado entonces el ingreso total individual es de 608.31.
Como se puede observar en la siguiente este caso es el ingreso total individual tienen un monto de 608.31 siendo esta hoja la de mayor jerarquía de todas reglas antes vistas.
Figura 6.168: Regla No 15 Si el individuo de estudio es de sexo masculino, es patrón y su estado civil es el de casado entonces el ingreso total individual es de 203.79.
Los valores obtenidos en este caso como se puede observar en la fig.6.168 son los siguientes, 203.79 para el monto total individual y 128 el número de registros que se obtienen como resultado a dicha relación.
Como podemos observar en la fig.6.168 los valores producto de dicha relación son, 170.87 para el monto total individual con la cantidad de 111 registros que cumplen con dicha regla.
En la la fig.6.168 se puede observar que el monto total individual es de 259.52 teniendo 21 registros involucrados en dicha regla.
Como se puede observar en la siguiente de la la fig.6.168, siendo está la ultima rama extraída del árbol decisión, también se puede observar el monto total individual y su correspondientes registros involucrados.
Figura 6.169: Regla No 16 Si el individuo de estudio es de sexo femenino, es patrón y su estado civil es el de casado entonces el ingreso total individual es de 170.87.
Figura 6.170: Regla No 17 Si el individuo de estudio es de sexo masculino, es patrón y su estado civil no es el de casado entonces el ingreso total individual es de 259.52.
Figura 6.171: Regla No 18 Si el individuo de estudio es de sexo masculino, es patrón y su estado civil es el de casado entonces el ingreso total individual es de 305.18.
Clasificación del Ingreso de Cada Individuo, en Base a sus Principales Características Educacionales
La principal diferencia con el anterior objeto de estudio, es que en este se tomarán a la dimensión educacional en vez de las características socioeconómica de cada individuo.
El resultado obtenido es un modelo que clasifica a los individuos con sus respectivos ingresos y sus principales características educacionales.
Se puede visualizar en la siguiente fig. 6.172 de la pág. 121 que se identifican treintaidos reglas que explican el perfil de estos individuos, determinadas por los nodos de desarrollo del árbol (mayor cantidad de individuos y mayor pureza).
Figura 6.172: Visualización del Árbol de Decisión “Clasificación del Ingreso de Cada Individuo, en Base a sus Principales Características Educacionales”.
Como se puede observar en la siguiente fig. 6.154, este árbol cuenta con cuatro niveles comenzando por el nodo raíz que es el atributo miembro del hogar.
A continuación se visualizarán las siguientes reglas extraídas del árbol de decisión (ver fig. 6.173).
Como se puede observar en la fig. 6.173 la regla obtenida es la siguiente, si es no jefe/jefa del hogar donde habita y no es masculino y no es menor a 30 años y no su máximo nivel cursado no es inferior al secundario y no finalizo el máximo nivel cursado entonces el ingreso es de 298.19.
Figura 6.173: Visualizácion de la regla No1 con sus con sus respectiva rama del árbol de decisión involucrada en dicha relación.
Figura 6.174: Visualizácion de la regla No2 del árbol de decisión, como así tambíen el numero de registro que cumplen con esas características.
En la fig.6.174 se puede visualizar así como la siguiente regla. Si no es jefe/jefa del hogar donde habita, no es masculino es menor a 30 años su máximo nivel cursado no es inferior al secundario y no finalizó el máximo nivel cursado entonces el ingreso es de 276.13.
También el valor de la etiqueta que es el ingreso total individual que en este caso posee un valor de 276.13, como el número de registros 54 que cumplen con las características de dichos atributos.
Así como se puede observar en la fig.6.175 la etiqueta que en este caso no es mas que el ingreso total individual, teniendo un valor de 254.56 con total de 32 de registros involucrados en dicha relación.
También podemos visualizar la regla No3 que es la siguiente. Si no es jefe/jefa del hogar donde habita no es masculino, no es menor a 30 años su máximo nivel cursado no es inferior al secundario y finalizó el máximo nivel cursado entonces el ingreso es de 254.56.
La regla extraída del siguiente árbol de decisión como puede visualizarse en la fig. 6.176 cumple con las siguientes condiciones:
Si no es jefe/jefa del hogar donde habita, no es masculino, es menor a 30 años su máximo nivel cursado no es inferior al secundario y finalizó el máximo
Figura 6.175: Visualizácion de la regla No3 del árbol de decisión, como así tambíen el numero de registro y el ingreso total individual que cumplen con esas características.
Figura 6.176: Visualizácion de la regla No4 del árbol de decisión, como así tambíen el ingreso total individual que es de 174.72 y el numero de 29 que son los registros que cumplen con esas características.
Figura 6.177: Visualizácion de la regla No5 del árbol de decisión, como así tambíen el ingreso total individual que es de 202.97 y el numero de 28 que son los registros que cumplen con esas características.
La regla extraída del siguiente árbol de decisión en este caso cumple con las siguientes condiciones (ver fig.6.177):
Si el individuo de estudio es de sexo femenino, no es la jefa del hogar donde habita, posee mas de 30 años edad su máximo nivel cursado es inferior al secundario y el mismo no lo a finalizado entonces el ingreso es de 202.96.
Así como se puede observar en la fig.6.178 la regla obtenida, también se visualiza al ingreso total individual, teniendo un valor de 250.89 con total de 77 de registros.
La regla cumple con las siguientes condiciones (ver fig.6.178 ):
Si el individuo de estudio es de sexo femenino, no es la jefa del hogar donde habita, posee menos de 30 años edad su máximo nivel cursado es inferior al secundario y el mismo lo a finalizado entonces el ingreso es de 250.89.
Figura 6.178: Visualizácion de la regla No6 del árbol de decisión con su respectiva rama involucrada, como así también sus correspondiente etiqueta y numero de registros.
Figura 6.179: Visualizácion de la regla No7 del árbol de decisión con su respectiva rama involucrada, como así también sus correspondiente etiqueta y numero de registros.
Como se puede observar en la fig. 179 la regla obtenida es lasiguiente:
Si el individuo de estudio es de sexo femenino, no es la jefa del hogar donde habita, posee menos de 30 años edad su máximo nivel cursado es inferior al secundario y el mismo no lo a finalizado entonces el ingreso es de 171.11.
Figura 6.180: Visualizácion de la regla No8 del árbol de decisión con su respectiva rama involucrada, como así también sus correspondiente etiqueta y numero de registros.
En la fig.6.180 se puede visualizar así como la siguiente regla:
Si el individuo de estudio es de sexo femenino, no es la jefa del hogar donde habita, posee menos de 30 años edad, su máximo nivel cursado es inferior al secundario y el mismo lo a finalizado a el mismo, entonces el ingreso es de 180.51.
También el valor del ingreso total individual que en este caso posee un valor de 180.51, como el número de registros 37 que cumplen con las características de dichos atributos.
La regla extraída del árbol de decisión en este caso es la siguiente (ver la fig. 6.181):
Figura 6.181: Visualizácion de la regla No9 del árbol de decisión con su respectiva rama involucrada, como así también sus correspondiente etiqueta y numero de registros.
Si el individuo de estudio es de sexo masculino, no es el jefa del hogar donde habita, posee mas de 30 años edad, su máximo nivel cursado es inferior al secundario y al mismo no lo a finalizado, entonces el ingreso es de 377.28.
A diferencia de las ramas y reglas vistas anteriormente, esta tiende en el nodo atributo sexo asía la izquierda lo que implicará que todas reglas obtenidas tendrán como resultado final a un individuo masculino en vez de femenino.
Figura 6.182: Visualizácion de la regla No10 del árbol de decisión con su respectiva rama involucrada, como así también sus correspondiente etiqueta y numero de registros.
Se puede observar en la fig.6.182 la regla obtenida, como así también al ingreso total individual, teniendo un valor de 420 con total de 9 de registros involucrados.
Dicha regla cumple con las siguientes condiciones (ver fig.6.182):
Si el individuo de estudio es de sexo masculino, no es el jefe del hogar donde habita, posee menos de 30 años edad, su máximo nivel cursado es inferior al secundario y al mismo no lo a finalizado, entonces el ingreso es de 420.
En la fig.6.183 de la pág. 132 se puede visualizar así como la siguiente regla: Si el individuo de estudio es de sexo masculino, no es el jefe del hogar donde habita, no posee menos de 30 años edad, su máximo nivel cursado es inferior al secundario y al mismo no lo a finalizado, entonces el ingreso es de 300.16.
También el valor de la etiqueta que es el ingreso total individual que en este caso posee un valor de 300.16, como el número de registros 6 que cumplen con las características de dichos atributos.
Figura 6.183: Visualizácion de la regla No11 del árbol de decisión con su respectiva rama involucrada, como así también sus correspondiente etiqueta y numero de registros.
6.2.4 Generación de los Modelos (8/8)
6.2.4 Generación de los Modelos (8/8) alfonsocutro 8 Febrero, 2010 - 13:49
Figura 6.184: Visualizácion de la regla No12 del árbol de decisión con su respectiva rama involucrada, como así también sus correspondiente etiqueta y numero de registros.
Como se puede observar en la fig. 6.184 la regla obtenida es la siguiente:
Si el individuo de estudio es de sexo masculino, no es el jefe del hogar donde habita, posee menos de 30 años edad, su máximo nivel cursado es inferior al secundario y al mismo no lo a finalizado, entonces el ingreso es de 150.
Con respecto al valor de la etiqueta y al numero de registros como puede visualizarse en la fig.6.184.
El valor del ingreso total individual que es de 150 siendo el menor significancia con respecto a los anteriores resultados, en cuanto al número de registros en este caso solamente hay 1 solo que cumple con estas características.
Como se puede observar en la fig. 6.185 la regla obtenida es la siguiente:
Figura 6.185: Visualizácion de la regla No13 del árbol de decisión con su respectiva rama involucrada, como así también sus correspondiente etiqueta y numero de registros.
Si el individuo de estudio es de sexo masculino, no es el jefe del hogar donde habita, posee mas de 30 años edad, su máximo nivel cursado no es inferior al secundario y al mismo lo a finalizado, entonces el ingreso es de 337.5.
Figura 6.186: Visualizácion de la regla No14 del árbol de decisión con su respectiva rama involucrada, como así también sus correspondiente etiqueta y numero de registros.
Se puede observar en la fig.6.186 la regla obtenida, como así también al ingreso total individual, teniendo un valor de 367.5 con total de 2 de registros involucrados.
Dicha regla cumple con las siguientes condiciones (ver fig.6.186):
Si el individuo de estudio es de sexo masculino, no es el jefe del hogar donde habita, posee menos de 30 años edad, su máximo nivel cursado no es inferior al secundario y al mismo lo a finalizado, entonces el ingreso es de 367.5.
En la fig.6.187 se puede visualizar así como la siguiente regla:
Si el individuo de estudio es de sexo masculino, no es el jefe del hogar donde habita, posee mas de 30 años edad, su máximo nivel cursado es inferior al secundario y al mismo no lo a finalizado, entonces el ingreso es de 487.5.
También el valor de la etiqueta que es el ingreso total individual que en este caso posee un valor de 487.5, como el número de registros 8 que cumplen este caso posee un valor de 487.5, como el número de registros 8 que cumplen con las características de dichos atributos.
Figura 6.187: Visualizácion de la regla No15 del árbol de decisión con su respectiva rama involucrada, como así también sus correspondiente etiqueta y numero de registros.
Figura 6.188: Visualizácion de la regla No16 del árbol de decisión con su respectiva rama involucrada, como así también sus correspondiente etiqueta y numero de registros.
La regla extraída del árbol de decisión en este caso es la siguiente (ver la fig. 6.188):
Si el individuo de estudio es de sexo masculino, no es el jefe del hogar donde habita, el mismo posee menos de 30 años edad, su máximo nivel cursado es inferior al secundario y al mismo lo a finalizado, entonces el ingreso es de 570.
Con respecto al valor de la etiqueta y al numero de registros como puede visualizarse en la fig.6.188.
El valor del ingreso total individual que es de 150 siendo el menor significancia con respecto a los anteriores resultados, en cuanto al número de registros en este caso solamente hay 1 solo que cumple con estas características.
Al observar en la fig. 6.188 se puede visualizar que esta ha sido la hoja con mayor ingreso total individual.
También fue la última rama con el atributo padre “miembro del hogar =no es jefe/jefa”.
Lo que implica que todas las reglas extraídas en las próximas ramas del árbol de decisión contendrán a los jefes o jefas del hogar en cuestión.
Figura 6.189: Visualizácion de la regla No17 del árbol de decisión con su respectiva rama involucrada.
En la fig.6.189 se puede visualizar así como la siguiente regla:
Si el individuo de estudio es de sexo femenino, es el jefe o jefa del hogar donde habita, posee más de 30 años edad, su máximo nivel cursado no es inferior al secundario y al mismo no lo a finalizado, entonces el ingreso es de 391.75.
También el valor de la etiqueta que es el ingreso total individual que en este caso posee un valor de 391.75, como el número de registros 45 que cumplen con las características de dichos atributos.
Como se puede observar en la fig. 6.190 la regla obtenida es la siguiente:
Si el individuo de estudio es de sexo femenino, es el jefe o jefa del hogar donde habita, posee más de 30 años edad, su máximo nivel cursado es inferior al secundario y al mismo no lo a finalizado, entonces el ingreso es de 353.48.
Con respecto al valor de la etiqueta esta posee un valor de 353.48, con un total de 27 registros involucrados dicha regla (ver la fig.6.190).
Figura 6.190: Visualizácion de la regla No18 del árbol de decisión con su respectiva rama involucrada.
Figura 6.191: Visualizácion de la regla No19 del árbol de decisión con su respectiva rama involucrada, como así también sus correspondiente etiqueta con un valor de 549.66 y con 27 registros involucrados.
Como se puede observar en la fig. 6.191 la regla obtenida es la siguiente:
Si el individuo de estudio es de sexo femenino, es el jefe o jefa del hogar donde habita, posee más de 30 años edad, su máximo nivel cursado no es inferior al secundario y al mismo lo a finalizado, entonces el ingreso es de 549.66.
Figura 6.192: Visualizácion de la regla No20 del árbol de decisión con su respectiva rama involucrada.
En la fig.6.192 se puede visualizar así como la siguiente regla:
Si el individuo de estudio es de sexo femenino, es el jefe o jefa del hogar donde habita, posee más de 30 años edad, su máximo nivel cursado es inferior al secundario y al mismo lo a finalizado, entonces el ingreso es de 431.63.
También el valor de la etiqueta que es el ingreso total individual que en este caso posee un valor de 431.63, como el número de registros 54 que cumplen con las características de dichos atributos.
Se puede observar en la fig.6.193 la regla obtenida, como así también al ingreso total individual, teniendo un valor de 321.16 con total de 18 de registros involucrados.
Figura 6.193: Visualizácion de la regla No21 del árbol de decisión con su respectiva rama involucrada.
Dicha regla cumple con las siguientes condiciones (ver fig.6.193):
Si el individuo de estudio es de sexo femenino, es el jefe o jefa del hogar donde habita, posee menos de 30 años edad, su máximo nivel cursado no es inferior al secundario y al mismo no lo a finalizado, entonces el ingreso es de 321.16.
Figura 6.194: Visualizácion de la regla No22 del árbol de decisión con su respectiva rama involucrada.
En la fig.6.194 se puede visualizar así como la siguiente regla:
Si el individuo de estudio es de sexo femenino, es el jefe o jefa del hogar donde habita, posee menos de 30 años edad, su máximo nivel cursado no es inferior al secundario y al mismo lo a finalizado, entonces el ingreso es de 406.28.
También el valor de la etiqueta que es el ingreso total individual que en este caso posee un valor de 406.28, como el número de registros 7 que cumplen con las características de dichos atributos.
En la fig.6.195 se puede visualizar así como la siguiente regla:
Si el individuo de estudio es de sexo femenino, es el jefe o jefa del hogar donde habita, posee menos de 30 años edad, sumáximo nivel cursado es inferior al secundario y al mismo no lo a finalizado, entonces el ingreso es de 344.62.
También el valor de la etiqueta que es el ingreso total individual que en este caso posee un valor de 344.62, como el número de registros 8 que cumplen con las características de dichos atributos.
Figura 6.195: Visualizácion de la regla No23 del árbol de decisión con su respectiva rama involucrada.
Figura 6.196: Visualizácion de la regla No24 del árbol de decisión con su respectiva rama involucrada, como así tambien los correspondientes valores del ingreso total individual y el numero de registro.
Como se puede observar en la fig. 6.196 la regla obtenida es la siguiente:
Si el individuo de estudio es de sexo femenino, es el jefe o jefa del hogar donde habita, posee menos de 30 años edad, sumáximo nivel cursado es inferior al secundario y al mismo lo a finalizado, entonces el ingreso es de 193.5.
En la fig.6.197 se puede visualizar así como la siguiente regla:
Si el individuo de estudio es de sexo masculino, es el jefe o jefa del hogar donde habita, posee mas de 30 años edad, su máximo nivel cursado no es inferior al secundario y al mismo no lo a finalizado, entonces el ingreso es de 567.57.
También el valor de la etiqueta que es el ingreso total individual que en este caso posee un valor de 567.57, como el número de registros 14 que cumplen con las características de dichos atributos.
Figura 6.197: Visualizácion de la regla No25 del árbol de decisión con su respectiva rama involucrada, como así tambien los correspondientes valores del ingreso total individual y el numero de registro.
Figura 6.198: Visualizácion de la regla No26 del árbol de decisión con su respectiva rama involucrada, como así tambien los correspondientes valores del ingreso total individual y el numero de registro.
Como se puede observar en la fig. 6.198 la regla obtenida es la siguiente:
Si el individuo de estudio es de sexo masculino, es el jefe o jefa del hogar donde habita, posee menos de 30 años edad, su máximo nivel cursado no es inferior al secundario y al mismo no lo a finalizado, entonces el ingreso es de 538.20.
En la fig.6.199 se puede visualizar así como la siguiente regla:
Si el individuo de estudio es de sexo masculino, es el jefe o jefa del hogar donde habita, posee más de 30 años edad, su máximo nivel cursado no es inferior al secundario y al mismo lo a finalizado, entonces el ingreso es de 711.84.
También el valor de la etiqueta que es el ingreso total individual que en este caso posee un valor de 711.84 siendo este el de mayor valor de todas las reglas antes vistas, como el número de registros 13 que cumplen con las características de dichos atributos.
Figura 6.199: Visualizácion de la regla No27 del árbol de decisión con su respectiva rama involucrada, como así tambien los correspondientes valores del ingreso total individual y el numero de registro.
Figura 6.200: Visualizácion de la regla No28 del árbol de decisión con su respectiva rama involucrada.
Como se puede observar en la fig. 6.200 la regla obtenida es la siguiente:
Si el individuo de estudio es de sexo masculino, es el jefe o jefa del hogar donde habita, posee menos de 30 años edad, su máximo nivel cursado no es inferior al secundario y al mismo lo a finalizado, entonces el ingreso es de 560.
Se puede también visualizar en la fig.6.200 el ingreso total individual, teniendo un valor de 560 con total de 5 de registros involucrados.
La regla extraída del árbol de decisión en este caso es la siguiente (ver la fig. 6.201):
Si el individuo de estudio es de sexo masculino, es el jefe o jefa del hogar donde habita, posee más de 30 años edad, su máximo nivel cursado es inferior al secundario y al mismo no lo a finalizado, entonces el ingreso es de 397.52.
Como se puede apreciar en la fig. 6.201, el valor que la etiqueta posee es el de 397.52 siendo este el ingreso total individual, con un total de 27 registros involucrados en dicha relación.
En la fig.6.202 se puede visualizar así como la siguiente regla:
Figura 6.201: Visualizácion de la regla No29 del árbol de decisión con su respectiva rama involucrada.
Figura 6.202: Visualizácion de la regla No30 del árbol de decisión con su respectiva rama involucrada.
Si el individuo de estudio es de sexo masculino, es el jefe o jefa del hogar donde habita, posee menos de 30 años edad, su máximo nivel cursado es inferior al secundario y al mismo no lo a finalizado, entonces el ingreso es de 672.75.
Figura 6.203: Visualizácion de la regla No31 del árbol de decisión con su respectiva rama involucrada.
En la fig.6.203 se puede visualizar así como la siguiente regla:
Si el individuo de estudio es de sexo masculino, es el jefe o jefa del hogar donde habita, posee menos de 30 años edad, su máximo nivel cursado es inferior al secundario y al mismo lo a finalizado, entonces el ingreso es de 517.34.
Y para finalizar, se tiene a la fig. 6.204 que es la última regla extraída de árbol de decisión.
Si el individuo de estudio es de sexo masculino, es el jefe o jefa del hogar donde habita, posee menos de 30 años edad, su máximo nivel cursado es inferior al secundario y al mismo lo a finalizado, entonces el ingreso es de 527.88.
Se puede también visualizar en la fig.6.200 el ingreso total individual, teniendo un valor de 527.88 con total de 9 de registros involucrados.
Figura 6.204: Visualizácion de la regla No32 del árbol de decisión con su respectiva rama involucrada.