Conclusiones de Mineria de datos aplicada a la EPH

Conclusiones acerca de las Tecnologías y Software Utilizados

Se ha podido comprobar las grandes ventajas de la utilización de tecnologías y software de última generación, tanto de base de datos como de desarrollo de aplicaciones, que soportan sistemas distribuidos multiplataforma.

Esto ha resultado de gran utilidad al momento de desarrollar una aplicación con WebSphere Application Developer v5.0 y DB2 UDB WorkGroup Server Edition v8.1, DB2 Intelligent Miner for Data v7.1, bajo el sistema operativo Windows XP, utilizando Java ESE 6.7.

Se ha comprovado la facilidad del uso de los aplicativos mencionados, lo cual permitió actualizar los conocimientos en cuanto a las tecnologías que demanda el mercado actual.

 

Conclusiones acerca de los Objetivos propuestos

Respecto de los resultados obtenidos mediante la realización del presente trabajo, cabe mencionar que el proceso de extracción de conocimientos realizado sobre los datos provenientes del "Instituto Nacional de Estadísticas y Censo (INDEC) - Encuesta Permanente de Hogares", revela una gran cantidad de información, la cual permite conocer a la población de la ciudad de Corrientes en un elevado nivel de detalle socio-demográfico y educacional.

 

Conclusiones respecto del Proceso de extracción de conocimiento

El desarrollo de un Almacén de datos (Data Warehouse) con su correspondiente esquema en estrella, permitió adquirir conocimientos adicionales sobre el diseño y utilización de esta tecnología.

Respecto de las fuentes de datos utilizadas, se puede destacar la excelente calidad y consistencia de las mismas, lo que agilizó notablemente su estudio, ya que prácticamente no fue necesaria una etapa de depuración de datos.

 

Cabe destacar la eficiencia de los siguientes algoritmos aplicados:

  • "Clustering": permitió obtener un modelo con los datos sociodemográficos y de educación de los individuos de la población estudiada.
     
  • "Árboles de decisión y clasificación": permitió la generación de reglas que ilustran las relaciones existentes entre los ingresos y el nivel sociodemográfico, como también entre los ingresos y la educación de cada individuo.

 

Líneas futuras de acción

  • Avanzar en la investigación mediante la aplicación de otras técnicas de minería de datos tales como Redes neuronales, Redes bayesianas, etc.
     
  • Investigar acerca de la aparición de nuevas herramientas de Inteligencia de Negocios (Business Intelligence) y aplicarlas con el fin de obtener nuevos resultados y poder realizar comparaciones.
     
  • Mejorar la aplicación generada agregando conceptos de RIA (Rich Internet Aplications).