Resumen de Minería de Datos Aplicada a la Búsqueda de Perfiles de Alumnos

Minería de Datos Aplicada a la Búsqueda de Perfiles de Alumnos

David La Red Martinez1, Alfonso Cutro1, Rambo Alice R.2, Uribe Valeria1

1Departamento de Informática, Facultad de Ciencias Exactas Naturales y Agrimensura (F.C.E.N.A), Universidad Nacional del Nordeste (UNNE), 9 de julio 1449 – C.P.3400 –Corrientes – Corrientes – Argentina

2Departamento de Informática, Facultad de Ciencias Exactas Químicas y Naturales (F.C.E.Q. y N) , Universidad Nacional de Misiones (UNaM), Félix de Azara 1552 - C.P. N3300LQH - Posadas - Misiones - Argentina

 

Introducción

Aplicación de técnicas de minería de datos basadas en clustering para la búsqueda de perfiles de los alumnos según su rendimiento académico, situación demográfica y socio económica.
 

El objetivo principal de este trabajo es encontrar perfiles de alumnos por medio de la aplicación de técnicas de minería de datos a un data warehouse con datos académicos, socio económico y demográfico correspondientes a alumnos de Sistemas Operativos de la Licenciatura en Sistemas de Información de la FACENA de la UNNE.
 

El presente estudio se realizó sobre datos obtenidos mediante encuestas realizadas a alumnado de la mencionada asignatura y considerando además los resultados de las distintas instancias de evaluación previstas durante el cursado de dicha asignatura. Se utilizó un entorno integrado de gestión de bases de datos y data warehouse (DB2 versión 9.5), obtenido de la empresa IBM mediante los Acuerdos firmados entre dicha empresa y la UNNE; dicho entorno permite la extracción de conocimiento en bases de datos y almacenes de datos mediante técnicas de minería de datos como ser clustering (o agrupamiento de datos) que consiste en la partición de un conjunto de individuos en subconjuntos lo más homogéneos posible, el objetivo es maximizar la similitud de los individuos del cluster y maximizar la diferencia entre clusters. El cluster demográfico es un algoritmo desarrollado por IBM e implementado en el Intelligent Miner from Data, componente del Data Ware House Edition, entorno antes mencionado, que resuelve automáticamente los problemas de definición de métricas de distancia / similitud, proporcionando criterios para definir una segmentación óptima.
 

Los pasos realizados durante el presente estudio han sido los siguientes:

  1. Recolección de los datos.
  2. Tratamiento y depuración de los datos.
  3. Preparación de la base de datos y del almacén de datos correspondiente sobre la plataforma de trabajo seleccionada.
  4. Selección de la técnica de minería de datos para la realización del estudio (clustering).
  5. Generación de diferentes gráficos para el estudio de los resultados.
  6. Estudio de los resultados obtenidos.
  7. Obtención de las conclusiones.
     

Resultados

Se obtuvieron diferentes clasificaciones mediante la utilización de técnicas de clustering, según diferentes criterios de agrupación de los datos.
 

Conclusiones

Se obtuvo un modelo de datos referido a los aspectos socio demográficos, de niveles educativos y de rendimiento académico de los alumnos de la asignatura mencionada, lo que permitió descubrir el perfil de dicho agrupamiento estudiantil.

Se ha podido comprobar las grandes ventajas de la utilización de tecnologías y software de última generación que soportan sistemas multiplataforma.
 

Líneas futuras de acción

Avanzar en la investigación con la utilización de minería de datos como ser redes neuronales, redes bayesianas, arboles de decisión, etc., aplicadas al almacén de datos utilizado con las técnicas de clustering.

Aplicar las técnicas de minería de datos utilizadas, pero sobre otras bases de datos de alumnos de otras asignaturas y carreras para comparar los resultados obtenidos.