1.7 Mineria de Datos
1.7 Mineria de Datos alfonsocutro 25 Febrero, 2010 - 15:53Figura 1.3: Inteligencia de Negocios BI.
La Minería de Datos es la etapa de descubrimiento en el proceso de KDD (Knowledge Discovery from Databases): “paso consistente en el uso de algoritmos concretos que generan una enumeración de patrones a partir de los datos preprocesados” [3].
Para conseguirlo hace uso de diferentes tecnologías que resuelven problemas típico de agrupamiento automático, clasi>cación y asociación de atributos, etc.
La Minería de Datos es, en principio, una fase dentro de un proceso global denominado Descubrimiento de Conocimiento en Bases de Datos, aunque >nalmente haya adquirido el signi>cado de todo el proceso en lugar de la fase de extracción de conocimiento [5].
Es un mecanismo de explotación, consistente en la búsqueda de información valiosa en grandes volúmenes de datos.Está muy ligada a las Bodegas de Datos ya que las mismas proporcionan la información histórica con la cual los algoritmos de minería tiene la información necesaria para la toma de decisiones [4].
El Data Mining (DM) es un conjunto de técnica de análisis de datos que permiten:
- Extraer Patrones, Tendencias y Regularidades para describir y comprender mejor los datos.
- Extraer Patrones y Tendencias para predecir comportamientos futuros.
Debido al gran volumen de datos este análisis:
- Ya no puede ser manual (ni incluso facilitado por herramientas de Almacén de Datos).
- Ha de ser (semi-) automático.
En los sistemas estándar de gestión de bases de datos las consultas se resuelven accediendo a distintos conjuntos de datos almacenados.
Los sistemas de Data Mining (DM) in>eren conocimiento de las bases de datos en forma de Estructuras y Patrones. Este conocimiento supone un nuevo conjunto de información en base a la cual se responden las consultas.
1.7.1 Evolución Historia de la Minería de Datos
1.7.1 Evolución Historia de la Minería de Datos alfonsocutro 26 Febrero, 2010 - 11:51La idea de Minería de Datos no es nueva. Ya desde los años sesenta los estadísticos manejaban términos como Data Fishing, Data Mining (DM) o Data Archaeology con la idea de encontrar correlaciones sin una hipótesis previa en bases de datos con ruido.
A principios de los años ochenta, Rakesh Agrawal, GioWiederhold, Robert Blum y Gregory Piatetsky-Shapiro entre otros, empezaron a consolidar los términos de Minería de Datos y KDD.
Esta tecnología ha sido un buen punto de encuentro entre personas pertenecientes al ámbito académico y al de los negocios.
La evolución de sus herramientas en el transcurso del tiempo puede dividirse en cuatro etapas principales:
- Colección de Datos (1960).
- Acceso de Datos (1980).
- Almacén de Datos y Apoyo a las Decisiones (principios de la década de 1990).
- Minería de Datos Inteligente.(nales de la década de 1990).
1.7.2 Aplicacion de la Minería de Datos
1.7.2 Aplicacion de la Minería de Datos alfonsocutro 26 Febrero, 2010 - 12:07En Internet
— E-bussines: Perfiles de clientes, publicidad dirigida, fraude.
— Buscadores Inteligentes: Generación de jerarquías, bases de conocimiento web.
— Gestión del Tráfico de la Red: Control de e>ciencia y errores.
El Mundo de los Negocios
— Banca: Grupos de clientes, préstamos, oferta de productos.
— Compañías de Seguros: Detección de fraude, administración de recursos.
— Marketing: Publicidad dirigida, estudios de competencia.
En Mundo de la Ciencias
— Meteorología:Teleconexiones (asociaciones espaciales), predicción.
— Física: Altas energías, datos de colisiones de partículas (búsqueda de patrones).
— Bio-Informática: Búsqueda de patrones en ADN, proyectos cientí>cos como genoma humano, datos geofísicos, altas energías, etc.
1.7.3 Ejemplos de las Aplicaciones de la Mineria de Datos
1.7.3 Ejemplos de las Aplicaciones de la Mineria de Datos alfonsocutro 26 Febrero, 2010 - 12:28En el Area de la Meteorología
Teleconexiones: Son predicción de asociaciones espaciales sobre una determinada Área Geográfica (ver fig. 1.5).
Existen bases de datos con simulaciones de los campos atmosféricos en rejillas dadas (ver fig. 1.4).
Se dispone de gran cantidad de información en observatorios locales: precipitaciónes, temperaturas, vientos, etc. (ver fig. 1.6).
En el Ambito de la Web
- Reglas de Asociación:
El 60% de las personas que esquían viajan frecuentemente a Europa.
- Clasificación:
Figura 1.4: Areas de los Campos Atmosféricos.
Figura 1.5: Analisis sobre una determinada Área Geográfica.
Figura 1.6: Información obtenida en los observatorios.
Personas menores de 40 años y salario superior a $2000 compran on-line frecuentemente.
- Clustering:
Los usuarios A y B tienen gustos parecidos (acceden URLs similares).
- Detección de “Outliers”:
El usuario A navega en Internet más del doble del tiempo promedio. [5]