Minado de datos relacionales
INGENIERÍA EN SISTEMAS COMPUTACIONALES
UNIDAD 4. MINADO DE DATOS RELACIONALES
ÍNDICE
Unidad 4 Minado de datos relacionales
4.1 Pre-procesamiento 3 4.2 reglas de asociación relacional 9 4.3 Árboles de decisión relacionales 13
Unidad 4 Minado de datos relacionales 4.1 Pre-procesamiento
PRE-PROCESAMIENTO DE DATOS Consiste en la preparación previa de los datos para ser usados por la construcción, entrenamiento y prueba de un modelo de red neuronal. Alguno de los problemas más comunes en la preparación de los datos es la mezcla de variables continuas y discretas. a) Debe hacerse …ver más…
* La salida es producida en un rango estrictamente limitado. * Las funciones de activación son sensibles a estar en rangos limitados
(ejm.: sigmode)
El rango limitado de respuesta de la red y la información en forma numérica implica que la solución neuronal requiera de un preprocesamiento y un postprocesamiento. (Bishop, 1995).
Métodos más comunes de hacer pre-procesamiento:
Tal como se mostró a través de ejemplos en las páginas anteriores, los métodos más comunes de preparación de datos son:
* Escalamiento: transformación del contenido de las variables a un rango 0,1. * Análisis de variables nominales: transformación de un valor categórico a un valor numérico.
MÉTODOS DE PREPROCESAMIENTO DE DATOS
Como métodos alternativos y con mayor consistencia de análisis, surgen técnicas emergentes que de algún modo proveen medios para la preparación y escogencia de los datos.
Sin embargo, el piso estadístico como fuente de afirmación teórica para la selección y preparación de los datos, sigue siendo el recurso más idóneo de pre-procesamiento.
1. Data mining
- Exploración de datos para la búsqueda de: patrones consistentes relación sistemática entre variables
- No identifica las relaciones específicas entre las variables
- El proceso consiste de:
Exploración
Construcción del modelo
Definición de patrones
2. Data warehousing
Organización de datos multivariantes para facilitar futuras recuperaciones