1
La Minería Web se define como “el proceso global de descubrir información o conocimiento potencialmente útil y previamente desconocido a partir de los datos de la web” [Etzioni, 1996].
Forma intermedia
Técnicas de minería de datos
adecuadas para el análisis
de la información que se
encuentra en la web
Motivación
2
Minería Web
Minería Web de
Uso
Minería Web de
Estructura
Minería Web de
Contenido
Documentos Web
Enlaces entre e intra
Documentos
Archivos Log
Motivación
3
¿Cómo es el comportamiento de navegación del usuario en la web?
¿Cómo podemos identificar a los usuarios que navegan por la web si no se registran?
¿Cómo podemos ofrecer una información más adecuada al usuario durante su navegación?…
Minería de Datos
Lógica Difusa
Motivación
4
La obtención de patrones de navegación, a través de la técnica de reglas de asociación difusas.
Realizar un análisis demográfico, utilizando la técnica del clustering difuso para la agrupación y caracterización de sesiones de usuarios.
Construcción de perfiles de usuario, a través de un modelo general de obtención y representación de los mismos en XML.
La aplicación de la lógica difusa en la minería web de uso.
Objetivos
5
Minería Web de Uso.
– Modelo de datos.
Análisis de patrones de navegación.
– Obtención de reglas de asociación difusas para el análisis de patrones de navegación: caso real (E.T.S.I.I.T.).
Análisis demográfico.
– Clustering de páginas similares: caso real.
– Clustering difuso de sesiones de usuarios: caso real (E.T.S.I.I.T.).
Perfiles de usuario y lógica difusa.
– Modelo de obtención y representación en XML de los perfiles de usuario.
– Aplicación para un caso real (E.T.S.I.I.T.).
Conclusiones y trabajos futuros.
Contenidos
6
Minería Web de Uso.
– Modelo de datos.
Análisis de patrones de navegación.
– Obtención de reglas de asociación difusas para el análisis de patrones de navegación: caso real.
Análisis demográfico.
– Clustering de páginas similares: caso real.
– Clustering difuso de sesiones de usuarios: caso real.
Perfiles de usuario y lógica difusa.
– Modelo de obtención y representación en XML de los perfiles de usuario.
– Aplicación para un caso real.
Conclusiones y trabajos futuros.
Contenidos
7
Colección de Datos de Uso
Preprocesamiento de Datos de Uso
Descubrimiento de
Patrones de Uso
Interpretación de los resultados
– Servidor Web
– Servidor Proxy
– Máquina del Usuario
– Heterogeneidad y Carencia de Estructura
– Forma Intermedia
Técnicas de Minería:
– Clustering
– Reglas de Asociación
– Interpretar patrones
– Construir perfiles
Minería Web de Uso – Etapas (Capítulo 3)
Minería Web de Uso
Etapas
8
Performance Log
File Format (PLFF)
Tipos de ficheros
Registros de Accesos
Registros de
Error
Registros de Referencia
Registros de Agentes
Common Log
File Format
(CLFF)
Extended Common
Log File Format
(ECLFF)
Minería Web de Uso – Etapas (Capítulo 3)
Minería Web de Uso
Tipos de ficheros log (Capítulo 3)
Minería Web de Uso
Tipos de ficheros log
Página siguiente |