- Introducción
- Como se lleva a
cabo el proceso de búsqueda de
información - Fundamentos de
recuperación de información - Fundamentos de
recuperación de información - Sistemas o
técnicas para buscar
información - Recomendaciones
- Conclusión
- Bibliografía
Introducción
Los sistemas de búsqueda han adquirido una gran
importancia en el uso cotidiano de los ordenadores hasta el punto
de que realizar una consulta en un buscador es la acción
más frecuente, tras el envío de un correo
electrónico. Sin embargo, la búsqueda y
recuperación de información textual tienen
asociadas una serie de problemas todavía no resueltos
satisfactoriamente. Algunos de estos problemas provienen de la
ambigüedad y la falta de estructura propias del lenguaje
natural. En parte cuando la información ya no la tenemos a
nuestro alcance por diferentes motivos acudimos a muchas
técnicas para recuperar nuestra valiosa
información.
OBJETIVO GENERAL
Reconocer las distintas formas aplicadas a la
recuperación de información.
Como se lleva a cabo
el proceso de búsqueda de información
El proceso de recuperación se lleva a cabo
mediante consultas a la base de datos donde se almacena la
información estructurada, mediante un lenguaje de
interrogación adecuado. Es necesario tener en cuenta los
elementos clave que permiten hacer la búsqueda,
determinando un mayor grado de pertinencia y precisión,
como son: los índices, palabras clave, tesauros y los
fenómenos que se pueden dar en el proceso como son el
ruido y silencio documental. Uno de los problemas que surgen en
la búsqueda de información es si lo que recuperamos
es "mucho o poco" es decir, dependiendo del tipo de
búsqueda se pueden recuperar multitud de documentos o
simplemente un número muy reducido. A este fenómeno
se denomina Silencio o Ruido documental.
Fundamentos de
recuperación de información
Según el modelo más aceptado actualmente,
la recuperación de información consiste en un
proceso en el que intervienen tres elementos:
una colección de ítemes de
información, tales como documentos, que están
registrados en un depósito de información (por
ejemplo en una base de datos),una serie de preguntas que traducen las necesidades
de información de los usuarios y,
finalmente,una función de comparación
documentos/preguntas que genera como salida documentos
relevantes (véase la fig. 1). Recuperar
información, entonces consiste en buscar los
documentos que exhiben un mayor parecido con la
pregunta.La hipótesis subyacente en el modelo anterior
es que una forma de juzgar la relevancia de un documento es
medir su grado de similitud con la pregunta, y que la forma
de representar ambas entidades (preguntas y documentos) es
mediante el uso de información textual, aunque las
entidades en sí mismas no sean textuales.En general, para comparar el grado de parecido entre
dos entidades es necesario identificar algún grupo de
propiedades medibles y después establecer un
procedimiento que permita calcular cuántas de
éstas propiedades comparten ambas
entidades.Sistemas o
técnicas para buscar
información1. Sistemas de recuperación de
lógica difusaEn el modelo de lógica difusa los autores no
asignan los grados de pertenencia de los documentos a los
términos. Además, la aplicación de
modelos borrosos es idónea para solucionar los
problemas de incompletitud e imprecisión a la hora de
indexar un documento.En la equiparación probabilística, el
cálculo último devuelto sobre la probabilidad
de que los términos de los documentos sean
potencialmente relevantes a una pregunta, está
contenida en los documentos relevantes y en los no
relevantes. En la equiparación difusa, el
cálculo se define basándose en el grado de
pertenencia de los términos. La cuestión llega
a ser tal, que el grado de confianza de que un documento
contenga un término dado es relevante. Si ésto
se usa para definir el grado de pertenencia, entonces este
grado con respecto al conjunto de documentos relevantes,
puede ser computado para cualquiera de los
documentos.2. Técnica de ponderación de
términosEn la búsqueda unos criterios tienen
más valor que otros, dependiendo de los intereses del
usuario. Los documentos recuperados se encuentran en
función del valor obtenido en la ponderación.
El documento más pertinente de búsqueda
sería aquel que tenga representado todos los
términos de búsqueda y, además, el que
más valor tenga repetidos más veces.3. Técnicas de clustering
Página siguiente |