Franz boas el problema racial de la sociedad moderna
Definición de Recuperación de Información
Baeza – Yates [1999]: Parte de la informática que estudia la recuperación de la información (no datos) de una colección de documentos escritos. Los documentos recuperados pueden satisfacer una necesidad de información de un usuario expresada normalmente en lenguaje natural.
Korfhage [1997]:La localización y presentación a un usuario de información relevante a una necesidad de información expresada como una pregunta.
Salton [1989]: Un sistema de recuperación de información procesa archivos de registros y peticiones de información, e identifica y recupera de los archivos ciertos registros en respuesta a las …ver más…
Esta ambigüedad puede ser parcialmente resuelta mediante la utilización de lenguajes documentales, pero desafortunadamente estos no cubren todas las posibles necesidades de un usuario cualquiera, y por tanto son aplicables sólo a ámbitos restringidos. Este será no obstante un factor a analizar en el tema de creación de consultas que veremos más adelante.
Es necesario puntualizar que lo que un sistema de recuperación de información intenta obtener de una colección o una base de datos es precisamente información, y no datos.
Recuperación de información vs recuperación de datos
Datos
Hechos representados en forma legible. Como en las bases de datos relacionales.
Información
Datos organizados de forma coherente. Como en los sistemas de recuperación de información
Conocimiento
Información que puede ser utilizada para un propósito.
Diferencias entre Recuperación de Información y Recuperación de Datos
Criterio Información Datos
Lenguaje de consulta Lenguaje natural Lenguaje artificial
Modelo Probabilístico Determinista
Respuesta Relevante(*) Adecuada
Pregunta Difusa Completa
Correspondencia Parcial Exacta
Se buscan Documentos Registros
La recuperación de datos se basa en determinar qué documentos en una colección contienen las palabras clave expresadas en una consulta. Esto muchas veces no satisface las necesidades de información del usuario.
La forma