Monografias.com > Computación > Internet
Descargar Imprimir Comentar Ver trabajos relacionados

Sistema automatizado de búsqueda web




Enviado por Pablo Turmero



Partes: 1, 2

    Monografias.com

    Agenda

    Introducción.
    Objetivo del Proyecto.
    Algoritmo
    Implementación
    Presentación de la Aplicación
    Conclusiones.

    1

    Monografias.com

    Introducción
    Definición Web Crawlers
    Es un programa que recorre las páginas del World Wide Web de forma metódica y automatizada, las descarga y procesa, comienzan visitando una lista de URL, identifican los hiperenlaces en dichas páginas y los añade a la lista a visitar de manera recurrente de acuerdo a determinado conjunto de reglas.
    2

    Monografias.com

    Introducción
    Entre ellos estan las arañas, bots, buscadores, web Crawlers.
    Algunas de las tareas más comunes de las arañas web están las siguientes:
    Crear el índice de una máquina de búsqueda.
    Analizar los enlaces de un sitio para buscar links rotos.
    Recolectar información de un cierto tipo, como precios de productos para recopilar un catálogo.

    3

    Monografias.com

    Introducción
    Los tipos de busqueda determinados para trabajar con las arañas web son:

    Índices de Búsqueda
    Motores de Búsqueda
    Metabuscadores
    4

    Monografias.com

    Objetivo General del Proyecto
    Analizar, Desarrollar e Implementar el Sistema Automatizado de Búsqueda Web (Web Crawlers) de promociones de Ticket Aéreos y Portal Web para la Agencia de Viajes y Turismo Mundo Valle Cía. Ltda., mediante la utilización de software libre.

    5

    Monografias.com

    Objetivos Específicos
    Investigar los principios en los que se basan los algoritmos de búsqueda de datos a través de grandes cantidades de información y seleccionar el más óptimo de ellos para este sistema.
    Analizar la administración y funcionamiento de la Agencia.
    Desarrollar el portal web de la agencia y el pago en línea
    Implementar y realizar las pruebas necesarias del sistema para detectar problemas de rendimiento.

    6

    Monografias.com

    Conceptos Generales del Proyecto
    7

    Monografias.com

    Programa, que permite encontrar contenidos, archivos, páginas Web y demás recursos.
    Desde el punto de vista del usuario no es más que una página Web, desde el punto de vista de una página Web.
    8
    BUSCADOR

    Monografias.com

    SECUENCIA BÁSICA DE UN BUSCADOR

    Monografias.com

    Pseudo-Algoritmo
    Inicializar las URLs
    Verificar la finalización, agregar a la pila
    Encontrar los enlaces
    Procesar las páginas
    Agregar las URLs a ser procesadas

    ** la pila contiene una lista para el web crawler de URLs no visitadas con nuevas páginas y enlaces.
    10

    Monografias.com

    BÚSQUEDA DE INFORMACIÓN

    Monografias.com

    BÚSQUEDA DE INFORMACIÓN

    Partes: 1, 2

    Página siguiente 

    Nota al lector: es posible que esta página no contenga todos los componentes del trabajo original (pies de página, avanzadas formulas matemáticas, esquemas o tablas complejas, etc.). Recuerde que para ver el trabajo en su versión original completa, puede descargarlo desde el menú superior.

    Todos los documentos disponibles en este sitio expresan los puntos de vista de sus respectivos autores y no de Monografias.com. El objetivo de Monografias.com es poner el conocimiento a disposición de toda su comunidad. Queda bajo la responsabilidad de cada lector el eventual uso que se le de a esta información. Asimismo, es obligatoria la cita del autor del contenido y de Monografias.com como fuentes de información.

    Categorias
    Newsletter