Monografias.com > Computación > General
Descargar Imprimir Comentar Ver trabajos relacionados

Archivos




Enviado por lcamachog



    INDICE:

    QUE SON ARCHIVOS
    INTRODUCCIÓN A LOS
    ARCHIVOS

    CARACTERÍSTICAS
    CLASIFICACION
    TIPOS DE ARCHIVOS
    SEGÚN SU
    FUNCION

    SEGÚN SUS
    ELEMENTOS

    ACCESO A LOS ARCHIVOS
    TIPOS DE ACCESO A LOS
    ARCHIVOS

    OPERACIONES GENERALES QUE SE REALIZAN SOBRE UN
    ARCHIVO
    .
    ORGANIZACIÓN DE LOS
    ARCHIVOS
    .
    ENFOQUES GENERALES PARA LA ORGANIZACIÓN DE
    ARCHIVOS

    ARCHIVOS SECUENCIALES
    ARCHIVOS DE
    TEXTO

    ARCHIVOS
    INDIZADOS

    ARCHIVOS DISPERSOS.
    MEDIDAS DE UTILIZACIÓN DE LOS
    ARCHIVOS

    DEFINICIONES.
    BIBLIOGRAFIA

    1. – QUE SON
    ARCHIVOS.

    Los archivos
    también denominados ficheros (file); es una
    colección de información (datos
    relacionados entre sí), localizada o almacenada como una
    unidad en alguna parte de la
    computadora.

    Los archivos son el conjunto organizado de informaciones
    del mismo tipo, que pueden utilizarse en un mismo tratamiento;
    como soporte material de estas informaciones.

    1.1. – INTRODUCCIÓN A LOS
    ARCHIVOS.

    Los archivos como colección de datos sirve para
    la entrada y salida a la computadora y
    son manejados con programas.

    Los archivos pueden ser contrastados con Arrays y
    registros; Lo
    que resulta dinámico y por esto en un registro se deben
    especificar los campos, él número de elementos de
    un arrays (o arreglo), el número de caracteres en una
    cadena; por esto se denotan como "Estructuras
    Estáticas".

    En los archivos no se requiere de un tamaño
    predeterminado; esto significa que se pueden hacer archivos de
    datos más grandes o pequeños, según se
    necesiten.

    Cada archivo es
    referenciado por su identificador (su nombre.).

    1.2. – CARACTERÍSTICAS DE LOS
    ARCHIVOS

    Las principales características de esta estructura
    son:

    Independencia de las informaciones respecto de los
    programas

    La información almacenada es
    permanente

    Un archivo puede ser
    accedido por distintos programas en
    distintos momentos

    Gran capacidad de almacenamiento.

    1.3. – CLASIFICACION
    DE LOS ARCHIVOS

    Los archivos se clasifican según su uso en tres
    grupos:

    Permanentes o Maestros:

    Estos contienen información que varia poco. En
    algunos casos es preciso actualizarlos
    periódicamente.

    De Movimientos

    Se cercan para actualizar los archivos maestros. Sus
    registros son
    de tres tipos: alta, bajas y modificaciones.

    De Maniobra o Trabajo.

    Tienen una vida limitada, normalmente menor que la
    duración de la ejecución de un programa. Su
    utilizan como auxiliares de los anteriores.

    1.4. – TIPOS DE
    ARCHIVOS

    Los elementos de un archivo pueden ser de cualquier
    tipo, simples o estructurados o según su función.

    1.4.1. – SEGÚN
    SU FUNCION.

    Se define por:

    a.- Archivos Permanentes:

    Son aquellos cuyo registros sufren pocas o ninguna
    variación a lo largo del tiempo, se
    dividen en:

    Constantes: Están formados por registros
    que contienen campos fijos y campos de baja frecuencia de
    variación en el tiempo.

    De Situación: Son los que en cada momento
    contienen información actualizada.

    Históricos: Contienen información
    acumulada a lo largo del tiempo de archivos que han sufridos
    procesos de
    actualización o bien acumulan datos de variación
    periódica en el tiempo.

    b.- Archivos de Movimiento

    Son aquellos que se utilizan conjuntamente con los
    maestros (constantes), y contienen algún campo
    común en sus registros con aquellos, para el procesamiento
    de las modificaciones experimentados por los mismos.

    c.- Archivo de Maniobra o Transitorio

    Son los archivos creados auxiliares creados durante la
    ejecución del programa y
    borrados habitualmente al terminar el mismo.

    1.4.2. –
    SEGÚN SUS ELEMENTOS.

    Los principales archivos de este tipo son:

    Archivo de Entrada: Una colección de datos
    localizados en un dispositivo de entrada.

    Archivo de Salida: Una colección de
    información visualizada por la
    computadora.

    Constantes: están formados por registros
    que contienen campos fijos y campos de baja frecuencia de
    variación en el tiempo.

    De Situación: son los que en cada momento
    contienen información actualizada.

    Históricos: Contienen información
    acumulada a lo largo del tiempo de archivos que han sufrido
    procesos de
    actualización, o bien acumulan datos de variación
    periódica en el tiempo.

    Archivos de Movimiento o
    Transacciones
    : Son aquellos que se utilizan conjuntamente con
    los maestros (constantes), y contienen algún campo
    común en sus registros con aquellos, para el procesamiento
    de las modificaciones experimentados por los mismos.

    Archivos de Maniobra o Transitorios: Son los
    archivos auxiliares creados durante la ejecución del
    programa y borrados habitualmente al terminar el
    mismo.

    – SEGÚN SUS
    ELEMENTOS

    Los principales archivos de este tipo son:

    Archivo de Entrada, una colección de datos
    localizada en un dispositivo de entrada.

    Archivo de Salida, una colección de
    información visualizada por la computadora.

    Archivo de Programa, un programa codificado en un
    lenguaje
    especifico y localizado o almacenado en un dispositivo de
    almacenamiento.

    Archivo de Texto, una colección de
    caracteres almacenados como una unidad en un dispositivo de
    almacenamiento.

    2. – ACCESO A LOS
    ARCHIVOS

    Se refiere al método
    utilizado para acceder a los registros de un archivo
    prescindiendo de su organización. Existen distintas formas de
    acceder a los datos:

    Secuenciales; los registros se leen desde el
    principio hasta el final del archivo, de tal forma que para leer
    un registro se
    leen todos los que preceden.

    Directo; cada registro puede leerse / escribirse
    de forma directa solo con expresar su dirección en el fichero por él
    numero relativo del registro o por transformaciones de la clave
    de registro en él numero relativo del registro a
    acceder.

    Por Índice; se accede indirectamente a los
    registros por su clave, mediante consulta secuenciales a una
    tabla que contiene la clave y la dirección relativa de cada registro, y
    posterior acceso directo al registro.

    Dinámico; es cuando se accede a los
    archivos en cualquier de los modos anteriormente
    citados.

    La elección del método
    esta directamente relacionada con la estructura de
    los registros del archivo y del soporte utilizado.

    2.1. – TIPOS DE
    ACCESOS

    Acceso Secuencial. Exige el tratamiento de
    elemento, para esto es necesario una exploración
    secuencial comenzando desde el primer momento (Pascal permite
    este acceso)

    Secuenciales:  archivo de texto que debe
    ser leído del principio hasta el final.

    Acceso Directo. Permite procesar o acceder a un
    elemento determinado y referencia directamente por su
    posición en el soporte de almacenamiento (Turbo Pascal
    permite este acceso.

    Aleatorios:  es un archivo con registros de
    un mismo largo.  Un programa puede accesar directamente
    cualquier registro sin tener que leer los registros
    previos.

    Binarios:  es un archivo que lee byte por
    byte sin asumir ninguna estructura.
    Los archivos Binarios no son un nuevo tipo de archivo, pero si
    una nueva forma de manipular cualquier tipo de archivo. Las
    técnicas de archivo binarios permiten leer
    o cambiar cualquier byte de un archivo. Son herramientas
    extremadamente potentes, pero como toda herramienta potente debe
    manejarse con cuidado

    Entre otras características, a las técnicas
    de archivo binario no les preocupa los caracteres EOF
    intercalados (Control+Z =
    Chr$(26)) que pueda tener un archivo.

    Ejemplo Open NombreArchivo for Binary as
    #NumeroArchivo.

    Instrucciones para manejar archivos

    OPEN:  reserva un espacio del buffer para la
    data que moverá entre el programa y los archivos.  La
    estructura es:

        OPEN filespec FOR
    {Append|Binary|Input|Outuput|Random} As #filenumber

    Por ejemplo:

         OPEN "C:WindowsAddrBook.ini" FOR Input As #1

    Filespec:  Es la localización de archivo en
    el que se trabajará, incluyendo usualmente el drive y
    path.

        "C:WindowsAddrBook.ini"

    {Append| Binary| Input| Outuput| Random}  El
    programador tiene que seleccionar uno.  Binary y Random se
    utiliza para archivos binarios y aleatorios.  Append, Input
    y Output son usados con archivos secuenciales.  Un archivo
    secuencial no puede ser abierto para leer y escribir
    simultaneamente.  Output es usado para escribir en el
    archivo.  Input es usado para leer del archivo.  Append
    es usado para colocar data al final de un archivo
    exitente.

    #filenumber:  es necesario asignar un número
    al archivo.  El número puede estar en el rango de #1
    a #511 y es usado por Visual Basic para
    identificar el archivo.

    CLOSE:  para cerrar un archivo.  La
    estructura es:

         CLOSE
    #filenumber

    Por ejemplo:

        CLOSE #1

    WRITE:  envia data del programa al archivo
    secuencial.  La estructura es:
        WRITE #filenumber,
    [OutputList]

    Por ejemplo:

        WRITE #1, UserName,
    UserCompany, SerialNumber

    WRITE es la operación opuesta al
    INPUT.  Las expresiones en el OutputList son
    separadas por comas.  WRITE inserta comillas y comas
    a la data que envia al archivo.

    INPUT:  lee data del archivo.  La
    estructura es:

        INPUT #filenumber,
    InputList

    Por ejemplo:

        INPUT #1, UserName,
    UserCompany, SerialNumber

    Declaración y asignación de
    archivos

    La declaración de un archivo con tipo se
    efectúa con la ayuda de las palabras reservadas file
    of.

    El procedimiento de
    asignación es idéntico al utilizado
    anteriormente.

    Ejemplo:

    Type

    datos = record

    clave : integer;

    nombre : string[30];

    puesto : string[20];

    sueldo : real;

    estado : boolean;

    {true activo,false baja
    lógica}

    end;

    Var

    archivo:file of datos;

    begin

    Assign(archivo,'empleado.dat');

    SISTEMA DE MANEJO DE ARCHIVOS.

    Tiene las siguientes funciones:

    Controla los datos en almacenamiento secundario [
    ]

    Proporciona al usuario una abstracción de
    cómo se manipulan los datos internamente. [ ]

    Proporciona independencia
    de E/S con los dispositivos [ ]

    Soporte de compartición, protección,
    recuperación de archivos y posibles caídas del
    sistema. [
    ]

    Transmisión de datos de memoria principal
    a secundaria.[ ]

     Los archivos de una empresa
    pueden almacenarse en diferentes dispositivos. Todos los archivos
    se pueden almacenar por medio de directorios, que no son
    otra cosa más que tablas de símbolos de archivo,
    los directorios se pueden utilizar de dos formas:

     DIRECTORIO DE NIVEL ÚNICO O DIRECTORIO
    PLANO

      Con este método, se almacenan todos los
    archivos en un solo nivel, este método en sistemas donde el
    volumen de
    archivos no es grande.[ ]

      DIRECTORIO JERARQUICO

      Los archivos son almacenados por medio de
    directorios, esta clasificación se de acuerdo a la
    conveniencia del usuario o de la empresa. [ ]
    .La estructura tiene una forma de árbol con raíz,
    este método es el más utilizado debido a que la
    revisión o búsqueda se realiza de forma
    sencilla.

     Para accesar a los archivos que se almacenan en un
    sistema
    jerárquico, el usuario debe indicar el o los directorios
    que se deben recorrer para localizar el archivo deseado, a esto
    se le denomina ruta de acceso del archivo. La ruta de
    acceso puede ser de dos formas:

    Ruta absoluta.- Este tipo de ruta de acceso
    inicia siempre con una diagonal invertida [ ]

    C:Edit c:SOSsistemasreport.txt

    Ruta relativa.- Este tipo de ruta de acceso
    realiza la búsqueda del archivo en el directorio de
    trabajo actual, si el archivo no se localiza aquí, el S.O.
    lo buscará en los directorios especificados en el PATH de
    un archivo con extensión .BAT.

    C:Edit report.txt

    2.2. – OPERACIONES
    GENERALES QUE SE REALIZAN SOBRE UN
    ARCHIVO.

    Las operaciones
    generales que se realizan son:

    Creación. Escritura de
    todos sus registros.

    Consulta. Lectura de
    todos sus registros.

    Actualización. Inserción
    supresión o modificación de algunos de sus
    registros

    Clasificación. Reubicación de los
    registros de tal forma que queden ordenados según
    determinados criterios.

    Borrado. Eliminando total del archivo, dejando
    libre el espacio del soporte que ocupaba.

    3. – ORGANIZACIÓN DE LOS
    ARCHIVOS.

    Los archivos se encuentran organizados
    lógicamente como una secuencia de registros de varias
    longitudes diferentes.

    Los archivos de registros de longitud fija: son
    los que almacenan la información en los archivos mediante
    un encabezado y luego se introducen uno a uno los registros
    ubicados en posiciones consecutivas.

    Los registros de longitud variable: es el
    almacenamiento de registros de varios tipos en un archivo y
    permite uno o más campos de longitudes variables y
    dichos campos pueden ser repetidos. La longitud de los registros
    debe estar definida correctamente para poder leer y
    escribir de forma efectiva.

    3.1. – ENFOQUES
    GENERALES PARA LA
    ORGANIZACIÓN DE ARCHIVOS.

    Los enfoques son:

    1. – Enfoque de acceso secuencial: Se
    refiere al procesamiento de los archivos de acuerdo con el orden
    especifico. Ejemplo archivo secuenciales y de texto.

    2. – Enfoque de acceso Directo Permite recuperar
    registros individuales sin leer otros registros del archivo,
    ejemplos archivos indizados.

    3.2. – ARCHIVOS
    SECUENCIALES.

    Se refiere al procesamiento de los registros, no importa
    el orden en que se haga, para eso los registros están
    organizados en forma de una lista y recuperarlos y procesarlos
    uno por uno de principio a fin.

    Rudimentos de los archivos Secuenciales;
    dependiendo del dispositivo de almacenamiento utilizado el
    archivo se puede mostrar el usuario como si fuera un sistema
    secuencial.

    Al finalizar un archivo secuencial se denota con una
    marca de fin
    de archivo. (End end-of-file)

    El usuario de un archivo secuancial puede ver los
    registros en un orden secuancial simple.

    La única forma de recuperar registros es comenzar
    al principio y extraerlos en el orden contemplado.

    Cuestiones de programación; la manipulación de
    los archivos se hace en el contexto de la programación en un lenguaje por
    procedimientos
    de alto nivel. Estos lenguajes tienden a expresar la
    manipulación de archivos mediante subrutinas que se
    definen como parte del lenguaje formal o se incluyen como
    extensiones del lenguaje en una biblioteca
    estándar.

    La mayor parte de los lenguajes por procedimiento de
    alto nivel cuenta con características que ayudan a
    detectar la marca de fin de
    archivo.

    3.3. -ARCHIVOS DE
    TEXTO.

    También conocidos como (Slream File) son
    utilizados para almacenar documentos que
    consisten en texto; En ellos, cada registro es un solo
    símbolo o código
    de control.

    El leer estos archivos recibimos la información
    en orden secuencial en el que aparece cuando lo vemos en un
    monitor.

    Los archivos de texto son una secuencia de líneas
    separadas por marcas de fin de
    línea.

    Rudimentos de los archivos de textos; El usuario
    escribe los archivos de textos mediante un procesador de
    palabras que le permitirá almacenar la información
    pero no estrictamente en forma secuencial.

    El procesador
    también nos permite desplazarnos por todo el bloque de
    información y permitirnos realizar
    modificaciones.

    Mientras el usuario avance rápidamente en
    la lectura de
    registro lograra ver mas archivos.

    Cuestiones de programación; Casi todos los
    entornos de programación por procedimientos de
    alto nivel cuentan con subrutinas para manipular los archivos de
    texto.

    Estas subrutinas pueden formar parte de la
    definición formal del lenguaje o que se ofrezca en
    biblioteca
    como extensiones del mismo.

    3.4. – ARCHIVOS
    INDIZADOS.

    Es la aplicación de incluir índices en el
    almacenamiento de los archivos; de esta forma nos será
    más fácil buscar algún registro sin
    necesidad de ver todo el archivo.

    Un índice en un archivo consiste en un listado de
    los valores
    del campo clave que ocurren en el archivo, junto con la
    posición de registro correspondiente en el almacenamiento
    masivo.

    Fundamento de los Índices

    a.- La colocación de un listado al inicio del
    archivo: para la identificación del contenido.

    b.- La presentación de un segundo índice:
    para reflejar la información de cada punto principal del
    índice anterior.

    c.- La actualización de los índices:
    Cuando se insertan y eliminan archivos, es preciso actualizar los
    índices para evitar contratiempos actualizando un
    archivo.

    d.- La
    organización de un índice: Nos evita examinar
    archivo por archivo para recuperar algún registro buscado;
    por lo tanto ahorraríamos tiempo si tenemos una adecuado
    organización de los índices.

    Cuestiones de Programación

    Algunos lenguajes de alto nivel cuentan con
    subtítulos para manipular los archivos de un registro
    indizado.

    Valiéndose de las subrutinas es posible escribir
    programas sin tener que preocuparse por la estructura real del
    sistema de índices que se aplique.

    3.5. – ARCHIVOS
    DISPERSOS.

    También llamados (Hashed Files) representan un
    sistema de almacenamiento de archivos que solo ofrece acceso
    directo, y permiten calcular la posición de un registro en
    el almacenamiento masivo.

    Rudimentos de los archivos dispersos.

    El usuario debe dividir el área de almacenamiento
    asignando al archivo en varias secciones llamadas cubetas para
    poder ingresar
    los datos.

    La distribución de la información en
    las cubetas es problemática debido a que la estructura de
    los archivos es dispersa.

    Dentro de los archivos se presentan colisiones de
    información debido al agrupamiento de los registros
    ingresados.

    Cuestiones de programación.

    Casi ninguno de los lenguajes de
    programación por procedimientos en la actualidad
    ofrece implantaciones directas de archivos dispersos; esto es
    debido a las cuestiones dependientes de la aplicación
    implicadas en el diseño
    de estos archivos.

    4. -MEDIDAS DE
    UTILIZACIÓN DE LOS ARCHIVOS.

    Para utilizar un archivo debemos tener en
    cuenta:

    1. – Índice de Volatilidad; Un archivo es
    volátil cuando tiene un alto porcentaje de adiciones y
    supresiones debido al ingreso o eliminación de registros
    respecto al numero promedio de registros que haya en el
    archivo.

    2. – Índice de Actividad; Un archivo es
    activo cuando tiene un alto porcentaje de utilidad sea de
    actualización o consulta en un periodo de tiempo fijo
    respecto al numero promedio de registro que se encuentran en el
    archivo.

    El índice de actividad suele emplearse para saber
    si un archivo puede explotarse como una organización
    secuencial o relativa.

    Archivos de acceso directo (con tipo)

    Los archivos tipeados (con tipo), también
    llamados archivos binarios, contienen datos de tipo simple
    o estructurado, tales como integer, real , record, etc., excepto
    otro tipo de archivos.

    Los archivos con tipos están estructurados en
    elementos o registros (record) cuyo tipo puede ser cualquiera. A
    los elementos de estos archivos se accede directamente, al no
    situarse éstos en posiciones físicamente
    consecutivas, sino en posiciones lógicas. Esta es la
    razón por la cual se les denomina archivos de acceso
    aleatorio o directo
    . Los elementos de los archivos aleatorios
    son de igual tamaño y el término acceso directo
    significa que es posible acceder directamente a un elemento con
    solo especificar su posición

    5. –
    DEFINICIONES.

    Los más utilizados en el desarrollo del
    tema son:

    Archivo (Fichero):

    Conjunto de información estructurada en unidades
    de acceso denominada registro.

    Registros.

    Estructura de datos formada por uno o más
    elementos denominados "Campos" y estos pueden estar compuestos a
    su vez por "subcampos".

    Claves:

    Se denomina a un campo especial del registro que sirve
    para identificarlo

    Bloque:

    Es la cantidad de información que se transfiere
    en cada operación de lectura o
    escritura
    sobre un archivo.

    Campo:

    Es cada uno de los diferentes datos que constituyen un
    registro lógico.

    BIBLIOGRAFIA

    1.- Estructura de
    Datos en Pascal, Autor
    Aarón M. Tenenbaum, Moshe J. Augentein. Primera
    edición.

    2.- Diseño
    y Administración de Base de Datos
    Gary W. Hansen, James V. Hansen, Segunda
    Edición.

    3.- Guía de Estructura y Procesamiento de
    Datos Profesor David López, Segundo semestre U.N.I.R.
    (Maracaibo).

    4.-

    5.- http://www2.ing.puc.cl/iic1102/materia/cap10.htm

    6.-
    http://www.uady.mx/sitios/matemati/enlinea/admin_arch/materiales/material1.html

    7.-
    http://coqui.lce.org/cadiaz/CEDU5120V/Contenido/ArchExt.htm

    8.-
    http://www.itlp.edu.mx/publica/tutoriales/pascal/u8_8_8.html

     

     

    Autor:

    Lisbeth Camacho

    lcamachog[arroba]yahoo.com

    Nota al lector: es posible que esta página no contenga todos los componentes del trabajo original (pies de página, avanzadas formulas matemáticas, esquemas o tablas complejas, etc.). Recuerde que para ver el trabajo en su versión original completa, puede descargarlo desde el menú superior.

    Todos los documentos disponibles en este sitio expresan los puntos de vista de sus respectivos autores y no de Monografias.com. El objetivo de Monografias.com es poner el conocimiento a disposición de toda su comunidad. Queda bajo la responsabilidad de cada lector el eventual uso que se le de a esta información. Asimismo, es obligatoria la cita del autor del contenido y de Monografias.com como fuentes de información.

    Categorias
    Newsletter