INDICE:
QUE SON ARCHIVOS
INTRODUCCIÓN A LOS
ARCHIVOS
CARACTERÍSTICAS
CLASIFICACION
TIPOS DE ARCHIVOS
SEGÚN SU
FUNCION
SEGÚN SUS
ELEMENTOS
ACCESO A LOS ARCHIVOS
TIPOS DE ACCESO A LOS
ARCHIVOS
OPERACIONES GENERALES QUE SE REALIZAN SOBRE UN
ARCHIVO.
ORGANIZACIÓN DE LOS
ARCHIVOS.
ENFOQUES GENERALES PARA LA ORGANIZACIÓN DE
ARCHIVOS
ARCHIVOS SECUENCIALES
ARCHIVOS DE
TEXTO
ARCHIVOS
INDIZADOS
ARCHIVOS DISPERSOS.
MEDIDAS DE UTILIZACIÓN DE LOS
ARCHIVOS
DEFINICIONES.
BIBLIOGRAFIA
1. – QUE SON
ARCHIVOS.
Los archivos
también denominados ficheros (file); es una
colección de información (datos
relacionados entre sí), localizada o almacenada como una
unidad en alguna parte de la
computadora.
Los archivos son el conjunto organizado de informaciones
del mismo tipo, que pueden utilizarse en un mismo tratamiento;
como soporte material de estas informaciones.
1.1. – INTRODUCCIÓN A LOS
ARCHIVOS.
Los archivos como colección de datos sirve para
la entrada y salida a la computadora y
son manejados con programas.
Los archivos pueden ser contrastados con Arrays y
registros; Lo
que resulta dinámico y por esto en un registro se deben
especificar los campos, él número de elementos de
un arrays (o arreglo), el número de caracteres en una
cadena; por esto se denotan como "Estructuras
Estáticas".
En los archivos no se requiere de un tamaño
predeterminado; esto significa que se pueden hacer archivos de
datos más grandes o pequeños, según se
necesiten.
Cada archivo es
referenciado por su identificador (su nombre.).
1.2. – CARACTERÍSTICAS DE LOS
ARCHIVOS
Las principales características de esta estructura
son:
Independencia de las informaciones respecto de los
programas
La información almacenada es
permanente
Un archivo puede ser
accedido por distintos programas en
distintos momentos
Gran capacidad de almacenamiento.
1.3. – CLASIFICACION
DE LOS ARCHIVOS
Los archivos se clasifican según su uso en tres
grupos:
Permanentes o Maestros:
Estos contienen información que varia poco. En
algunos casos es preciso actualizarlos
periódicamente.
De Movimientos
Se cercan para actualizar los archivos maestros. Sus
registros son
de tres tipos: alta, bajas y modificaciones.
De Maniobra o Trabajo.
Tienen una vida limitada, normalmente menor que la
duración de la ejecución de un programa. Su
utilizan como auxiliares de los anteriores.
Los elementos de un archivo pueden ser de cualquier
tipo, simples o estructurados o según su función.
Se define por:
a.- Archivos Permanentes:
Son aquellos cuyo registros sufren pocas o ninguna
variación a lo largo del tiempo, se
dividen en:
Constantes: Están formados por registros
que contienen campos fijos y campos de baja frecuencia de
variación en el tiempo.
De Situación: Son los que en cada momento
contienen información actualizada.
Históricos: Contienen información
acumulada a lo largo del tiempo de archivos que han sufridos
procesos de
actualización o bien acumulan datos de variación
periódica en el tiempo.
b.- Archivos de Movimiento
Son aquellos que se utilizan conjuntamente con los
maestros (constantes), y contienen algún campo
común en sus registros con aquellos, para el procesamiento
de las modificaciones experimentados por los mismos.
c.- Archivo de Maniobra o Transitorio
Son los archivos creados auxiliares creados durante la
ejecución del programa y
borrados habitualmente al terminar el mismo.
Los principales archivos de este tipo son:
Archivo de Entrada: Una colección de datos
localizados en un dispositivo de entrada.
Archivo de Salida: Una colección de
información visualizada por la
computadora.
Constantes: están formados por registros
que contienen campos fijos y campos de baja frecuencia de
variación en el tiempo.
De Situación: son los que en cada momento
contienen información actualizada.
Históricos: Contienen información
acumulada a lo largo del tiempo de archivos que han sufrido
procesos de
actualización, o bien acumulan datos de variación
periódica en el tiempo.
Archivos de Movimiento o
Transacciones: Son aquellos que se utilizan conjuntamente con
los maestros (constantes), y contienen algún campo
común en sus registros con aquellos, para el procesamiento
de las modificaciones experimentados por los mismos.
Archivos de Maniobra o Transitorios: Son los
archivos auxiliares creados durante la ejecución del
programa y borrados habitualmente al terminar el
mismo.
– SEGÚN SUS
ELEMENTOS
Los principales archivos de este tipo son:
Archivo de Entrada, una colección de datos
localizada en un dispositivo de entrada.
Archivo de Salida, una colección de
información visualizada por la computadora.
Archivo de Programa, un programa codificado en un
lenguaje
especifico y localizado o almacenado en un dispositivo de
almacenamiento.
Archivo de Texto, una colección de
caracteres almacenados como una unidad en un dispositivo de
almacenamiento.
Se refiere al método
utilizado para acceder a los registros de un archivo
prescindiendo de su organización. Existen distintas formas de
acceder a los datos:
Secuenciales; los registros se leen desde el
principio hasta el final del archivo, de tal forma que para leer
un registro se
leen todos los que preceden.
Directo; cada registro puede leerse / escribirse
de forma directa solo con expresar su dirección en el fichero por él
numero relativo del registro o por transformaciones de la clave
de registro en él numero relativo del registro a
acceder.
Por Índice; se accede indirectamente a los
registros por su clave, mediante consulta secuenciales a una
tabla que contiene la clave y la dirección relativa de cada registro, y
posterior acceso directo al registro.
Dinámico; es cuando se accede a los
archivos en cualquier de los modos anteriormente
citados.
La elección del método
esta directamente relacionada con la estructura de
los registros del archivo y del soporte utilizado.
Acceso Secuencial. Exige el tratamiento de
elemento, para esto es necesario una exploración
secuencial comenzando desde el primer momento (Pascal permite
este acceso)
Secuenciales: archivo de texto que debe
ser leído del principio hasta el final.
Acceso Directo. Permite procesar o acceder a un
elemento determinado y referencia directamente por su
posición en el soporte de almacenamiento (Turbo Pascal
permite este acceso.
Aleatorios: es un archivo con registros de
un mismo largo. Un programa puede accesar directamente
cualquier registro sin tener que leer los registros
previos.
Binarios: es un archivo que lee byte por
byte sin asumir ninguna estructura.
Los archivos Binarios no son un nuevo tipo de archivo, pero si
una nueva forma de manipular cualquier tipo de archivo. Las
técnicas de archivo binarios permiten leer
o cambiar cualquier byte de un archivo. Son herramientas
extremadamente potentes, pero como toda herramienta potente debe
manejarse con cuidado
Entre otras características, a las técnicas
de archivo binario no les preocupa los caracteres EOF
intercalados (Control+Z =
Chr$(26)) que pueda tener un archivo.
Ejemplo Open NombreArchivo for Binary as
#NumeroArchivo.
Instrucciones para manejar archivos
OPEN: reserva un espacio del buffer para la
data que moverá entre el programa y los archivos. La
estructura es:
OPEN filespec FOR
{Append|Binary|Input|Outuput|Random} As #filenumber
Por ejemplo:
OPEN "C:WindowsAddrBook.ini" FOR Input As #1
Filespec: Es la localización de archivo en
el que se trabajará, incluyendo usualmente el drive y
path.
"C:WindowsAddrBook.ini"
{Append| Binary| Input| Outuput| Random} El
programador tiene que seleccionar uno. Binary y Random se
utiliza para archivos binarios y aleatorios. Append, Input
y Output son usados con archivos secuenciales. Un archivo
secuencial no puede ser abierto para leer y escribir
simultaneamente. Output es usado para escribir en el
archivo. Input es usado para leer del archivo. Append
es usado para colocar data al final de un archivo
exitente.
#filenumber: es necesario asignar un número
al archivo. El número puede estar en el rango de #1
a #511 y es usado por Visual Basic para
identificar el archivo.
CLOSE: para cerrar un archivo. La
estructura es:
CLOSE
#filenumber
Por ejemplo:
CLOSE #1
WRITE: envia data del programa al archivo
secuencial. La estructura es:
WRITE #filenumber,
[OutputList]
Por ejemplo:
WRITE #1, UserName,
UserCompany, SerialNumber
WRITE es la operación opuesta al
INPUT. Las expresiones en el OutputList son
separadas por comas. WRITE inserta comillas y comas
a la data que envia al archivo.
INPUT: lee data del archivo. La
estructura es:
INPUT #filenumber,
InputList
Por ejemplo:
INPUT #1, UserName,
UserCompany, SerialNumber
Declaración y asignación de
archivos
La declaración de un archivo con tipo se
efectúa con la ayuda de las palabras reservadas file
of.
El procedimiento de
asignación es idéntico al utilizado
anteriormente.
Ejemplo:
Type
datos = record
clave : integer;
nombre : string[30];
puesto : string[20];
sueldo : real;
estado : boolean;
{true activo,false baja
lógica}
end;
Var
archivo:file of datos;
begin
Assign(archivo,'empleado.dat');
SISTEMA DE MANEJO DE ARCHIVOS.
Tiene las siguientes funciones:
Controla los datos en almacenamiento secundario [
]
Proporciona al usuario una abstracción de
cómo se manipulan los datos internamente. [ ]
Proporciona independencia
de E/S con los dispositivos [ ]
Soporte de compartición, protección,
recuperación de archivos y posibles caídas del
sistema. [
]
Transmisión de datos de memoria principal
a secundaria.[ ]
Los archivos de una empresa
pueden almacenarse en diferentes dispositivos. Todos los archivos
se pueden almacenar por medio de directorios, que no son
otra cosa más que tablas de símbolos de archivo,
los directorios se pueden utilizar de dos formas:
DIRECTORIO DE NIVEL ÚNICO O DIRECTORIO
PLANO
Con este método, se almacenan todos los
archivos en un solo nivel, este método en sistemas donde el
volumen de
archivos no es grande.[ ]
DIRECTORIO JERARQUICO
Los archivos son almacenados por medio de
directorios, esta clasificación se de acuerdo a la
conveniencia del usuario o de la empresa. [ ]
.La estructura tiene una forma de árbol con raíz,
este método es el más utilizado debido a que la
revisión o búsqueda se realiza de forma
sencilla.
Para accesar a los archivos que se almacenan en un
sistema
jerárquico, el usuario debe indicar el o los directorios
que se deben recorrer para localizar el archivo deseado, a esto
se le denomina ruta de acceso del archivo. La ruta de
acceso puede ser de dos formas:
Ruta absoluta.- Este tipo de ruta de acceso
inicia siempre con una diagonal invertida [ ]
C:Edit c:SOSsistemasreport.txt
Ruta relativa.- Este tipo de ruta de acceso
realiza la búsqueda del archivo en el directorio de
trabajo actual, si el archivo no se localiza aquí, el S.O.
lo buscará en los directorios especificados en el PATH de
un archivo con extensión .BAT.
C:Edit report.txt
2.2. – OPERACIONES
GENERALES QUE SE REALIZAN SOBRE UN
ARCHIVO.
Las operaciones
generales que se realizan son:
Creación. Escritura de
todos sus registros.
Consulta. Lectura de
todos sus registros.
Actualización. Inserción
supresión o modificación de algunos de sus
registros
Clasificación. Reubicación de los
registros de tal forma que queden ordenados según
determinados criterios.
Borrado. Eliminando total del archivo, dejando
libre el espacio del soporte que ocupaba.
3. – ORGANIZACIÓN DE LOS
ARCHIVOS.
Los archivos se encuentran organizados
lógicamente como una secuencia de registros de varias
longitudes diferentes.
Los archivos de registros de longitud fija: son
los que almacenan la información en los archivos mediante
un encabezado y luego se introducen uno a uno los registros
ubicados en posiciones consecutivas.
Los registros de longitud variable: es el
almacenamiento de registros de varios tipos en un archivo y
permite uno o más campos de longitudes variables y
dichos campos pueden ser repetidos. La longitud de los registros
debe estar definida correctamente para poder leer y
escribir de forma efectiva.
3.1. – ENFOQUES
GENERALES PARA LA
ORGANIZACIÓN DE ARCHIVOS.
Los enfoques son:
1. – Enfoque de acceso secuencial: Se
refiere al procesamiento de los archivos de acuerdo con el orden
especifico. Ejemplo archivo secuenciales y de texto.
2. – Enfoque de acceso Directo Permite recuperar
registros individuales sin leer otros registros del archivo,
ejemplos archivos indizados.
Se refiere al procesamiento de los registros, no importa
el orden en que se haga, para eso los registros están
organizados en forma de una lista y recuperarlos y procesarlos
uno por uno de principio a fin.
Rudimentos de los archivos Secuenciales;
dependiendo del dispositivo de almacenamiento utilizado el
archivo se puede mostrar el usuario como si fuera un sistema
secuencial.
Al finalizar un archivo secuencial se denota con una
marca de fin
de archivo. (End end-of-file)
El usuario de un archivo secuancial puede ver los
registros en un orden secuancial simple.
La única forma de recuperar registros es comenzar
al principio y extraerlos en el orden contemplado.
Cuestiones de programación; la manipulación de
los archivos se hace en el contexto de la programación en un lenguaje por
procedimientos
de alto nivel. Estos lenguajes tienden a expresar la
manipulación de archivos mediante subrutinas que se
definen como parte del lenguaje formal o se incluyen como
extensiones del lenguaje en una biblioteca
estándar.
La mayor parte de los lenguajes por procedimiento de
alto nivel cuenta con características que ayudan a
detectar la marca de fin de
archivo.
También conocidos como (Slream File) son
utilizados para almacenar documentos que
consisten en texto; En ellos, cada registro es un solo
símbolo o código
de control.
El leer estos archivos recibimos la información
en orden secuencial en el que aparece cuando lo vemos en un
monitor.
Los archivos de texto son una secuencia de líneas
separadas por marcas de fin de
línea.
Rudimentos de los archivos de textos; El usuario
escribe los archivos de textos mediante un procesador de
palabras que le permitirá almacenar la información
pero no estrictamente en forma secuencial.
El procesador
también nos permite desplazarnos por todo el bloque de
información y permitirnos realizar
modificaciones.
Mientras el usuario avance rápidamente en
la lectura de
registro lograra ver mas archivos.
Cuestiones de programación; Casi todos los
entornos de programación por procedimientos de
alto nivel cuentan con subrutinas para manipular los archivos de
texto.
Estas subrutinas pueden formar parte de la
definición formal del lenguaje o que se ofrezca en
biblioteca
como extensiones del mismo.
Es la aplicación de incluir índices en el
almacenamiento de los archivos; de esta forma nos será
más fácil buscar algún registro sin
necesidad de ver todo el archivo.
Un índice en un archivo consiste en un listado de
los valores
del campo clave que ocurren en el archivo, junto con la
posición de registro correspondiente en el almacenamiento
masivo.
Fundamento de los Índices
a.- La colocación de un listado al inicio del
archivo: para la identificación del contenido.
b.- La presentación de un segundo índice:
para reflejar la información de cada punto principal del
índice anterior.
c.- La actualización de los índices:
Cuando se insertan y eliminan archivos, es preciso actualizar los
índices para evitar contratiempos actualizando un
archivo.
d.- La
organización de un índice: Nos evita examinar
archivo por archivo para recuperar algún registro buscado;
por lo tanto ahorraríamos tiempo si tenemos una adecuado
organización de los índices.
Cuestiones de Programación
Algunos lenguajes de alto nivel cuentan con
subtítulos para manipular los archivos de un registro
indizado.
Valiéndose de las subrutinas es posible escribir
programas sin tener que preocuparse por la estructura real del
sistema de índices que se aplique.
También llamados (Hashed Files) representan un
sistema de almacenamiento de archivos que solo ofrece acceso
directo, y permiten calcular la posición de un registro en
el almacenamiento masivo.
Rudimentos de los archivos dispersos.
El usuario debe dividir el área de almacenamiento
asignando al archivo en varias secciones llamadas cubetas para
poder ingresar
los datos.
La distribución de la información en
las cubetas es problemática debido a que la estructura de
los archivos es dispersa.
Dentro de los archivos se presentan colisiones de
información debido al agrupamiento de los registros
ingresados.
Cuestiones de programación.
Casi ninguno de los lenguajes de
programación por procedimientos en la actualidad
ofrece implantaciones directas de archivos dispersos; esto es
debido a las cuestiones dependientes de la aplicación
implicadas en el diseño
de estos archivos.
4. -MEDIDAS DE
UTILIZACIÓN DE LOS ARCHIVOS.
Para utilizar un archivo debemos tener en
cuenta:
1. – Índice de Volatilidad; Un archivo es
volátil cuando tiene un alto porcentaje de adiciones y
supresiones debido al ingreso o eliminación de registros
respecto al numero promedio de registros que haya en el
archivo.
2. – Índice de Actividad; Un archivo es
activo cuando tiene un alto porcentaje de utilidad sea de
actualización o consulta en un periodo de tiempo fijo
respecto al numero promedio de registro que se encuentran en el
archivo.
El índice de actividad suele emplearse para saber
si un archivo puede explotarse como una organización
secuencial o relativa.
Archivos de acceso directo (con tipo)
Los archivos tipeados (con tipo), también
llamados archivos binarios, contienen datos de tipo simple
o estructurado, tales como integer, real , record, etc., excepto
otro tipo de archivos.
Los archivos con tipos están estructurados en
elementos o registros (record) cuyo tipo puede ser cualquiera. A
los elementos de estos archivos se accede directamente, al no
situarse éstos en posiciones físicamente
consecutivas, sino en posiciones lógicas. Esta es la
razón por la cual se les denomina archivos de acceso
aleatorio o directo. Los elementos de los archivos aleatorios
son de igual tamaño y el término acceso directo
significa que es posible acceder directamente a un elemento con
solo especificar su posición
Los más utilizados en el desarrollo del
tema son:
Archivo (Fichero):
Conjunto de información estructurada en unidades
de acceso denominada registro.
Registros.
Estructura de datos formada por uno o más
elementos denominados "Campos" y estos pueden estar compuestos a
su vez por "subcampos".
Claves:
Se denomina a un campo especial del registro que sirve
para identificarlo
Bloque:
Es la cantidad de información que se transfiere
en cada operación de lectura o
escritura
sobre un archivo.
Campo:
Es cada uno de los diferentes datos que constituyen un
registro lógico.
1.- Estructura de
Datos en Pascal, Autor
Aarón M. Tenenbaum, Moshe J. Augentein. Primera
edición.
2.- Diseño
y Administración de Base de Datos
Gary W. Hansen, James V. Hansen, Segunda
Edición.
3.- Guía de Estructura y Procesamiento de
Datos Profesor David López, Segundo semestre U.N.I.R.
(Maracaibo).
4.-
5.- http://www2.ing.puc.cl/iic1102/materia/cap10.htm
6.-
http://www.uady.mx/sitios/matemati/enlinea/admin_arch/materiales/material1.html
7.-
http://coqui.lce.org/cadiaz/CEDU5120V/Contenido/ArchExt.htm
8.-
http://www.itlp.edu.mx/publica/tutoriales/pascal/u8_8_8.html
Autor:
Lisbeth Camacho
lcamachog[arroba]yahoo.com