Monografias.com > Computación > Programación
Descargar Imprimir Comentar Ver trabajos relacionados

Diseño de bases de datos



    1. Diseño de Bases de
      Datos
    2. Objetivos del diseño de
      bases de datos
    3. Conceptos
      importantes
    4. Conclusión
    5. Referencias

    INTRODUCCIÒN.

    Hoy en día las empresas manejan
    una gran cantidad de datos. Cualquier
    empresa que se
    precie debe tener almacenados todos estos datos en una base de datos
    para poder
    realizarlos mediante una aplicación profesional; sin esta
    funcionalidad resultaría imposible tratar y manejar en su
    totalidad los datos que leva a cabo la empresa y se
    perdería un tiempo y un
    dinero muy
    valiosos

    Uno de los pasos cruciales en la construcción de una aplicación que
    maneje una base de datos, es sin duda, el diseño
    de la base de datos.

    Si las tablas no son definidas apropiadamente, podemos
    tener muchos dolores de cabeza al momento de ejecutar consultas a
    la base de datos para tratar de obtener algún tipo de
    información.

    No importa si nuestra base de datos tiene sólo 20
    registros, o
    algunos cuantos miles, es importante asegurarnos que nuestra base
    de datos está correctamente diseñada para que tenga
    eficiencia y
    que se pueda seguir utilizando por largo del tiempo.

    En este artículo, se mencionarán algunos
    principios
    básicos del diseño de base de datos y se
    tratarán algunas reglas que se deben seguir cuando se
    crean bases de
    datos.

    Dependiendo de los requerimientos de la base de datos,
    el diseño puede ser algo complejo, pero con algunas reglas
    simples que tengamos en la cabeza será mucho más
    fácil crear una base de datos perfecta para nuestro
    siguiente proyecto.

    Diseño de Bases de
    Datos

    Son muchas las consideraciones a tomar en cuenta al
    momento de hacer el diseño de la base de datos,
    quizá las más fuertes sean:

    • La velocidad de
      acceso,
    • El tamaño de la
      información,
    • El tipo de la información,
    • Facilidad de acceso a la
      información,
    • Facilidad para extraer la información
      requerida,
    • El comportamiento del manejador de bases de datos
      con cada tipo de información.

    No obstante que pueden desarrollarse sistemas de
    procesamiento de archivo e incluso
    manejadores de bases de datos basándose en la experiencia
    del equipo de desarrollo de
    software logrando
    resultados altamente aceptables, siempre es recomendable la
    utilización de determinados estándares de
    diseño que garantizan el nivel de eficiencia mas alto en
    lo que se refiere a almacenamiento y
    recuperación de la información.

    De igual manera se obtiene modelos que
    optimizan el aprovechamiento secundario y la sencillez y
    flexibilidad en las consultas que pueden proporcionarse al
    usuario.

    OBJETIVOS DEL
    DISEÑO DE BASES DE DATOS

    Entre las metas más importantes
    que se persiguen al diseñar un modelo de
    bases de datos, se encuentran las siguientes que pueden
    observarse en esta figura.

     

    1. Almacenar Solo La Información
      Necesaria.

    A menudo pensamos en todo lo que quisiéramos que
    estuviera almacenado en una base de datos y diseñamos la
    base de datos para guardar dichos datos. Debemos de ser realistas
    acerca de nuestras necesidades y decidir qué
    información es realmente necesaria.

    Frecuentemente podemos generar algunos datos sobre la
    marcha sin tener que almacenarlos en una tabla de una base de
    datos. En estos casos también tiene sentido hacer esto
    desde el punto de vista del desarrollo de la
    aplicación.

    1.2. Normalizar la Estructura de
    las Tablas.

    Si nunca antes hemos oído
    hablar de la "normalización de datos", no debemos temer.
    Mientras que la normalización puede parecer un tema
    complicado, nos podemos beneficiar ampliamente al entender los
    conceptos más elementales de la
    normalización.

    Una de las formas más fáciles de entender
    esto es pensar en nuestras tablas como hojas de
    cálculo. Por ejemplo, si quisiéramos seguir la
    pista de nuestra colección de CD’s en
    una hoja de
    cálculo, podríamos diseñar algo parecido
    a lo que se muestra en la
    siguiente tabla.

     

    +————+————-+————–+ ..
    +————–+

    | Álbum | track1 | track2 | | track10
    |

    +————+————-+————–+ ..
    +————–+

    Esto parece razonable. Sin embargo el problema es que el
    número de pistas que tiene un CD varía bastante.
    Esto significa que con este método
    tendríamos que tener una hoja de cálculo
    realmente grande para albergar todos los datos, que en los peores
    casos podrían ser de hasta 20 pistas. Esto en definitiva
    no es nada bueno.

    Uno de los objetivos de
    una estructura de tabla normalizada es minimizar el número
    de "celdas vacías". El darnos cuenta de que cada lista de
    CD’s tiene un conjunto fijo de campos (título,
    artista, año, género) y
    un conjunto variable de atributos (el número de pistas)
    nos da una idea de cómo dividir los datos en
    múltiples tablas que luego podamos relacionar entre
    sí.

    Mucha gente no esta familiarizada con el concepto
    "relacional", de manera sencilla esto significa, que grupos parecidos
    de información son almacenados en distintas tablas que
    luego pueden ser "juntadas" (relacionadas) basándose en
    los datos que tengan en común.

    Es necesario que al realizar la estructura de una base
    de datos, esta sea flexible. La flexibilidad está en el
    hecho que podemos agregar datos al sistema
    posteriormente sin tener que rescribir lo que ya tenemos. Por
    ejemplo, si quisiéramos agregar la información de
    los artistas de cada álbum, lo único que tenemos
    que hacer es crear una tabla artista que esté relacionada
    a la tabla álbum de la misma manera que la tabla pista.
    Por lo tanto, no tendremos que modificar la estructura de
    nuestras tablas actuales, simplemente agregar la que hace
    falta.

    La eficiencia se refiere al hecho de que no tenemos
    duplicación de datos, y tampoco tenemos grandes cantidades
    de "celdas vacías".

    El objetivo
    principal del diseño de bases de datos es generar tablas
    que modelan los registros en los que guardaremos nuestra
    información.

    Es importante que esta información se almacene
    sin redundancia para que se pueda tener una recuperación
    rápida y eficiente de los datos.

    A través de la normalización tratamos de
    evitar ciertos defectos que nos conduzcan a un mal diseño
    y que lleven a un procesamiento menos eficaz de los
    datos.

    Podríamos decir que estos son los principales
    objetivos de la normalización:

    • Controlar la redundancia de la
      información.
    • Evitar pérdidas de
      información.
    • Capacidad para representar toda la
      información.
    • Mantener la consistencia de los datos.
    1. Seleccionar el Tipo de Dato
      Adecuado.

    Una vez identificadas todas las tablas y columnas que
    necesita la base de datos, debemos determinar el tipo de dato de
    cada campo. Existen tres categorías principales que pueden
    aplicarse prácticamente a cualquier aplicación de
    bases de datos:

    • Texto
    • Números
    • Fecha y hora

    Cada uno de éstos presenta sus propias variantes,
    por lo que la elección del tipo de dato correcto no
    sólo influye en el tipo de información que se puede
    almacenar en cada campo, sino que afecta al rendimiento global de
    la base de datos.

    A continuación se dan algunos consejos que nos
    ayudarán a elegir un tipo de dato adecuado para nuestras
    tablas:

    • Identificar si una columna debe ser de tipo texto,
      numérico o de fecha.
    • Elegir el subtipo más apropiado para cada
      columna.
    • Configurar la longitud máxima para las
      columnas de texto y numéricas, así como otros
      atributos.

    1.4. Utilizar Índices
    Apropiadamente

    Los índices son un sistema especial que utilizan
    las bases de datos para mejorar su rendimiento global. Dado que
    los índices hacen que las consultas se ejecuten más
    rápido, podemos estar incitados a indexar todas las
    columnas de nuestras tablas.

    Sin embargo, lo que tenemos que saber es que el usar
    índices tiene un precio. Cada
    vez que hacemos un INSERT, UPDATE, REPLACE, o DELETE sobre una
    tabla, MySQL tiene
    que actualizar cualquier índice en la tabla para reflejar
    los cambios en los datos.

    ¿Así que, cómo decidimos usar
    índices o no? La respuesta es "depende". De manera simple,
    depende que tipo de consultas ejecutamos y que tan frecuentemente
    lo hacemos, aunque realmente depende de muchas otras
    cosas.

    Así que antes de indexar una columna, debemos
    considerar que porcentaje de entradas en la tabla son duplicadas.
    Si el porcentaje es demasiado alto, seguramente no veremos alguna
    mejora con el uso de un índice. Ante la duda, no tenemos
    otra alternativa que probar.

    1.5. Usar Consultas REPLACE

    Existen ocasiones en las que deseamos insertar un
    registro a
    menos de que éste ya se encuentre en la tabla. Si el
    registro ya existe, lo que quisiéramos hacer es una
    actualización de los datos.

    1.6. Usar Una Versión Reciente de
    MySQL

    La recomendación es simple y concreta, siempre
    que esté en nuestras manos, debemos usar la versión
    más reciente de MySQL que se encuentre disponible.
    Además de que las nuevas versiones frecuentemente incluyen
    muchas mejoras, cada vez son más estables y más
    rápidas. De esta manera, a la vez que sacamos provecho de
    las nuevas características incorporadas en MySQL, veremos
    significativos incrementos en la eficiencia de nuestro servidor de bases
    de datos.

    1.8. Usar Tablas Temporales.

    Cuando estamos trabajando con tablas muy grandes, suele
    suceder que ocasionalmente necesitemos ejecutar algunas consultas
    sobre un pequeño subconjunto de una gran cantidad de
    datos. En vez de ejecutar estas consultas sobre la tabla completa
    y hacer que MySQL encuentre cada vez los pocos registros que
    necesitamos, puede ser mucho más rápido seleccionar
    dichos registros en una tabla temporal y entonces ejecutar
    nuestras consultas sobre esta tabla.

    Una tabla temporal existe mientras dure la
    conexión a MySQL. Cuando se interrumpe la conexión
    MySQL remueve automáticamente la tabla y libera el espacio
    que ésta usaba.

    1.7. Recomendaciones.

    El último paso del diseño de la base de
    datos es adoptar determinadas convenciones de nombres. Aunque
    MySQL es muy flexible en cuanto a la forma de asignar nombre a
    las bases de datos, tablas y columnas, he aquí algunas
    reglas que es conveniente observar:

    • Utilizar caracteres alfanuméricos.
    • Limitar los nombres a menos de 64 caracteres (es una
      restricción de MySQL).
    • Utilizar el guión bajo (_) para separar
      palabras.
    • Utilizar palabras en minúsculas (esto es
      más una preferencia personal que
      una regla).
    • Los nombres de las tablas deberían ir en
      plural y los nombres de las columnas en singular (es igual una
      preferencia personal).
    • Utilizar las letras ID en las columnas de clave
      primaria y foránea.
    • En una tabla, colocar primero la clave primaria
      seguida de las claves foráneas.
    • Los nombres de los campos deben ser descriptivos de
      su contenido.
    • Los nombres de los campos deben ser unívocos
      entre tablas, excepción hecha de las claves.

    Los puntos anteriores corresponden muchos de ellos a
    preferencias personales, más que a reglas que debamos de
    cumplir, y en consecuencia muchos de ellos pueden ser pasados por
    alto, sin embargo, lo más importante es que la nomenclatura
    utilizada en nuestras bases de datos sea coherente y consistente
    con el fin de minimizar la posibilidad de errores al momento de
    crear una aplicación de bases de datos.

    CONCEPTOS
    IMPORTANTES

    1. Base de Datos.- Cualquier conjunto de datos
      organizados para su almacenamiento en la memoria
      de un ordenador o computadora,
      diseñado para facilitar su mantenimiento y acceso de una forma
      estándar. Los datos suelen aparecer en forma de texto,
      números o gráficos. Hay cuatro modelos principales
      de bases de datos: el modelo jerárquico, el modelo en
      red, el modelo
      relacional (el más extendido hoy en
      día).
    2. Base de Datos Relacional.- Tipo de base de
      datos o sistema de administración de bases de datos, que
      almacena información en tablas (filas y columnas de
      datos) y realiza búsquedas utilizando los datos de
      columnas especificadas de una tabla para encontrar datos
      adicionales en otra tabla.
    3. Datos Elementales.- Un dato elemental, tal
      como indica su nombre, es una pieza elemental de
      información. El primer paso en el diseño de una
      base de datos debe ser un análisis detallado y exhaustivo de los
      datos elementales requeridos.
    4. Campos y Subcampos.- Los datos elementales
      pueden ser almacenados en campos o en subcampos. Un campo es
      identificado por un rótulo numérico que se define
      en la FDT de la base de datos. A diferencia de los campos, los
      subcampos no se identifican por medio de un rótulo, sino
      por un delimitador de subcampo.
    5. Delimitador de Subcampo.- Un delimitador de
      subcampo es un código de dos caracteres que precede e
      identifica un subcampo de longitud variable dentro de un
      campo.
    6. DBMS: Data Base Management System (SISTEMA DE MANEJO
      DE BASE DE DATOS).-
      Consiste de una base de datos y un
      conjunto de aplicaciones (programas)
      para tener acceso a ellos.

      à Errores
      que se pueden encontrar en el diseño de una base de
      datos:

    7. Modelo de Datos.– es un conjunto de herramientas
      conceptuales para describir los datos, las relaciones entre
      ellos, su semántica y sus limitantes.
    8. Redundancia.- Esta se presenta cuando se
      repiten innecesariamente datos en los archivos que
      conforman la base de datos.
    9. Inconsistencia.- Ocurre cuando existe
      información contradictoria o incongruente en la base de
      datos.
    10. Dificultad en el Acceso a los Datos.- Debido a
      que los sistemas de procesamiento de archivos generalmente se
      conforman en distintos tiempos o épocas y ocasionalmente
      por distintos programadores, el formato de la
      información no es uniforme y se requiere de establecer
      métodos
      de enlace y conversión para combinar datos contenidos en
      distintos archivos.
    11. Aislamiento de los Datos.- Se refiere a la
      dificultad de extender las aplicaciones que permitan controlar
      a la base de datos, como pueden ser, nuevos reportes,
      utilerías y demás debido a la diferencia de
      formatos en los archivos almacenados.
    12. Anomalías en el Acceso Concurrente.-
      Ocurre cuando el sistema es multiusuario y no se establecen los
      controles adecuados para sincronizar los procesos que
      afectan a la base de datos. Comúnmente se refiere a la
      poca o nula efectividad de los procedimientos
      de bloqueo.
    13. Problemas de Seguridad.- Se presentan cuando no es
      posible establecer claves de acceso y resguardo en forma
      uniforme para todo el sistema, facilitando así el
      acceso a intrusos.

      à Niveles de
      Diseño:

    14. Problemas de Integridad.- Ocurre cuando no
      existe a través de todo el sistema procedimientos
      uniformes de validación para los datos.
    15. Nivel Físico.- Es aquel en el que se
      determinan las características de almacenamiento en el
      medio secundario. Los diseñadores de este nivel poseen
      un amplio dominio de
      cuestiones técnicas
      y de manejo de hardware.
    16. Nivel Conceptual.- Es aquel en el que se definen
      las estructuras lógicas de
      almacenamiento y las relaciones que se darán entre
      ellas. Ejemplos comunes de este nivel son el diseño de
      los registros y las ligas que permitirán la
      conexión entre registros de un mismo archivo, de
      archivos distintos incluso, de ligas hacia archivos.

      à
      Clasificación de Modelos de Datos:

    17. Nivel de Edición.- Es aquel en el que se
      presenta al usuario final y que puede tener combinaciones o
      relaciones entre los datos que conforman a la base de datos
      global. Puede definirse como la forma en el que el usuario
      aprecia la información y sus relaciones.
    18. Modelos Lógicos Basados en Objetos.-
      Son aquellos que nos permiten una definición clara y
      concisa de los esquemas conceptuales y de visión. Su
      característica principal es que permiten definir en
      forma detallada las limitantes de los datos.
    19. Modelos Lógicos Basados en Registros.-
      Operan sobre niveles conceptual y de visión. Sus
      características principales son que permiten una
      descripción más amplia de la
      implantación, pero no son capaces de especificar con
      claridad las limitantes de los datos.
    20. Modelos Físicos de Datos.- Describen
      los datos en el nivel más bajo y permiten identificar
      algunos detalles de implantación para el manejo del
      hardware de almacenamiento.

    CONCLUSIÒN.

    La finalidad de este trabajo, es
    dar una inducción en el tema de Diseño de
    Bases de Datos, a personas ajenas al tema. De manera que por ello
    los temas se presentan de una manera sencilla y sin tanta
    terminología.

    Nos muestra la gran importancia que para cualquier
    entidad, ya sea una empresa
    grande o chica, para el gobierno, hasta
    para la vida cotidiana de una persona (como se
    muestra en el ejemplo de los CD’s), tienen las bases de
    datos. Todo gira alrededor de ellas, todos los procesos del mundo
    están registrados en ellas, de ahí la importancia
    de llevar a cabo un diseño eficiente y libre de errores de
    las mismas.

    Siempre que una persona escucha hablar de bases de datos
    y de toda la terminología que las acompaña piensa
    que es un tema excesivamente complicado, y no es así, todo
    tiene un porque y lógica,
    es cosa de familiarizarse un poco con ellas (bases de
    datos).

    Cuando se ven en realidad todas las ventajas que tienen,
    es mas sencillo el proceso de
    aprendizaje,
    ya que siente que el aprender a manejarlas se vera
    recompensado.

    Además de los sencillas que son, es muy
    fácil acceder a información, manuales y cursos
    relacionados a ellas, todo esta a la mano, con la facilidad de
    poner este tema en un buscador de la red y aparecerán
    infinidad de temas, unos mas complejos que otros, pero siempre
    uno que se adecue a las capacidades de aprendizaje de cada
    persona.

    Otro punto muy importante es que la mayoría son
    gratis.

    REFERENCIAS

    INTERNET.

    1.-
    wwww3.uji.es/~mmarques/f47/apun/node68.html.

    2.-
    ww.programacion.com/bbdd/articulo/bbdd_disenyo/

    3.- .http://www.cindoc.csic.es/isis/03-1.htm

    4.-
    http://faea.uncoma.edu.ar/materias/tdbd/

    5.- http://www.itlp.edu.mx/publica/tutoriales/basedat2/

    LIBROS:

    1.- Introducción a las
    Bases de Datos:
    THOMSON PARANINFO, S.A. 2005

    2.- Access: Los
    Mejores Trucos (Anaya Multimedia):

    Bluttman, Ken.

     

     

    Guillermo de Jesús Saldivar
    Vargas                

              

    ESCUELA: ITSON (Instituto Tecnológico de
    Sonora)

    FECHA: 29/NOVIEMBRE/2005

    Nota al lector: es posible que esta página no contenga todos los componentes del trabajo original (pies de página, avanzadas formulas matemáticas, esquemas o tablas complejas, etc.). Recuerde que para ver el trabajo en su versión original completa, puede descargarlo desde el menú superior.

    Todos los documentos disponibles en este sitio expresan los puntos de vista de sus respectivos autores y no de Monografias.com. El objetivo de Monografias.com es poner el conocimiento a disposición de toda su comunidad. Queda bajo la responsabilidad de cada lector el eventual uso que se le de a esta información. Asimismo, es obligatoria la cita del autor del contenido y de Monografias.com como fuentes de información.

    Categorias
    Newsletter