Análisis de los objetos y estructuras de almacenamiento de la información para diferentes SGBD
Contenido
2. Tipos de sistemas de información para la gestión de datos
3. Relación de estos elementos con tablas, vistas e índices
4. Consecuencias prácticas de seleccionar los diferentes objetos de almacenamiento
Los Sistemas de Gestión de Bases de Datos (SGBD) han evolucionado a partir de aplicaciones informáticas especializadas hasta convertirse en una parte primordial dentro de un sistema informático moderno. Como consecuencia de esta especialización el conocimiento acerca de las bases de datos forma parte esencial de la informática y las tecnologías de la información.
Una base de datos se define como:
Colección o depósito de datos integrados, almacenados en soporte secundario (no volátil) y con redundancia controlada. Los datos, que han de ser compartidos por diferentes usuarios y aplicaciones, deben mantenerse independientes de ellos, y su definición (estructura de la base de datos) única y almacenada junto con los datos, se ha de apoyar en un modelo de datos, el cual ha de permitir captar las interrelaciones y restricciones existentes en el mundo real. Los procedimientos de actualización y recuperación, comunes y bien determinados, facilitarán la seguridad del conjunto de los datos.
Piattini et al. (2006)
Un sistema de gestión de bases de datos comprenderá un conjunto de programas que van a permitir la creación, administración, funcionamiento, uso y mantenimiento de una base de datos.
En definitiva, un SGBD está formado por una colección de datos interrelacionados entre sí que constituyen la base de datos y un conjunto de programas mediante los cuales poder acceder y manipular dichos datos.
El objetivo primordial de un SGBD es proveer de una herramienta adecuada para extraer y almacenar la información contenida en la base de datos.
Los sistemas para el almacenamiento de información (bases de datos) pueden clasificarse en dos tipos:
Este tipo de sistemas puede representarse de manera esquemática mediante la siguiente figura:

Donde:


Actividades
1. Investigue y nombre algunas de las ventajas e inconvenientes que aportan los SGBD frente a los sistemas basados en ficheros.
2. Señale qué tipo de sistema de almacenamiento le parece mejor. Justifique su respuesta.
Las bases de datos están diseñadas para gestionar grandes cantidades de información. La gestión de esta información implica:
Los componentes principales de una base de datos son:

Actividades
3. Averigüe cuáles son las funciones del administrador de la base de datos.
Los SGBD almacenan la información de manera que ocultan algunos detalles respecto a la forma de almacenamiento y mantenimiento de los datos. Por otro lado, para poder trabajar con los datos y que cualquier usuario pueda acceder cómodamente, se han de extraer con facilidad, lo que ha llevado al diseño de formas complejas de representación de los datos a través de diversos niveles de abstracción que simplifican la interacción con el sistema.

Importante
Un objetivo importante de los SGBD es proporcionar a los usuarios una visión abstracta de los datos.
En los sistemas de información se pueden observar dos estructuras distintas: la lógica y la física. La lógica es la que ve el usuario y la física es la forma en la que se almacenan los datos.
En los sistemas de gestión de bases de datos aparece un nuevo nivel denominado nivel conceptual o estructura lógica global que pretende una representación global de los datos entre la estructura lógica y física, y que sea independiente tanto del equipo como de cada usuario.

Nota
El objetivo fundamental de un sistema de gestión de base de datos es la independencia física y lógica entre datos y tratamiento.
Se distinguen tres niveles de abstracción:

La forma en que el usuario de una base de datos la ve y la manera en la que realmente está estructurada en un ordenador puede ser muy diferente. Por ejemplo, en la siguiente tabla se pueden ver las diferencias existentes entre lo que ve el administrador de una base de datos, y la estructura física real de cómo se almacenan los datos en un SGBD como puede ser SQL.
Lo que ve el administrador de la BD |
Estructura física de SQL |
Bases de datos almacenadas físicamente en archivos. |
Bases de datos almacenadas físicamente en archivos. |
Tablas, vistas e índices y otros objetos. |
Páginas asignadas a vistas e índices. |
Columnas (campos), y filas (registros) de tablas. |
Información almacenada en tablas. |
Las bases de datos se crean sobre un conjunto de archivos que componen la estructura física de la base de datos. En esta estructura se almacena toda la información y de ella depende en gran medida la velocidad de respuesta ante consultas y actualizaciones.

Importante
La estructura física es muy dependiente de cada sistema de gestión de base de datos. Por ejemplo, SQL lo hace de una manera y Oracle de otra.
El gestor de almacenamiento es el responsable de relacionar los datos de bajo nivel en la base de datos y los programas de aplicación y consultas. Los datos en bruto se almacenan en el disco del ordenador que contiene la base de datos utilizando el sistema de archivos disponible en cualquier sistema operativo convencional, y el gestor de almacenamiento se encarga de traducir las diferentes instrucciones para la manipulación de los datos en órdenes adecuadas para el sistema de archivos físico.
El gestor de almacenamiento implementa varias estructuras:
La estructura física depende del SGBD con el que se esté trabajando. El SGBD Oracle utiliza varias estructuras para el almacenamiento físico en el disco, así como para la gestión de los datos. Estas estructuras son:

Los datos almacenados en una base de datos de Oracle se agrupan en una serie de espacios de tabla, denominados tablespaces, que son un conjunto de propiedades de almacenamiento aplicado a objetos creados en la BD para ese tablespace. Dentro de ellos existen otras estructuras lógicas denominadas segmentos que contienen datos para una estructura específica de datos. A su vez estos últimos se subdividen en extensiones, que consisten en un conjunto de bloques contiguos de la BD, y bloques, similares a los bloques BCP de un sistema operativo.


Definición
Bloque de Control de Proceso BCP
Es un registro del sistema operativo donde se agrupa toda la información necesaria para un proceso particular.
Las principales estructuras lógicas de la base de datos son:
Son manejados de manera inteligente por Oracle, de forma que el programador cuando los crea no ha de especificar el que va a usar.

Actividades
4. Busque en internet la estructura física de SQL Server.
La estructura física de un sistema de gestión de bases datos establece cómo se encuentran almacenados los diferentes objetos de almacenamiento de una base de datos. Dicha estructura determina:

Nota
Los tiempos de respuesta elevados son la queja más frecuente entre los usuarios de un SGBD.

Actividades
5. Indique qué otras posibles consecuencias piensa que pueden derivarse de la elección de un SGBD teniendo en cuenta que cada uno va a tener una estructura física diferente.
La información alojada en una base de datos se encuentra fragmentada. Esta fragmentación va a depender de la arquitectura empleada para alojar el sistema de bases de datos, que a su vez depende del sistema informático subyacente utilizado para alojar el SGBD.
Según esta arquitectura pueden encontrarse diferentes sistemas de bases de datos: centralizados, cliente-servidor, en paralelo, o sistemas distribuidos.
Se ejecutan en un único sistema informático sin interaccionar con ninguna otra computadora.
Se distinguen dos tipos:

Definición
CPU
Es la Unidad Central de Procesamiento (Central Processing Unit) y el principal componente del ordenador. Se encarga de interpretar las instrucciones de los programas y de procesar los datos.
Sistema monousuario
Es un sistema operativo que únicamente puede ser utilizado por un usuario determinado en un periodo de tiempo. Se distingue del sistema multiusuario en que este puede ser utilizado por varios usuarios de manera simultánea.
La base de datos se aloja en un computador central (servidor) que recibe las peticiones generadas por los sistemas clientes.
Estos sistemas tienen las siguientes características:
La estructura de un sistema cliente-servidor puede verse en el siguiente esquema:

Son sistemas que han surgido debido a la necesidad de manejar sistemas de bases de datos extremadamente grandes (del orden de terabytes, esto es 1012 bytes), o que deben procesar gran cantidad de transacciones por segundo.
Estos sistemas mejoran la velocidad de procesamiento de Entrada-Salida (E/S) mediante el empleo de una CPU y de discos en paralelo, realizando muchas operaciones de manera simultánea y a una velocidad elevada que disminuye el tiempo empleado para realizar una tarea dada.
Se distinguen dos tipos de máquinas en paralelo:
Entre sus inconvenientes se encuentran:
Los sistemas en paralelo están formados por una serie de componentes (procesadores, memoria y discos) que se interconectan a través de una red de conexión. Se distinguen tres tipos de redes:


Aplicación práctica
Suponga que trabaja como administrador de una base de datos en una empresa que crece rápidamente cada año, y donde el trabajo principal consiste en el procesamiento de un elevado número de transacciones. ¿Qué sistema elegiría?
SOLUCIÓN
La empresa crece rápidamente, luego el tamaño de la base de datos también crecerá de manera exponencial. Por otro lado el trabajo principal del SGBD consiste en procesar un elevado número de transacciones.
La elección de un sistema en paralelo sería la más adecuada. Estos sistemas son capaces de manejar bases de datos extremadamente grandes, y además pueden procesar gran cantidad de transacciones por segundo.
En estos sistemas la base de datos se almacena en varios ordenadores conectados a través de redes de alta velocidad o líneas telefónicas. Los ordenadores que componen el sistema, también denominados sitios o nodos, no comparten ni memoria ni discos, y pueden variar en tamaño y función. Además, estos nodos pueden encontrarse en lugares geográficos muy distintos.
Existen dos tipos de transacciones:
En cuanto a las ventajas que ofrecen los sistemas distribuidos frente a otros:


Sabía que…
Existen básicamente dos tipos de redes: redes de área local, en las que los equipos que la componen (ordenadores, discos, impresoras, etc.) se encuentran en áreas geográficas pequeñas (edificios, almacenes, centros de trabajo, etc.), y redes de área amplia, donde los equipos que la componen se encuentran distribuidos en un área geográfica extensa, como puede ser un país, varios o incluso el mundo.
Las bases de datos distribuidas pueden almacenar la información de dos maneras: mediante Réplica o mediante Fragmentación. En la primera el sistema mantiene copias idénticas de la información, y guarda copias en sitios diferentes. En la segunda, la información se divide en fragmentos y se guarda cada fragmento en sitios distintos.
Considerando una relación “r” que hay que almacenar en una base de datos, esta puede replicarse dos o más veces, hasta incluso generar una réplica completa para guardar en cada uno de los sitios que componen el sistema.
Las réplicas tienen las siguientes ventajas e inconvenientes:
Cuando una relación “r” se fragmenta se divide en varios fragmentos (r1, r2,…,rn,) de manera que la reunión de estos fragmentos permite la reconstrucción de la información contenida en “r”.
Existen tres formas principales de fragmentación:

Se utiliza para conservar las tuplas en los sitios que más se emplean y disminuir así la transferencia de datos.


Un sistema gestor de bases de datos (SGBD) consiste básicamente en un conjunto de datos relacionados entre ellos, y en una serie de aplicaciones o programas mediante los cuales se podrá trabajar con dichos datos.
Los SGBD están diseñados para gestionar gran cantidad de información. Dicha gestión implica un modelo para el almacenaje y conservación de los datos, así como proveer de herramientas adecuadas (lenguajes de definición y manipulación) para el tratamiento de dicha información.
La arquitectura de un SGBD se encuentra altamente influenciada por el sistema informático subyacente donde está instalado el sistema. Los sistemas pueden ser centralizados o cliente-servidor. En los primeros el sistema se ejecuta en un único sistema informático sin interaccionar con ninguna otra computadora, mientras que en los segundos el servidor ejecuta trabajos en múltiples máquinas clientes.

Ejercicios de repaso y autoevaluación
1. Un SGBD comprenderá un conjunto de programas que van a permitir la…
2. Indique si las siguientes afirmaciones son verdaderas o falsas.
3. Los sistemas tradicionales de ficheros…
4. Los SGBD utilizan…
5. Indique si las siguientes afirmaciones son verdaderas o falsas.
6. Complete el siguiente párrafo con las palabras correctas.
En los sistemas de ______ se pueden observar dos estructuras distintas: la ______ y la ______. La lógica es la que ve el ______ y la física es la forma en la que se almacenan los datos.
7. ¿Qué se pretende con la introducción en los SGBD del denominado nivel conceptual o estructura lógica global?
8. Los niveles de abstracción de un SGBD son:
9. Respecto a la estructura física…
10. Complete el siguiente párrafo con las palabras correctas.
El ______ ______ ______ es el responsable de relacionar los datos de ______ ______ en la base de datos y los programas de aplicación y consultas.
11. Indique si las siguientes afirmaciones son verdaderas o falsas.
12. Complete el siguiente esquema.

13. Nombre las arquitecturas que pueden encontrarse para los diferentes SGBD.
14. En los sistemas en paralelo pueden encontrase hasta tres tipos de redes. Indique cuáles.
15. Las formas de almacenamiento de la información son: