martes, 27 de mayo de 2014

CONCEPTOS DE BASE DE DATOS

DATO

Los datos son todas aquellos elementos que sirven como una base para resolver problemas o formar algún tipo de juicioso, estos datos tienen poco valor. Son también expresiones generales que van describiendo características sobre las entidades en las que se operan diferentes tipos de algoritmos. Las expresiones o los datos deben ser representados de una manera en la cual puedan ser tartadas por una computadora o interprestadas por la misma; esto quiere decir que los datos en sí no constituyen información, sino que ésta inofrmación va surgiendo del adecuado procesamiento de los datos.

INFORMACIÓN
Se entiende como el conjunto de datos que son añadidos, procesados y relacionados de una manera en la cual no se puede dar un pauta a la correcta toma de decisiones según el fin previsto.

ARCHIVO
Está conformado por un conjunto de registros, pues es un elemento de información. Los registros estan conformados por carácteres. En la actualidad muchas empresas estan utilizando las bases de datos para generar resultados y compartirlos con otros sistemas.

CAMPO
Es la unidad básica de una base de datos, estos no pueden empezar con espacios en blanco ni con caracteres especiales; no pueden llevar puntos ni signos de exclamación o corchetes, pero si pueden tener espacios en blanco en el medio.

TABLA
Es la unidad donde se crean el conjunto de datos de la base de datos y estos son ordenados en columnas verticales. En estas tablas se tiene que definir los campos así como tambien las características de los mismos.

ENTIDAD
Es la representación de los objetos o conceptos en los que se describen la base de datos, una entidad es representada mediante un modelo de datos y esta conformada por uno o más atributos.

ATRIBUTO
Son caracteristicas por las cuales se pueden describir las entidades, el valor específico de un atributo es conocido como elemento de datos y esta localizado en los campos de registro que describen una entidad.



lunes, 26 de mayo de 2014

Gestor de Base de Datos

Son un tipo de software muy específico, dedicado a servir de interfaz entre la base de datos, el usuario y las aplicaciones que la utilizan.

Características:

Es un conjunto de programas que permiten crear y mantener una base de datos, asegurando su integridad, confidencialidad y seguridad.
Las características del sistema gestor de base de datos son:
  1. Abstracción de la información. Ahorran a los usuarios detalles acerca del almacenamiento físico de los datos.
  2. Independencia. La independencia de los datos consiste en la capacidad de modificar el esquema (físico o lógico) de una base de datos sin tener que realizar cambios en las aplicaciones que se sirven de ella.
  3. Redundancia mínima. Un buen diseño de una base de datos logrará evitar la aparición de información repetida o redundante.
  4. Consistencia. Vigilar que aquella información que aparece repetida se actualice de forma coherente, es decir, que todos los datos repetidos se actualicen de forma simultánea.
  5. Seguridad. Deben garantizar que esta información se encuentra asegurada frente a usuarios malintencionados.
  6. Integridad. Se trata de adoptar las medidas necesarias para garantizar la validez de los datos almacenados.
  7. Respaldo y recuperación. Deben proporcionar una forma eficiente de realizar copias de respaldo de la información almacenada en ellos.
  8. Control de la concurrencia. Lo más habitual es que sean muchas las personas que acceden a una base de datos; ésta debe controlar este acceso concurrente a la información, que podría derivar en inconsistencias.

Herramientas:

Una de las principales herramientas que existen dentro de los gestores de base de datos, es la administración de usuarios, privilegios y funciones de contraseñas de usuarios y el establecimiento de límites de recursos de la base de datos.

Administrador de base de datos

Es el profesional que administra las tecnologías de la información y la comunicación, siendo responsable de los aspectos técnicos, tecnológicos, científicos, inteligencia de negocios y legales de bases de datos.
Sus tareas incluyen las siguientes:
  • implementar, dar soporte y gestionar bases de datos corporativas
  • crear y configurar bases de datos relacionales.
  • ser responsables de la integridad de los datos y la disponibilidad
  • diseñar, desplegar y monitorizar servidores de bases de datos
  • diseñar la distribución de los datos y las soluciones de almacenamiento
  • garantizar la seguridad de las bases de datos, incluyendo backups y recuperación de desastres
  • planificar e implementar el aprovisionamiento de los datos y aplicaciones
  • diseñar planes de contingencia.
  • diseñar y crear las bases de datos corporativas de soluciones avanzadas
  • analizar y reportar datos corporativos que ayuden a la toma de decisiones en la inteligencia de negocios
  • producir diagramas de entidades relacionales y diagramas de flujos de datos, normalización esquemática, localización lógica y física de bases de datos y parámetros de tablas
Los administradores de bases de datos tienen competencias y capacidades en uno o más sistemas de gestión de bases de datos, algunos ejemplos: Microsoft SQL Server, IBM DB2, Oracle MySQL, Oracle database, IBM Informix y SQL Anywhere.

Normalización 1FN, 2FN, 3FN, 4FN


Datos Normalizados en primera forma normal (1FN) y el universo de datos no normalizados


Etapas de la Normalización

Dependencia Funcional 1FN. El universo de datos no normalizado se refiere al conjunto de datos que están reunidos bajo un criterio en común, estos datos son una gran cantidad de información desorganizada y, en algunos casos, compleja para su análisis u otros usos, ya que tiene un albedrío de información, y en ello encontraremos muchas inconsistencias o ¨defectos¨, como las siguientes:
Ø La REDUNDANCIA de datos
Ø ERRORES DE ACTUALIZACIÓN de datos.
Ø FALTA DE INTEGRIDAD E INCONSISTENCIA en los datos.
En relación a tablas no normalizadas (cuando almacenamos información no normalizada):
Ø Repetición de nombres de cada tabla.
Ø Presencia de dos filas iguales.
Ø Los datos de una misma columna de un mismo tipo.
Ø De inserción: imposibilidad de adicionar datos en la BD por la ausencia de otros.
Ø De borrado: pérdida no intencionada de datos debido a la eliminación de otros.
En cambio, cuando tenemos los datos organizados bajo ciertos criterios, como la Primera Forma Normal (1FN), se debe cumplir con lo siguiente:
  • Una relación R se encuentra en 1FN si y solo sí por cada renglón columna contiene valores atómicos.
  • Las celdas de las tablas poseen valores simples y no se permiten grupos ni arreglos repetidos como valores, es decir, contienen un solo valor por cada celda.
  • Todos los ingresos en cualquier columna (atributo) deben ser del mismo tipo.
  • Cada columna debe tener un nombre único, el orden de las columnas en la tabla no es importante.
  • Dos filas o renglones de una misma tabla no deben ser idénticas, aunque el orden de las filas no es importante.

Dependencia Funcional 2FN. Una relación está en 2FN si está en 1FN y si los atributos que no forman parte de ninguna clave dependen de forma completa de la clave principal. Es decir que no existen dependencias parciales. (Todos los atributos que no son clave principal deben depender únicamente de la clave principal).
En otras palabras podríamos decir que la segunda forma normal está basada en el concepto de dependencia completamente funcional. Una dependencia funcional x \rightarrow y es completamente funcional si al eliminar los atributos A de X significa que la dependencia no es mantenida, esto es que A \in X, X - \{A\} \nrightarrow Y. Una dependencia funcional x \rightarrow y es una dependencia parcial si hay algunos atributos A \in X que pueden ser eliminados de X y la dependencia todavía se mantiene, esto es A \in X, X - \{A\} \rightarrow Y.
Por ejemplo {DNI, ID_PROYECTO} \rightarrow HORAS_TRABAJO (con el DNI de un empleado y el ID de un proyecto sabemos cuántas horas de trabajo por semana trabaja un empleado en dicho proyecto) es completamente dependiente dado que ni DNI \rightarrow HORAS_TRABAJO ni ID_PROYECTO \rightarrow HORAS_TRABAJO mantienen la dependencia. Sin embargo {DNI, ID_PROYECTO} \rightarrow NOMBRE_EMPLEADO es parcialmente dependiente dado que DNI \rightarrow NOMBRE_EMPLEADO mantiene la dependencia.

Dependencia Funcional 3FN. La tabla se encuentra en 3FN si es 2FN y si no existe ninguna dependencia funcional transitiva entre los atributos que no son clave.
Un ejemplo de este concepto sería que, una dependencia funcional X->Y en un esquema de relación R es una dependencia transitiva si hay un conjunto de atributos Z que no es un subconjunto de alguna clave de R, donde se mantiene X->Z y Z->Y.
Por ejemplo, la dependencia SSN->DMGRSSN es una dependencia transitiva en EMP_DEPT de la siguiente figura. Decimos que la dependencia de DMGRSSN el atributo clave SSN es transitiva vía DNUMBER porque las dependencias SSN→DNUMBER y DNUMBER→DMGRSSN son mantenidas, y DNUMBER no es un subconjunto de la clave de EMP_DEPT. Intuitivamente, podemos ver que la dependencia de DMGRSSN sobre DNUMBER es indeseable en EMP_DEPT dado que DNUMBER no es una clave de EMP_DEPT.
Formalmente, un esquema de relación R está en 3 Forma Normal Elmasri-Navathe, si para toda dependencia funcional X \rightarrow A, se cumple al menos una de las siguientes condiciones:
  1. X es super llave o clave.
  2. A es atributo primo de R; esto es, si es miembro de alguna clave en R.
Además el esquema debe cumplir necesariamente, con las condiciones de segunda forma normal.
Un ejemplo de una tabla 2FN que falla en satisfacer los requerimientos de la 3FN es:
Ganadores del torneo
TorneoAñoGanadorFecha de nacimiento del ganador
Indiana Invitational1998Al Fredrickson21 de julio de 1975
Cleveland Open1999Bob Albertson28 de septiembre de 1968
Des Moines Masters1999Al Fredrickson21 de julio de 1975
Indiana Invitational1999Chip Masterson14 de marzo de 1977
La única clave candidata es {Torneo, Año}.
La violación de la 3FN ocurre porque el atributo no primario Fecha de nacimiento del ganador es dependiente transitivamente de {Torneo, Año} vía el atributo no primario Ganador. El hecho de que la Fecha de nacimiento del ganador es funcionalmente dependiente en el Ganador hace la tabla vulnerable a inconsistencias lógicas, pues no hay nada que impida a la misma persona ser mostrada con diferentes fechas de nacimiento en diversos registros.

Dependencia Funcional 4FN. Una tabla se encuentra en 4FN si, y sólo si, para cada una de sus dependencias múltiples no funcionales X->->Y, siendo X una super-clave que, X es o una clave candidata o un conjunto de claves primarias.|

Normalización de bases de datos



El proceso de normalización de base de datos consiste en aplicar una serie de reglas a las relaciones obtenidas tras el paso del modelo entidad-relación al modelo racional.
Las bases de datos relacionales se normalizan para:
  • Evitar la redundancia de los datos.
  • Disminuir problemas de actualización de los datos en las tablas.
  • Proteger la integridad de los datos.
En el modelo relacional es frecuente llamar tabla a una relación, aunque para que una tabla sea considerada como una relación tiene que cumplir con algunas restricciones:
  • Cada tabla debe tener su nombre único.
  • No puede haber dos filas iguales. No se permiten los duplicados.
  • Todos los datos en una columna deben ser del mismo tipo.

Modelo Entidad-Relación


El modelo entidad-relación.
  1. Se elabora el diagrama (o diagramas) entidad-relación.
  2. Se completa el modelo con listas de atributos y una descripción de otras restricciones que no se pueden reflejar en el diagrama.
El modelado de datos no acaba con el uso de esta técnica. Son necesarias otras técnicas para lograr un modelo directamente implementable en una base de datos. Brevemente:
permite mostrar resultados entre otras entidades pertenecientes a las existentes de manera que se encuentre la normatividad de archivos que se almacenaran
  • Transformación de relaciones múltiples en binarias. 
  • Nacionalización de una base de datos de relaciones (algunas relaciones pueden transformarse en atributos y viceversa).
Conversión en tablas (en caso de utilizar una base de datos racional).                                                  

RELACIONES

El modelo E-R se basa en una percepción del mundo real, la cual esta formada por objetos básicos llamados entidades y las relaciones entre estos objetos así como las características de estos objetos llamados atributos.

Entidades y conjunto de entidades
Una entidad es un objeto que existe y se distingue de otros objetos de acuerdo a sus características llamadas atributos . Las entidades pueden ser concretas como una persona o abstractas como una fecha.

Elementos:




 




Base de datos

es un conjunto de datos pertenecientes a un mismo contexto y almacenados sistemáticamente para su posterior uso. En este sentido; una biblioteca puede considerarse una base de datos compuesta en su mayoría por documentos y textos impresos en papel e indexados para su consulta. Actualmente, y debido al desarrollo tecnológico de campos como la informática y la electrónica, la mayoría de las bases de datos están en formato digital (electrónico), y por ende se ha desarrollado y se ofrece un amplio rango de soluciones al problema del almacenamiento de datos.
Existen programas denominados sistemas gestores de bases de datos, abreviado DBMS, que permiten almacenar y posteriormente acceder a los datos de forma rápida y estructurada. Las propiedades de estos DBMS, así como su utilización y administración, se estudian dentro del ámbito de la informática.