Almacenamiento 21-01-2013

download Almacenamiento 21-01-2013

of 32

Transcript of Almacenamiento 21-01-2013

  • 7/29/2019 Almacenamiento 21-01-2013

    1/32

    Administracin de Base de Datos

    AlmacenamientoIng. Ronald [email protected]@shopepk.com

  • 7/29/2019 Almacenamiento 21-01-2013

    2/32

    Agenda

    Cach y Memoria Principal

    Memoria flashDiscos magnticos

    Jerarqua de Almacenamiento

    RAID (Redudant Arrays of Independent Disk)Niveles de RAIDEleccin del nivel del RAID

    Comparacin de conjuntos RAID

    Ajustes de E/S para los tipos RAIDRendimiento en reconstruccin

    RecomendacionesOrganizacin de registros

    Almacenamiento con Diccionario de Datos

  • 7/29/2019 Almacenamiento 21-01-2013

    3/32

    Cach y Memoria Principal

    Cach: la forma de almacenamiento ms rpida y

    costosa; voltil; gestionada por el hardware delsistema.Memoria principal:

    Acceso rpido (10s a 100s de nanosegundos)Generalmente demasiado pequea (o demasiado costosa)

    para almacenar la base de datos completaNormalmente se utilizan capacidades de unos pocosGigabytes.Las capacidades han crecido y los costes por byte handisminuido de manera constante y rpida

    Voltil : el contenido de la memoria principal normalmentese pierde si se produce un fallo de alimentacin o una cadadel sistema.

  • 7/29/2019 Almacenamiento 21-01-2013

    4/32

    Memoria flash

    Los datos se mantienen ante un fallo de alimentacin

    Los datos se pueden escribir una sola vez en una posicin,pero una posicin se puede borrar y escribir de nuevo Pueden soportar slo un nmero limitado de ciclos deescritura/borrado. El borrado se tiene que hacer sobre bancos enteros dememoria

    La lectura es aproximadamente tan rpida como la dememoria principal Pero la escritura es lenta (pocos microsegundos), el borradoes an ms lento El coste por unidad es similar al de la memoria principal

    Ampliamente utilizado en dispositivos embebidos tales comocmaras digitales tambin conocida como EEPROM (ElectricallyErasable Programmable Read-Only Memory)

  • 7/29/2019 Almacenamiento 21-01-2013

    5/32

    Discos magnticos

    Los datos se almacenan en discos giratorios, y que se leen/escribenmagnticamente

    Es el principal medio de almacenamiento de datos a largo plazo;tpicamente almacenan bases de datos enteras. Los datos se deben mover de disco a memoria principal paraacceder a ellos, y escritos de nuevo hacia el disco si se modifican Los accesos son mucho ms lentos que a memoria principal Acceso directo es posible leer datos de disco en cualquier

    orden, al contrario que en las cintas magnticas Las capacidades actuales llegan hasta a cientos de GB

    Mucha mayor capacidad y menor coste/byte que la memoriaprincipal/flash Crece de manera constante y rpida con las mejoras

    tecnolgicas(factor de 2 a 3 cada 2 aos)

    Sobrevive a fallos de corriente y cadas del sistema Los fallos de disco pueden destruir datos, pero son muyinfrecuentes

  • 7/29/2019 Almacenamiento 21-01-2013

    6/32

    Jerarqua de Almacenamiento

    Almacenamiento

    primario

    Almacenamiento

    secundario o en lnea

    Almacenamiento

    terciario o fuera de

    lnea

  • 7/29/2019 Almacenamiento 21-01-2013

    7/32

    RAID (Redudant Arrays of Independent Disk)

    Tcnicas de organizacin de disco que gestionan una grancantidad de discos, proporcionando la imagen de un solo discode:

    Gran capacidad y alta velocidad utilizando varios discos en paralelo, y Alta disponibilidad almacenando datos de forma redundante, de talmanera que los datos se pueden recuperar an cuando un disco falle

    El paralelismo en un sistema de disco tiene dos objetivos

    principales: Equilibrar la carga de varios accesos de pequeo tamao paraincrementar las prestaciones Paralelizar accesos de gran tamao para reducir el tiempo derespuesta. Generalmente, se realiza a nivel de bloque, con n discos, el bloque i de unfichero va al disco (i mod n) + 1

    Las peticiones de diferentes bloques se pueden ejecutar en paralelosi los bloques estn en discos distintos Una peticin de una secuencia grande de bloques puede utilizartodos los discos en paralelo

    Niveles de RAID: 0 a 6

  • 7/29/2019 Almacenamiento 21-01-2013

    8/32

    Niveles de RAID

    Nivel 0:

    No redundanciaAplicaciones de alta disponibilidad dondeno sea crtico la perdida de informacin

    Nivel 1:

    Buen comportamiento en escrituraDisco espejo

    Nivel 5:

    Paridad distribuida conbrazos entrelazados

  • 7/29/2019 Almacenamiento 21-01-2013

    9/32

    RAID 0+1

    No redundante y en espejo. este nivel combina las tcnicas de

    divisin en franjas y de duplicacin en espejo.

  • 7/29/2019 Almacenamiento 21-01-2013

    10/32

    RAID 2

    Cdigos de correccin de errores tipo memoria, con estenivel la franja est compuesta por un nico bit y se utilizacdigos hamming como esquema de redundancia.

  • 7/29/2019 Almacenamiento 21-01-2013

    11/32

    RAID 3

    Paridad con entrelazado de bit. este nivel proporciona redundancia

    almacenando informacin de paridad en uno de los discos matriz.esta informacin de paridad puede utilizarse para recuperar losdatos de otros discos en caso de que estos fallen. este nivel utilizamenos espacio de almacenamiento que RAID 1, pero el disco deparidad puede convertirse en un cuello de botella.

  • 7/29/2019 Almacenamiento 21-01-2013

    12/32

    RAID 4

    Paridad con entrelazo de bloque. en este nivel la franja es el bloque

    del disco, mantenindose un bloque de paridad en un discoindependiente para una serie de bloques correspondientesalmacenados en otros discos. Si uno de los discos falla, puede usarusarse el bloque de paridad junto con los bloques correspondientesde los otros discos para restaurar los bloques del disco fallido.

  • 7/29/2019 Almacenamiento 21-01-2013

    13/32

    RAID 5

    Paridad distribuida con entrelazado de bloques. Este nivel de datos

    de paridad como mecanismo de introduccin de redundancia, deforma similar a RAID 3, pero distribuye en franjas los datos deparidad entre todos los discos, en forma similar a como sedistribuyen en franjas los datos de origen. esto reduce la posibilidadde que el disco de paridad se convierta en un cuello de botella.

  • 7/29/2019 Almacenamiento 21-01-2013

    14/32

    RAID 6

    Redundancia P+Q, este nivel es similar a RAID 5, pero se

    introducen datos redundantes adicionales como proteccinfrente a fallos mltiples de disco. en lugar de emplearesquemas de paridad, se utiliza correccin de errores.

  • 7/29/2019 Almacenamiento 21-01-2013

    15/32

    Eleccin del nivel del RAID

    Factores a tener en cuenta al elegir un nivel de RAID:

    Costo econmico extras de los requisitos dealmacenamiento en disco.Requisitos de rendimiento en trminos del nmero deoperaciones de entrada/salida.Rendimiento cuando falla un disco.Rendimiento durante la reconstruccin.

  • 7/29/2019 Almacenamiento 21-01-2013

    16/32

    Comparacin de conjuntos RAID

    Tipo de RAID Tolerancia deerrores

    Rendimiento

    RAID 0 (conjuntodividido sin paridad)

    Ninguna Mejor lectura yescritura

    RAID 1 (volumen

    reflejado)

    Puede fallar un disco Buena lectura,

    escritura aceptableRAID 5 (conjuntodividido con paridaddistribuida)

    Puede fallar un disco Excelente lectura,escritura bastantepobre.

    RAID 10 (conjunto enespejo)

    Puede fallar la mitadde los discos (perono los discos de unpar reflejado)

    Excelente lectura yescritura

  • 7/29/2019 Almacenamiento 21-01-2013

    17/32

    Ajustes de E/S para los tipos RAID

    Tipo de RAID Clculo de E/S por disco

    RAID 0 (conjunto dividido sinparidad)

    (lectura + escritura)/nmero de discos

    RAID 1 (volumen reflejado) [lecturas +(2 x escrituras)]/2RAID 5 (conjunto divididocon paridad distribuida)

    [lecturas +(4 x escrituras)]/nmero dediscos

    RAID 10 (conjunto enespejo)

    E/S por disco =[lecturas + (2 xescrituras)]/nmero de discos

  • 7/29/2019 Almacenamiento 21-01-2013

    18/32

    Rendimiento en reconstruccin

    El rendimiento en la reconstruccin de un sistema RAID puedeser un factor importante si se necesita un aporte continuo dedatos, como ocurre en los sistemas de bases de datos de altorendimiento.

    RAID de Nivel 0 se usa en aplicaciones de alto rendimientodonde la seguridad de los datos no es crtica.

    RAID de Nivel 1 presenta la reconstruccin ms sencillo perocon el sistema ms caro

    RAID de Nivel 3 (2) raramente se usa dado que la

    distribucin de bloques da mejores resultados para grandestransferencias

  • 7/29/2019 Almacenamiento 21-01-2013

    19/32

    Rendimiento en reconstruccin

    RAID de Nivel 5 (4) es una gran opcin para aplicaciones

    donde los datos se leen frecuentemente y se escribenraramente.

    RAID de Nivel 6 no se soporta actualmente en casi ningunaimplementacin RAID, pero es recomendable en aplicaciones enlas cuales la seguridad de datos es muy importante

    Requisitos

    Almacenamiento Entrada/Salida

    RAID de nivel 1 Moderado Alto

    RAID de nivel 5 Alto Moderado

  • 7/29/2019 Almacenamiento 21-01-2013

    20/32

    Recomendaciones

    La configuracin optima del disco para un servidor de base de

    datos depende del uso esperado de ese servidor. Cuando msse utilice un servidor de base de datos, ms conjuntos deunidades debera dedicar a los componentes individuales delservidor.

    Un diseo bsico de un servidor de base de datos con un usomedio incluye tres conjuntos de unidades fsicas.Correspondindose cada uno con unidades lgicas.

    Un volumen se reserva para el S.O.Un segundo para los registros de transacciones.Un tercero para las bases de datos.

  • 7/29/2019 Almacenamiento 21-01-2013

    21/32

    Recomendaciones

    Oracle recomienda utilizar RAID 1 para los archivos del

    registro rehacer. Para los archivos de bases de datos, Oraclerecomienda 5 (si el coste adicional en escritura es aceptable) oen caso contrario, RAID 1 o RAID 0+1.

    Para SQL Server se recomienda normalmente RAID 1. para la

    unidad que contiene el registro de transacciones se recomiendaRAID 1 0 RAID 10.Para la unidad de base de datos, la eleccin se reducenormalmente a RAID 10 o RAID 5.

  • 7/29/2019 Almacenamiento 21-01-2013

    22/32

    Organizacin de registros

    Generalmente se usa un archivo separado para almacenar los

    registros de cada relacin de la base de datos.

    Existen organizaciones de archivos en agrupaciones en lascuales se guardan en el mismo archivo registros de relacionesdiferentes

  • 7/29/2019 Almacenamiento 21-01-2013

    23/32

    Archivos en montculo

    En la organizacin de archivos en montculo se puede colocar

    cualquier registro en cualquier parte del archivo en que hayaespacio suficiente.

    No hay ninguna ordenacin de los registros.Generalmente slo hay un archivo por relacin

  • 7/29/2019 Almacenamiento 21-01-2013

    24/32

    Archivos en montculo

    En la organizacin de archivos secuenciales los registros se

    guardan en orden secuencial, basado en el valor de la clave debsqueda (no tiene por qu ser una clave principal o unasuperclave) de cada registro

  • 7/29/2019 Almacenamiento 21-01-2013

    25/32

    Hash

    En la organizacin asociativa (hash) de archivos se calculauna funcin de asociacin de algn atributo de cada registro.

    El resultado de la funcin de asociacin especifica el bloque delarchivo en el que se colocar el registro.

    Est muy relacionado con la creacin de ndices

  • 7/29/2019 Almacenamiento 21-01-2013

    26/32

    Almacenamiento con Diccionario deDatos

  • 7/29/2019 Almacenamiento 21-01-2013

    27/32

    Catlogo del sistema

    Un sistema de bases de datos relacional necesita tener datos

    sobre las relaciones, como por ejemplo el esquema:

    Los nombres de las relaciones. Los nombres de los atributos de cada relacin. Los dominios y las longitudes de los atributos. Los nombres de las vistas definidas en la base de datos y lasdefiniciones de esas vistas. Las restricciones de integridad.

  • 7/29/2019 Almacenamiento 21-01-2013

    28/32

    Datos adicionales

    Datos de los usuarios del sistema

    Los nombres de los usuarios autorizados La informacin de las cuentas de los usuarios Contraseas u otra informacin usada para autentificar alos usuarios

    Datos de informacin estadstica y descriptiva

    Nmero de tuplas de cada relacin Mtodo de almacenamiento utilizado para cada relacin

    La organizacin del almacenamiento (secuencial, asociativa o

    con montculos)

  • 7/29/2019 Almacenamiento 21-01-2013

    29/32

    Datos adicionales

    Datos sobre los ndices de cada una de las relaciones:

    El nombre del ndice

    El nombre de la relacin para la cual se crea el ndice

    Los atributos sobre los cuales se define el ndice

    El tipo de ndice formado

  • 7/29/2019 Almacenamiento 21-01-2013

    30/32

    Ficheros de Base de Datos

  • 7/29/2019 Almacenamiento 21-01-2013

    31/32

    Ficheros de control

    Almacenan la informacin (fichero binario) para mantener y

    verificar la integridad de la Base de Datos: estructura, nombrey fecha de creacin de la base de datos, nombre de los ficherosde datos y de los ficheros de redo log

    Guarda tambin informacin de sincronizacin: estado de los

    ficheros cuando se cerr la base de datos, tiempo de cierre

    Tambin es necesario para su recuperacin.

  • 7/29/2019 Almacenamiento 21-01-2013

    32/32

    Ficheros de parmetros

    Define las caractersticas de la instancia y se lee cuando esta

    arranca, configurndola segn el valor de los parmetros.