Sei sulla pagina 1di 19

Jerarqua de Almacenamiento

Memoria
Cache
Memoria
Ppal.
Memoria Flash
Disco Magntico
Disco ptico
Cintas Magnticas
Velocidad de
Acceso,
Costo,



Confiabilidad
Voltil
No Voltil
Almacenamiento
Primario
Almacenamiento
Secundario
Almacenamiento
Terciario


1) Explicar la organizacin de los medios de almacenamiento en
primarios, secundarios y terciarios.
2) Qu aspectos se deben considerar al analizar un dispositivo
de almacenamiento fsico?
Capacidad
Velocidad de Acceso
Costo por unidad
Confiabilidad
Tiempo de Acceso: tiempo transcurrido desde un pedido de
lectura/escritura hasta que comienza la transferencia de datos.
Tiempo de bsqueda.
Tiempo de latencia por rotacin.
Tiempo de Transferencia: velocidad a la que se recuperan o
guardar datos en el disco.
Tiempo medio entre fallos: tiempo promedio que se puede
esperar que funcione sin fallos.
3) Definir registro y bloque. Proponga una organizacin simple de
una base para una bases de datos relacional
Una organizacin simple sera:
Un archivo por relacin.
Todos los registros de un archivo son de igual tamao
(registros de tamao fijo) y tienen los mismos atributos.
Acomodar secuencialmente registros completos en cada
bloque.
4 a) Explicar el proceso de I/O a travs del buffer de memoria.
Por cada solicitud de un bloque de dato b
i
1. Si b
i
est en el buffer de memoria, BM retorna la
direccin de b
i
en memoria principal.
2. Si b
i
no est en el buffer de memoria, BM debe:
i. Asignar espacio del buffer para el nuevo bloque:
Remplazando algn otro bloque, si es necesario hacer espacio, y
pero escribiendo previamente el bloque remplazado en disco si es
que fue modificado desde la ltima vez que se copio en disco.
ii. Leer el bloque desde el disco para copiarlo en el buffer, y
retornar la direccin de memoria principal que aloja el
bloque.

6 a) Qu objetivos persigue una organizacin de discos RAID.
RAIDs - Redundant Array of Independent Disks - Tcnica
para organizar y administrar varios discos fsicos como si
fueran una unidad
+ Aumenta la capacidad
+ Aumenta la velocidad de acceso a la informacin
usando mltiples discos en paralelo.
+ Aumenta la confiabilidad, dando la oportunidad de
almacenar datos redundantes, de forma que pueda
recuperarse informacin, an ante la presencia de
fallos.


6 b y c) Como funciona RAID 1 y 5.
RAID Level 0: Block striping; non-redundant.
RAID Level 1: Mirrored disks with block striping.
RAID Level 0+1 o 10
RAID Level 2: (ECC) with bit striping.
RAID Level 3: Bit-Interleaved Parity.
RAID Level 4: Block-Interleaved Parity.
RAID Level 5: Block-Interleaved Distributed Parity.
RAID Level 6: P+Q Redundancy.

7 a) Qu diferencia existe entre ndice primario y secundario?

El ndice se asocia con una clave_de_bsqueda. El archivo ndice
almacena de manera ordenada los valores de las claves de
bsqueda, y asocia con cada clave los registros de datos que
contienen esa clave de bsqueda.
Si el archivo de datos est ordenado secuencialmente, el ndice
cuya clave de bsqueda especifica el orden secuencial del
archivo es el ndice primario.
El ndice primario NO necesita ser la clave primaria.
Los ndices que tienen el orden secuencial de los registros de datos
se denominan ndices clustering
Los ndices cuyas claves de bsqueda especifican un orden
diferente del orden secuencial del archivo se llaman ndices
secundarios o no clustering.
7 a) Qu diferencia existe entre ndice primario y secundario?

ndices secundarios o no clustering.
7 b) El ndice primario es la llave primaria de una relacin?

Puede no serlo.
7 c) Cuntos ndices primarios puede tener un archivo?
Cuntos ndices secundarios?

Slo puede haber un ndice primario, ya que requiere que los
registros estn ordenados secuencialmente. Pueden ser densos o
ralos (sparse)
Pueden haber muchos ndices secundarios. Los cuales slo
pueden ser densos.
8) Cundo es preferible utilizar un ndice denso en vez de un
ndice ralo?
Son preferibles cuando hay muchas ms consultas que
inserciones y borrados
El ndice ralo requiere menos espacio y menos overhead por
tareas ingresar/borrar registros.
El ndice ralo solo se puede usar cuando el archivo de datos
ordenados como la clave del ndices (indice primario o
clustering).
los ndices secundarios se usan para recorrer los datos en un
orden distinto al orden fsico. Es por eso que deben ser densos y
con una entrada en el ndice por cada valor de la clave de
bsqueda, y un puntero a cada registro del archivo.
ndice Denso
EBD2013_11 - Mg. Mercedes Vitturini
Fuente: Database System Concepts
Silberschatz, Korth, Sudarshan
Clave de bsqueda:
departamento

Indice clustering y
denso

Distribucin de los datos ordenada por
departamento
ndice Ralo
EBD2013_11 - Mg. Mercedes Vitturini
Fuente: Database System Concepts
Silberschatz, Korth, Sudarshan
Clave de bsqueda:
Legajo


Indice Clustering y Ralo
Distribucin de los datos ordenada por
legajo
B+ rboles
Un ndice de rbol B+ es un ndice
multinivel con una estructura que difiere
del ndice multinivel de un archivo
secuencial

ndices B+ rbol
EBD2013_11 - Mg. Mercedes Vitturini
P
1
K
1
P
2
K
2
P
n-1
K
n-1
P
n
EBD2013_11 - Mg. Mercedes Vitturini
Fuente: Database System Concepts
Silberschatz, Korth, Sudarshan
Nodos del B+
EBD2013_11 - Mg. Mercedes Vitturini

Nodos hoja:
P
i
apunta al registro con clave K
i
.
P
n
apunta a la prxima hoja.
Nodos intermedios:
P
1
apunta al subrbol que contiene claves menores a K
1.
P
2
, ..,P
n-1
apuntan al subrbol que contiene claves mayores
o iguales a K
i-1
y menores a K
i
.
P
n
apunta al subrbol que contiene claves mayores o
iguales a K
n-1
B+ rboles
Dado un B+ rbol con n = 6
Los nodos hoja tienen entre (n1)/2 and n-1,
valores (entre 3 y 5 valores para n = 6).
Los nodos intermedios (no raz) deben tener (n/2
and n hijos (con entre 3 y 6 hijos n =6 ).
La raz debe tener por lo menos dos hijos

Una caracterstica de los ndices B+ es que se mantienen
balanceados. Esto es, el camino desde la raz a cada nodo hoja
es la misma. Esto asegura un buen rendimiento para las
bsquedas, inserciones y borrados.
EBD2013_11 - Mg. Mercedes Vitturini
Consultas con B+ rbol
Si existen K valores para clave de bsqueda en el archivo, el
camino no ser ms largo que log
n/2
(K)
Generalmente, cada nodo tiene el mismo tamao que un
bloque de disco.
Para una clave de bsqueda de 12 bytes y un tamao del
puntero a disco de 8 bytes, n est alrededor de 200. Una
estimacin ms conservadora n est en torno a 100.
Con n = 100, si se tienen un milln de valores de clave de
bsqueda en el archivo, una bsqueda necesita solamente 4
accesos a nodos.
Normalmente, el nodo raz del rbol se guarda en memoria
intermedia; as se necesitan tres o menos lecturas del
disco.
EBD2013_11 - Mg. Mercedes Vitturini
Actualizaciones con B+ rbol
El borrado y la insercin son ms complejos, ya que
podra ser necesario dividir un nodo que resultara
demasiado grande como resultado de una insercin,
o fusionar nodos si un nodo se volviera demasiado
pequeo.
Tambin se debe asegurar que el equilibrio del rbol
se mantiene, con lo cual la operacin se puede
expandir a otros niveles.
EBD2013_11 - Mg. Mercedes Vitturini

Potrebbero piacerti anche