Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Introduccin.
Ficheros Indizados (organizaciones indizadas)
ndices Multinivel
Indizacin por rboles
Indizacin Mediante Claves Secundarias
- si es clave de identificacin
- cualquier clave de bsqueda no unvoca
...
...
Dum-Mos
Per-Cap
Asi-Fin
Dum-Con
...
Dum-Mos
Per-Cap
Asi-Fin
Dum-Con
...
Dumas
El Capitn Alatriste
Prez-Reverte
El Fin de la Eternidad
Asimov
El Conde de Montecristo
Dumas
...
...
Dumas
El Capitn Alatriste
Prez-Reverte
El Fin de la Eternidad
Asimov
El Conde de Montecristo
Dumas
...
...
...
...
...
...
...
...
...
...
...
...
...
...
Prez-Reverte
...
...
ndice secundario
Asi-Fin
3
Dum-Con 4
Dum-Mos 1
Per-Cap 2
...
...
ndice primario
Dum-Mos
Per-Cap
Asi-Fin
Dum-Con
...
...
...
...
...
...
Fichero de datos
Dum-Mos
Per-Cap
Asi-Fin
Dum-Con
...
...
...
...
...
...
Propiedades:
localizacin: serial sobre el ndice (mucho tiempo de proceso)
si el ndice cabe todo en memoria, pocos accesos (1)
tamao del ndice: gen. grande, ya que cada registro tiene una entrada.
...
...
...
...
...
Propiedades
localizacin: ordenada sobre el ndice (menor t. de proceso)
el resto de consideraciones, no cambian
(salvo que en este caso aparece la necesidad de reorganizar)
Ventajas:
(1) si CI = CO; posibilidad de utilizar una tcnica para procesos a
la totalidad, y otra para procesos selectivos.
(2) si CI CO aporta variedad en las claves de bsqueda.
Desventajas:
(1) si CI = CO; reorganizaciones tanto en el fichero como en el
ndice.
Propiedades
Es obligado que la CI CD. Permite buscar por claves de bsquedas
distintas de la CD
tipo de ndice
denso
organizacin base
direccionado
Propiedades
Si la CI = CD se mejora la consulta ordenada a la totalidad
Asi-Fin
...
El Fin de la Eternidad
Dum-Con
Dum-Mos
...
El Conde de Montecristo
Per-Cap
...
El Capitn Alatriste
...
...
...
...
...
...
...
...
...
localizacin:
bsqueda ordenada en el ndice se obtiene direccin del cubo
se recupera el cubo, y se busca dentro del cubo ordenado
@
Dum-Con
Dum-Mos
Ner-Poe
Men-Sin
Asi-Fin
1
Dum-Con 2
Ner-Poe 3
...
...
El Conde de Montecristo
Los Tres Mosqueteros
Veinte Poemas de Amor
Dum-Con
Dum-Mos
Men-Sin
Ner-Poe
Per-Cap
...
...
El Conde de Montecristo
Los Tres Mosqueteros
Sin Noticias de Gurb
Veinte Poemas de Amor
El Capitn Alatriste
...
...
...
...
...
...
...
...
...
...
?
!
Actualizacin:
Insercin:
- ndice denso: insercin en ambos (f. de datos e ndice)
cada fichero (datos e ndice) mantiene sus peculiaridades (orden, ...)
- ndice no denso: insercin slo en fichero de datos
(puede producir desbordamientos, que a su vez pueden afectar al ndice)
10
11
- dejar espacio en cada cubo: admite tcnicas para mantener ese espacio
rotaciones: traspasar elementos de un cubo lleno a otro vecino con sitio
particionamiento celular: dividir un cubo lleno en dos semi-llenos
@
12
nivel 1
(raz)
And
San
Wel
. . . ...
And
Del
Men
. . . ...
And
Asi
Con
. . . ...
Men
New
Per
. . . ...
Andersen
Annimo
...
Cuentos Completos
El Lazarillo de Tormes
...
...
...
...
...
Mendoza
Neruda
...
La cripta embrujada
Veinte Poemas de Amor
...
...
...
...
Problemas:
- el ndice puede crecer y, si no aumenta el cubo, acabar desbordando
- el nmero de accesos puede hacerse muy elevado
- mantener el ndice ordenado es muy costoso (mucha reorganizacin)
13
14
E1
E2Clave
E3 ...
Ek
E1
E2
E3
E4
E5
E6
E5
E6
E4
E1
@
E2
E3
15
kmn = k
2
Corolario
mmn = kmn + 1
Cuntos descendientes tienen los nodos intermedios?
m+1
(suponiendo poltica de dividir cuando desborda)
mmn =
2
Tamao del fichero de ndices
Se puede obtener una cota superior del fichero de ndices
Nmx nodos fichero = (n entradas fichero-1) / kmn + 1 (raz)
Tmx fichero = nmx nodos fichero Tnodo
16
nodos
entradas
acumulado
2 kmn
1+ 2kmn
2 mmn
2mmnkm
...
...
n
n+1
...
...
...
2mmnn2k
mn
(2mmnn-1)-1
2 mmnn-
2mmnn1k
mn
(2mmnn)-1
n 1 + log
n-
2 mmn
Cota Superior:
m+1
2
( e+1 )
2
<e
>e
17
Aspectos a Mejorar
Si las entradas son grandes, el orden puede ser demasiado pequeo
La densidad (mnima) de los nodos es muy mejorable
En las hojas se desperdicia mucho espacio (no necesitan punteros desc.)
E1
E2Clave
Entrada 2
E3 ...
E1
E2Clave
Nodo Hoja
E3 ...
(al fichero de datos)
Nodo No Hoja
Por otro lado, las hojas, al no tener hijos, no utilizan esos punteros. Ahora los
van a utilizar para apuntar al rea de datos (puntero izqdo. = puntero externo)
18
E4
E1 E2
E3
E4 E5
E6
kmn =
k+1
m+1
mmn =
n hojas = e / kmn
e = n total de entradas
19
20
21