Sei sulla pagina 1di 18

Sistemas Operativos I

Tema II. Concepciones avanzadas


Conferencia: El sistema de archivos
Sumario:
Introduccin
Arquitectura
Asignacin de espacio
Control de espacio libre
Introduccin
La parte mas visible de cualquier sistema operativo es su sistema de archivo,
al menos desde el punto de vista del usuario final. Este fenmeno ocurre
debido a que la mayora de los usuarios hacen trabajos que tienen efectos
directos sobre este subsistema y lo realizan, adems, de forma interactiva.
Se puede aadir, que la mayora de las aplicaciones tambin actan sobre el
sistema de archivo si se toma en cuenta que su propsito principal es procesar
datos, los cuales muchas veces (en realidad casi siempre) residen en archivos
y el resultado de procesar esos datos se almacena en archivos.
El fenmeno es tan comn que algunas personas tienen una visin simplificada
del sistema operativo al reducirlo al subsistema de archivos.
El sistema de archivo est formado por dos partes perfectamente distinguibles
(al menos en funciones): Un conjunto de archivos que almacenan los datos en
s y una estructura de directorio, ambos aspectos se tratan en este documento.
El Sistema de archivo de cualquier SO puede dividirse de manera lgica para
su estudio en tres partes:
Interfaz del sistema de archivo: parte que presenta el sistema de archivo a
los usuarios y programadores.
ESTUDIAR captulo 10 del libro de texto Sistemas Operativos 7ma Edicin,
2005, (Silberschatz_Galvin__Gagne), pgina 333. Digital en la plataforma.
Implementacin del Sistema de archivo: parte que define las estructuras de
datos y algoritmos que usa el SO para implementar la interfaz anterior.
ESTUDIAR captulo 12 del libro de texto Sistemas Operativos 7ma Edicin,
2005, (Silberschatz_Galvin__Gagne), pgina 369.
Estructura de los dispositivos de almacenamiento masivo: parte de ms
bajo nivel del sistema de archivo que est formada por los equipos que
almacenan la informacin en s, as como el conjunto de algoritmos que se
asocian a la manipulacin de dichos dispositivos.
ESTUDIAR captulo 12 del libro de texto Sistemas Operativos 7ma
Edicin, 2005, (Silberschatz_Galvin__Gagne), pgina 407.
CONSULTAR otros materiales colocados en la plataforma que abarcan estos
aspectos para una mejor preparacin.
Este material abarca las dos primeras partes lgicas del Sistema de Archivos
de un SO.
Desarrollo
Las computadoras pueden almacenar informacin sobre diferentes soportes,
tales como: discos (de varios tipos), cintas magnticas, memorias flash, etc. La
naturaleza de cada uno de estos medios es dismil y para que la computadora

pueda trabajar con eficiencia debe existir una forma homognea de tratar sus
contenidos. El SO hace una abstraccin de los elementos fsicos que se
relacionan con cada uno de los equipos de almacenamiento y trata a los datos
como una unidad lgica que recibe el nombre de archivo. El SO mapea los
archivos sobre equipos fsicos, lo cuales regularmente son medios de
almacenamiento de informacin en forma permanente (no voltil como es la
memoria).
Archivo
Un archivo es un conjunto de datos relacionados y almacenados sobre algn
soporte secundario de almacenamiento que responde a un nombre. El nombre
se usa para hacer operaciones sobre el archivo, las cuales pueden ser:
borrarlo, copiarlo, moverlo, renombrarlo, leerlo, etc.
El conjunto de datos que conforma el archivo puede tener un formato rgido o
no tener formato alguno y en general puede ser una secuencia de bits, bytes,
lneas o registros.
Tpicamente los archivos contienen programa (fuente, objeto o en algn cdigo
intermedio) y datos (numricos, alfabticos, alfanumricos, binarios).
La informacin contenida en un archivo la define su creador, por ejemplo: fotos,
imgenes, programas, etc.
Atributos y operaciones
Los nombres de los archivos deben tener un significado para el usuario que los
crea o usa (no es obligatorio, pero s recomendable), por ejemplo ya se conoce
que los archivos que contienen programas hechos con el lenguaje C deben
finalizar con .c (el compilador cc y gcc lo exige).
El nombre del archivo es una cadena de caracteres alfanumricos y su longitud
mxima difiere de un SO a otro, as como la distincin entre letras minsculas y
maysculas (por ejemplo, Unix las distingue y Windows no).
Asociado a todo archivo existe un conjunto de atributos que puede variar de un
SO a otro (aunque algunos son invariantes), entre esos atributos cabe
mencionar los siguientes: el nombre, el tipo, la localizacin, el tamao, etc.
Por otra parte, sobre los archivos se realizan operaciones, la mayora de ellas
son muy conocidas por cualquier persona hoy en da, cabe citar las siguientes:
copiar, leer, borrar, mover, etc.
Para hacer las operaciones sobre un archivo especfico es necesario acceder a
cierta informacin que est contenida dentro de una estructura de datos que
indexa los archivos para poder localizarlos y que recibe el nombre de
directorio. El SO mantiene una Tabla de Archivos Abiertos que permite
conocer, entre otras cosas, cul es la prxima entrada del archivo que se leer
en acceso secuencial, quin o quines pueden hacer esa operacin, etc. La
figura 11.1 muestra algunos de los atributos de los archivos que se obtuvieron
con la ejecucin del comando ls al (listar todos los archivos en formato largo)
en un sistema operativo de la familia UNIX, algunos de los atributos (como la
referencia al i-nodo) permanecen ocultos al usuario.

Figura 11.1. Algunos de los atributos de los archivos en un SO UNIX


La arquitectura del sistema del archivo
Una forma tpica de organizacin del sistema de archivos se aprecia en la
figura 11.2 (puede diferir de acuerdo a las particularidades del SO). En ella, el
sistema se presenta como un conjunto de capas: las capas inferiores estn
ms cercanas al hardware y las superiores a los usuarios, de ah que mientras
ms arriba se siten, se tendr una concepcin ms abstracta del sistema.
La capa de los manipuladores (device driver) acta directamente sobre el
hardware, en este caso los perifricos, los canales o los controladores. Esta
capa es la responsable de arrancar la operacin de entrada/salida sobre el
equipo y completarla.
Entrada salida lgica
Supervisor de E/S bsico
Sistema de archivo bsico (E/S fsica)
Manipuladores
Figura 11.1. Organizacin tpica de un sistema de archivos
El sistema de archivo bsico es el enlace primario entre el sistema de
cmputo y el mundo externo, trabaja con bloques de datos que se intercambian
con el equipo, pasndolos de la memoria al equipo y viceversa. Esta parte del
sistema no conoce nada acerca de la estructura de los datos que manipula.
El supervisor de E/S bsico es el responsable de todos los comienzos y
culminaciones de entradas y salidas sobre archivo y mantiene una estructura
de control para conocer la situacin de los equipos de E/S, el estado de los
archivos y la planificacin.

La capa entrada salida lgica habilita, para los usuarios y aplicaciones, una
forma de acceder a la informacin almacenada sobre los perifricos, a este
nivel se trabaja con archivos y no con bloques como lo hace la capa de entrada
salida fsica.
Estructura de directorio
Todo sistema de archivo posee, como parte de su organizacin, una estructura
de datos denominada tabla de directorio que sirve para localizar los archivos.
La tabla de directorio contiene los datos que permiten manipular y referenciar
los archivos. El acceso a esas tablas se hace siempre a travs de llamadas al
sistema.
La figura 11.3 presenta una tabla de directorio tpica de un SO hipottico, como
se puede apreciar en esta estructura de datos estn presentes diversos
campos para especificar datos acerca de los archivos referidos desde esa
tabla. Algunos sistemas de archivos no poseen mucha informacin en el
directorio, se pueden tener dos extremos, en uno el directorio solo contiene un
nombre y un puntero a otra estructura que complementa la informacin (como
en UNIX) y en el otro extremo el directorio contiene toda la informacin relativa
al archivo, incluso su localizacin completa (el ya obsoleto CP/M).
Nombre

Tipo

Direccin
de inicio

Fecha

Hora

Tamao

Propietario

Figura 11.3. Tabla de directorio de un SO hipottico


La estructura del directorio puede ser de un solo nivel (casi no se usa hoy en
da) o de varios niveles o jerrquica como lo es la estructura en forma de rbol
de los SO UNIX y Windows. La figura 11.4a muestra la estructura de directorio
tpica de un SO de la familia UNIX y la figura 11.4b muestra la estructura de
directorio de un directorio My Documents tpico de un SO de la familia MSWindows.

Figura 11.4a. Estructura de directorio tpica de UNIX

Figura 11.4b. Estructura de directorio tpica de MS-Windows

Desde el punto de vista de los usuarios y las aplicaciones existen dos formas
de acceder a la informacin contenida en una estructura como la mostrada en
las figuras 11.4

Camino absoluto. Especfica el camino que conduce hasta el directorio o


archivo que se desea localizar a partir del directorio raz (figura 11.5).
Camino relativo. Especfica el camino que conduce hasta el directorio o
archivo que se desea localizar a partir del algn directorio diferente al
directorio raz y que normalmente es el directorio actual o de trabajo
(figura 11.6).

Figura 11.5. Camino absoluto hasta el directorio john

Figura 11.6. Camino relativo hasta los directorios work y play a partir de carol
Bloque
Un bloque es la unidad mnima de asignacin de espacio en disco. Lo cual
quiere decir que siempre que se pida un cierto espacio en disco, el sistema de
archivo proporciona una cantidad que, por lo regular, es mayor que la pedida.
El problema de asignar el espacio por bloque viene dado por el hecho de que
sera muy poco prctico que cada byte del sistema de archivo fuera accedido
de forma individual ya que se gastara mas espacio para controlarlo que para
guardar informacin til.

Esta forma de asignar espacio hace que se pierdan algunos bytes, a veces
todos menos uno, en el ltimo bloque del archivo. Este fenmeno se conoce
como fragmentacin interna y no tiene solucin. Una forma de apreciar el
problema es usando el comando dir en el ambiente de comandos del SO
Windows, cuando se ejecuta ese comando sobre un directorio especfico se
puede notar que el espacio ocupado por los archivos y su tamao real difieren.
Asignacin de espacio
Existen diferentes mtodos y formas para asignar el espacio sobre un soporte
de almacenamiento externo, para considerar estas formas se deben tomar en
cuenta los criterios siguientes:
1. Cuando se cree un nuevo archivo, se le asignar todo el espacio que
necesita?
2. Qu tamao debe tener un bloque?
A la primera pregunta, se puede responder que s y hacer una estrategia de
preasignacin. Si se usa esa forma de trabajo se exige que se conozca el
tamao del archivo en el momento de su creacin, lo cual resulta difcil e
incluso imposible en muchos casos y tambin trae por consecuencia que los
usuarios sobreestimen las necesidades y pidan un espacio que en realidad no
se necesitar. Del anlisis anterior queda claro que lo mejor es hacer una
asignacin dinmica.
Para responder la segunda pregunta debe analizarse que un tamao de bloque
muy pequeo conduce a tener una tabla enorme para controlar los bloques y
uno muy grande gasta mucho espacio ya que el ltimo bloque del archivo
puede quedar prcticamente vaco. De lo anterior se infiere que hay que tomar
una posicin intermedia de compromiso.
Forma de asignar espacio
Asignacin contigua
Este tipo de estrategia, asigna un conjunto de bloques contiguos en el
momento de la creacin del archivo, tal y como se aprecia en la figura 11.7. Es
una estrategia de preasignacin con bloques de memoria de longitud variable.
Obsrvese que: el archivo file1 comienza en el bloque 1 mientras el archivo
file2 comienza en el bloque 4. En ambos casos solo se necesita conocer el
bloque de inicio y la cantidad de bloques que ocupa cada archivo.
Ventajas
Este tipo de asignacin tiene las siguientes ventajas:
1. Permite el acceso directo a los datos, para lo cual solo se necesita la
direccin de inicio del archivo (est contenida en la tabla de directorio) y
el desplazamiento a partir de esa direccin.
2. El acceso es ms rpido debido a que se efectan menos movimientos
mecnicos para acceder a los datos (estn unos a continuacin de
otros).
3. Existe ms seguridad de recuperacin de datos perdidos.
Desventajas
1. Un archivo solo puede crecer hasta el inicio de su vecino, ya que
cualquier otro hueco que est libre no estar contiguo a l. Este

problema hace que los usuarios tiendan a sobreestimar la longitud de los


archivos y reserven espacios que en realidad son mayores que los que
necesitan, lo que implica un malgasto de este recurso.
2. Provoca fragmentacin externa, la cual viene dada por el hecho de que
no es posible satisfacer una solicitud de espacio a pesar de existir el
espacio en forma de huecos o espacios no contiguos y que sumados
satisfacen la peticin. La mayora de los SO que usan este tipo de
asignacin proveen algn mecanismo de desfragmentacin que tiene
como fin reunir todos los huecos y dejarlo como uno solo, pero este
mecanismo es costoso ya que implica la detencin de todos los trabajos
que se realizan sobre el perifrico.
Queda claro que las desventajas de este tipo de asignacin tienen un peso
mayor que sus ventajas, de ah que nos sea muy utilizado actualmente.

Nombre

Bloque de
inicio
1
4

file1
File2

Longitud
3
2

10

11

12

13

14

Figura 11.7. Asignacin contigua

Estrategias para la asignacin de espacio en colocacin contigua


Para satisfacer una peticin de tamao m el sistema de archivo tiene que
encontrar un espacio de tamao n que cumpla que m <= n. Existen tres
estrategias o polticas:
El primer acceso. Significa tomar el primer hueco que satisfaga la
demanda, o sea que cumpla que m <= n.
El mejor acceso. Significa tomar un hueco que satisfaga la demanda y
que sea el menor de todos los posibles. O sea m <= n y n = menor hi de
H = {h1, h2, } donde H representa el conjunto de todos los huecos
libres.

El peor acceso. Significa tomar un hueco que satisfaga la demanda y


que sea el mayor de todos los posibles. O sea m <= n y n = mayor hi de
H = {h1, h2, }

Debe observarse que la estrategia del mejor acceso tiende a dejar la memoria
fragmentada en pequeos espacios que, muchas veces, no son tiles a
ninguna demanda, de forma que el mejor acceso puede resultar la peor
solucin.
Por otra parte, la estrategia el peor acceso deja huecos mayores que, en
general, tendrn mayor probabilidad de ser tiles.
Con relacin al primer acceso es totalmente impredecible el resultado ya que
depender del orden en que estn los espacios libres.
Asignacin enlazada.
La asignacin enlazada, trata de resolver los problemas del mtodo anterior.
En este esquema cada bloque contiene un puntero al prximo bloque y los
bloques pueden estar en cualquier parte del equipo de almacenamiento,
observe la figura 11.8.
Nombre

Bloque de
inicio
2

Archivo1

Longitud
5

10

11

12

13

14

Figura 11.8. Asignacin enlazada


Ventajas
1. Permite que un archivo est disperso en memoria lo que, a pesar de
hacer el acceso ms lento en general, elimina el problema de la
fragmentacin externa y permite, adems, que los archivos puedan
crecer mientras hayan espacios libres.
Desventajas
2. No permite el acceso directo, para acceder al bloque n hay que recorrer
los n-1 bloques.
3. Gasta espacio adicional para puntero en cada bloque.
Este tipo de asignacin, al tratar de resolver los problemas de la asignacin
contigua, pone las cosas peores ya que un sistema de archivo que solo permita

acceso secuencial a sus datos se hace extremadamente lento e ineficiente. Por


ese motivo prcticamente no se usa hoy en da.
Asignacin indexada
La idea bsica se aprecia en la figura 11.9, obsrvese que uno de los bloques
del perifrico (el 4 en este caso) se usa para almacenar los ndices del archivo
y desde la tabla de directorio se apunta a ese bloque. La solucin que ofrece el
SO UNIX es prcticamente as y la que ofrece la familia Windows con su
sistema de archivo FAT (anexo 1), difiere un tanto ya que existe una gran tabla
de ndices para todos los archivos del sistema de archivo de un volumen dado
y en realidad dentro de la FAT existe una lista enlazada que es necesario
recorrer para localizar los bloques de datos.

Nombre
Archivo1

Bloque de
inicio
4

Longitud
6

10

11

12

13

14

1
5
0
9
10
14

Figura 11.9. Asignacin indexada

Este tipo de asignacin es el ms utilizado actualmente ya que resuelve los


problemas crticos:
No provoca fragmentacin externa.
Permite el acceso aleatorio.
Los archivos pueden crecer mientras haya espacio y forma de hacer
referencia a sus bloques.
Las malas noticias es que el contenido de un archivo est, generalmente,
disperso en el disco, lo cual hace que los accesos sean ms lentos que en la
colocacin contigua, pero las desventajas de esta ltima son demasiado serias
como para no tomarlas en cuenta.
Control del espacio libre

10

Para controlar el espacio libre se pueden usar varios tipos de estructuras de


datos. El sistema FAT (File Allocation Table), usa la misma estructura para
referirse a los espacios libres y a los bloques de los archivos (la tabla FAT),
pero en realidad y pese a la popularidad de los sistemas operativos de la
familia Windows no es lo ms usual ni lo ms eficiente, de ah que los
diseadores del SO Windows disearon un segundo sistema de archivo al cual
lo nombraron NTFS-New Technology File System- (anexo 2).
Control de espacio libre a travs de una tabla
El espacio libre se puede controlar con una tabla de espacios libres que posea
dos campos, el primero contiene la direccin del primer espacio libre y el
segundo su tamao (figura 11.10).
Direccin de inicio Tamao
10
23
80
12
Figura 11.10. Tabla de espacios libres
Cuando se necesita un espacio, el sistema de archivo consulta esa tabla y
toma el que se necesita, despus debe actualizar la tabla eliminando la entrada
que tom (si es que se ocup totalmente) o restableciendo el inicio y el tamao
si solo se tom parte de la entrada. Este esquema se usa en algunos sistemas
de colocacin contigua y tiene alguna sobre carga ya que cada vez que se
libere un espacio no basta con ponerlo en la tabla de espacio libres sino que
habr que verificar si exista algn espacio antes y despus de l, los cuales
deben eliminarse de la tabla para unirlos en un solo hueco.
Control del espacio libre usando un mapa de bits
Una mejor solucin es tener un mapa de bits (figura 11.11) que tendr una
longitud igual a la cantidad de bloques que posee el volumen, de forma que a
cada bit del mapa corresponde uno y solo un bloque del volumen. Se establece
un convenio, la mayora de las veces un 0 en la posicin n del mapa de bits
significa que el bloque n est libre y un 1 significa que est ocupado.
Para satisfacer una solicitud de n bloques habr que buscar n bits del mapa
de bit con valor 0.
1 1 1 0 1 0 0 0 1 1 0 0 0 0 0 1 1 1 1 0 0
Figura 11.11. Mapa de bits para control de espacios libres

Desfragmentar en sistemas indexados


En los sistemas de archivos contiguos es necesario desfragmentar cuando el
espacio libre queda constituido por huecos de diferentes tamaos que no
satisfacen las solicitudes. En ese caso la desfragmentacin (para muchos
autores es una compactacin) se refiere al hecho de agrupar todo el espacio
libre en un solo hueco.
En los sistemas indexados no existe la necesidad de desfragmentar debido a
que los espacios libres se ven como bloques individuales que pueden usarse
en cualquier forma debido a que los archivos pueden estar en bloques
dispersos por el disco.

11

La fragmentacin en un sistema indexado provoca que para acceder a la


informacin de un archivo exista la necesidad de realizar mltiples movimientos
del cabezal de lectura/escritura dando por resultado accesos ms lentos. Para
ayudar a resolver ese problema, la mayora de los SO que tienen sistemas de
archivos indexados ofrecen programas especiales para desfragmentar los
soportes de informacin. En este caso la desfragmentacin es la accin de
hacer que todos los archivos (si es que es posible) estn en forma contigua, la
figura 11.12 da una idea de esa solucin.

Figura 11.12. Desfragmentacin en un sistema indexado


Conclusiones
La parte ms visible de un SO es su sistema de archivo, pero es solo un
subsistema dentro del gran sistema y no el todo.
Existen diferentes mtodos o estrategias para asignar el espacio en un sistema
de archivo, todas tienen ventajas y desventajas, sin embargo el sistema
indexado se lleva las palmas dentro de los sistemas de archivo en disco. UNIX
y Windows usan este tipo de asignacin en disco, aunque con sustanciales
diferencias.
Los archivos, en realidad, son una abstraccin de un conjunto de datos
soportados sobre algn medio de almacenamiento y relacionados a partir de la
tabla de directorio, la cual es una estructura de datos contenida en cualquier
soporte de almacenamiento externo.
Adems de la tabla de directorio, cualquier soporte de informacin debe poseer
otra estructura de datos que le permita conocer qu partes del equipo estn
libres y cules estn ocupadas.
Bibliografa

12

o Operating System Concepts. Ninth Edition. Abraham Silberschatz (Yale


University), Peter Baer Galvin (Pluribus Networks), Greg Gagne
(Westminster College). Editorial John Wiley & Sons Inc. 2013. ISBN 978-1118-06333-0, ISBN BRV 978-1-118-12938-8.
Estudiar el captulo 11 (pgina 503).
(LOCALIZAR la informacin equivalente en la 7ma edicin del libro en
Espaol, ambos textos estn en la plataforma en Bibliografa)
o INFORMACIN que sigue sobre la estructura de la FAT (File Allocation
Table) del SO MS-DOS que est en la pgina siguiente de este documento.

13

Anexo 1. Sistema de archivo FAT


Las figuras 11.13 y 11.14 muestran las dos estructuras de datos que soportan
el sistema de archivo de la familia MS-Windows conocido como FAT (File
Allocation Table).
La tabla de directorio (figura 11.13) posee varios campos que brindan
informacin acerca de los archivos contenidos en el volumen, para el caso del
SO operativo MS-DOS (primero en usar la FAT), cada entrada en la tabla de
directorio tiene 32 bytes, los 8 primeros almacenan el nombre del archivo y los
tres que le siguen su extensin. Un campo muy importante es el que est
marcado como CI (clster inicial), ese campo es un puntero a una entrada en la
FAT (figura 11.14).
La FAT es una especie de matriz que permite referenciar todos los clster del
volumen (un disco, una memoria flash, etc.). Si el ensimo campo de la FAT
tiene un cero significa que el clster n est libre y si tiene un nmero diferente
de cero est ocupado. De esa forma la FAT tiene un doble propsito: el primero
es conocer la localizacin de los bloques de datos de cada archivo y el
segundo es controlar el espacio libre.
Nota:
La primera fila de la tabla de directorio y la primera fila y columna de la
FAT que se muestran en la figura 11.14 no forman parte de las
estructuras de datos y solo tienen un propsito didctico, adems el
tamao de la FAT se ha simplificado en aras de hacer ms claro el
ejemplo.

Figura 11.13. Tabla de directorio del sistema de archivo FAT

Figura 5.13. File Allocation Table (FAT)

En el ejemplo mostrado el el archivo SO I comienza en el bloque (cluster segn


la jerga Windows) 12. Ese puntero le sirve al SO para buscar el escaque 12 en
la FAT, en donde se dice cul es el prximo cluster, en este caso el 3, la
entrada 3 de la FAT sirve como nuevo puntero y seala al cluster 8, el cual a su
vez seala al 2 en donde termina el archivo, lo cual se seala con un nmero
14

especial (representado simblicamente por eof-end of file). Para mayor claridad


todas esas referencias se han sealado en color rojo.
De la misma forma el archivo SO II comienza en el bloque 23 y termina en el 40
(el camino se seala en color azul).
Debe quedar claro que el FAT no es ms que una tabla de apuntadores y el SO
tendr que hacer los clculos para saber, por ejemplo en un disco, en que
pistas y sectores del disco estn fsicamente los datos en s.

15

Anexo 2. Sistema de Archivo NTFS


Estructura
Al contrario del sistema FAT, la mxima longitud de una particin NTFS (hasta
el momento) solo est limitada por la capacidad del disco.
En NTFS pueden tenerse longitudes de clusters desde 512 bytes hasta 64
KBytes.
Los discos NTFS se dividen, simblicamente, en dos partes:
1. El primer 12% del disco se asigna a un rea que se denomina rea MFTun espacio en el cual crecen los metafile- no se pueden almacenar datos
en esta rea.
2. El resto es el rea de datos.
No obstante lo dicho anteriormente cualquier reporte del SO acerca del espacio
libre en el disco incluye el rea MFT. El mecanismo del rea MFT es el
siguiente: cuando no haya espacio para almacenar mas archivos se toma
espacio del rea MFT y se reduce su longitud una vez que vuelve a existir
espacio el rea MFT vuelve a crecer. Observe la figura siguiente.

MFT
En el sistema de archivo NTFS cada componente es un archivo, lo que incluye
hasta la informacin del sistema. El archivo ms importante es el MFT (Master
File Table) que est situado en el rea MFT y es un directorio centralizado que
contiene informacin de todos los archivos del disco incluyndolo a l mismo.
MFT se divide en registros de longitud fija (usualmente un 1 KByte) y cada
registro corresponde a algn archivo.
Los primeros 16 archivos son de contabilidad y son inaccesibles para el SO, se
denominan metafiles y el primer metafile es el MTF en s. Estos primeros 16
elementos de MFT constituyen la nica parte del disco que tiene una posicin
fija. Resulta interesante notar que existe una segunda copia de los tres
primeros registros que estn almacenados exactamente en la mitad del disco,
el resto de los MFT-file se pueden almacenar en cualquier otro archivo que
resida en cualquier parte del disco.
Metafiles
Los primeros 16 archivos de NTFS (metafiles) son archivos del sistema y cada
uno de ellos es responsable de algn aspecto del SO. La ventaja de esta
implementacin modular es su increble flexibilidad, por ejemplo en el sistema
FAT una falla fsica en el rea FAT es catastrfica en la operacin de todo el
disco.

16

Los metafiles estn en el directorio raz, sus nombres comienzan con el


carcter "$",la tabla siguiente muestra los metafiles.

$MFT

El propio MFT

$MFTmirr

Copia de los primeros 16 registros MFT (en el medio del disco)

$LogFile

journaling support file (see below)

$Volume

Informacin contable etiqueta del volumen, archivos del sistema, version,


etc.

$AttrDef

Lista de los atributos estndar de los archivos del volumen

$.

Directorio raz

$Bitmap

Mapa de bits de espacio libre

$Boot

Sector de arranque (particin bootable)

$Quota

Cuotas de uso del volumen

$Upcase

Tabla de acuerdo de letras maysculas y minsculas

Archivos y torrentes (streams)


Toda la informacin acerca de los archivos (todo menos los datos) se almacena
en registros MFT: su nombre, longitud, posicin en el disco, etc., para lo cual se
pueden usar uno o varios registros MFT que no tienen que estar contiguos.
Los elementos opcionales de un archivo (su torrente o stream de datos)
pueden estar en un registro MFT, por ejemplo un archivo sin datos, un archivo
pequeo que pudiera estar dentro del lmite de registros MFT.
Los directorios
El directorio NTFS es un archivo que especifica referencias a otros archivos y
directorios. Est dividido en bloques y cada uno de ellos contiene un nombre de
archivo, el atributo base y referencia al elemento MFT que contiene la
informacin completa del directorio. La estructura interna del directorio es un
rbol binario, lo cual permite bsquedas ms rpidas.

17

La figura anterior da una visin de una bsqueda en un rbol binario y una


bsqueda bruta como la que se hace en la FAT.
Journalising
El concepto de journalising se refiere a que si se arranca el sistema sin
haberlo cerrado correctamente no es necesario hacer un chequeo ya que la
recuperacin sucede de forma automtica a partir de su ltimo estado.
NTFS es un sistema seguro ante fallas que puede autocoregirse en casi todas
las situaciones.
.
Compression
Los archivos en un volumen NTFS tienen un atributo - "compressed", que
permite a cualquier archivo ser guardado de forma comprimida con el propsito
de ahorrar espacio y que esa compresin sea transparente para las
aplicaciones. La compresin se lleva a cabo por bloques de 16 clusters y se
usan "clusters virtual".

18

Potrebbero piacerti anche