Sei sulla pagina 1di 16

Concepto de Archivo

El Sistema de Archivos es la parte del sistema de administracin del


almacenamiento responsable, principalmente, de la administracin de
los archivos del almacenamiento secundario.
Es la parte del S. O. responsable de
controladamente la informacin de los archivos.

permitir compartir

El sistema de archivos es un mtodo para el almacenamiento y


organizacin de archivos en una computadora y en los datos que estos
contienen, para hacer ms fcil la tarea de encontrarlos y accederlos.
Los sistemas de
archivos
son
usados
en
dispositivos
de almacenamiento como discos
duros y CD-ROM e
involucran
el mantenimiento de
la
localizacin
fsica
de
los
archivos.
Tambin un sistema de archivos es un conjunto de tipo de datos
abstractos que son implementados para el almacenamiento, la
organizacin jerrquica, la manipulacin, el acceso, el direccionamiento
y la recuperacin de datos. Los sistemas de archivos comparten mucho
en
comn
con
la
tecnologa
de
las bases
de
datos.
En general, los sistemas operativos tienen su propio sistema de
archivos. En ellos, los sistemas de archivos pueden ser representados de
forma textual ejemplo el Shell de DOS o grficamente el
Explorador en Windows utilizando un gestor de archivos

Un archivo virtual
Es un archivo de uso temporal que es utilizado por los procesos del
sistema
mientras
se
estn
ejecutando
dichos
procesos.
(Fig.5.2.1). Estos archivos se crean durante la ejecucin de un sistema y
los utiliza para el almacenamiento de informacin, intercambio y
organizacin mientras se ejecuta el sistema (Fig. 5.2.2), su tamao es
muy variable y terminan al detener la ejecucin del sistema, muchos de
ellos son borrados, por ejemplo, los archivos *.tmp (Fig. 5.2.3).
Se le conoce como archivo virtual, aquel que contiene los datos
generados por el usuario.

Archivo Real
Es un objeto que contiene programas, datos o cualquier otro elemento.
Un archivo se muestra de manera real, en la informacin del espacio
que ocupa en un disco duro o sistema de almacenamiento, en otras
palabras, su tamao en bytes. (Fig. 5.2.4)

Componentes de un sistema de archivos


Lo conforman todas aquellas rutinas encargadas de administrar todos
los aspectos relacionados con el manejo de Archivos.
En UNIX se define un File System como un sistema de software dedicado
a la creacin, destruccin, organizacin y lectura, escritura y control de
acceso de los archivos, funcionalmente los componentes de un sistema
de archivos son lenguajes de comandos, interpretador de comandos,
manejador del almacenamiento secundario, sistema de entrada y salida
y mecanismos de respaldo y recuperacin.
En general, un Sistema de Archivos est compuesto por: Mtodos De
Acceso, Administracin De Archivos, Administracin De
Almacenamiento Secundario, Mecanismos De Integridad.
Mtodos De Acceso. Se ocupan de la manera en que se tendr acceso
a la informacin almacenada en el archivo. Ejemplo: Secuencial, Directo,
indexado, etc.
Administracin De Archivos. Se ocupa de ofrecer los mecanismos
para almacenar, compartir y asegurar archivos, as como para hacer
referencia a ellos.
Administracin De Almacenamiento Secundario. Se ocupa de
asignar espacio para los archivos en los dispositivos de almacenamiento
secundario. En la siguiente figura se muestra un ejemplo de la
administracin de espacio en un disco duro.
Mecanismos De Integridad. Se ocupan de garantizar que no se
corrompa la informacin de un archivo, de tal manera que solo la
informacin que deba estar en el, se encuentre ah.
Mecanismos de Organizacin Lgica. Contiene las diferentes rutinas
y comandos a travs de los cuales el usuario podr estructurar sus
archivos virtuales.
Directorio de Identificadores. Convierte los identificadores simblicos
de los archivos en identificadores internos, los cuales apuntarn a su
descriptor o a una estructura que permite encontrar el archivo.

Sistemas Tericos de Archivos. Su objetivo es el de activar y


desactivar a travs de las rutinas de abrir y cerrar archivos y verifica el
modo de acceso.
Mecanismos de Organizacin Fsica. Traslada las direcciones lgicas
en direcciones fsicas correspondientes a las estructuras de memoria
secundaria y los buffers en memoria principal necesarios para la
transferencia de datos.
Mecanismos de E/S. Por cada peticin de acceso al archivo real, este
mecanismo genera la secuencia de operaciones elementales de entrada
y salida que se necesita.
SCHEDULING E/S. En este nivel es donde se tiene el nmero de
peticiones pendientes as como de las que se estn realizando y lleva el
control y asignacin de tiempo de CPU a las diferentes peticiones de
E/S.

Organizacin Logica y Fisica


https://sites.google.com/site/materiasisoperativo/unidad-5-sistemasde-archivos/5-4-organizacion-logica-y-fisica

Mecanismos de acceso a los archivos


Existen varios mecanismos para acceder los archivos: Directorios,
descriptores de archivos, mecanismos de control de acceso y
procedimientos para abrir y cerrar archivos.

Directorios
Generalmente son utilizados por los S. O. para llevar un registro de los
archivos. En muchos sistemas son a su vez tambin archivos.

Sistemas Jerrquicos de Directorios


El directorio contiene un conjunto de datos por cada archivo
referenciado. Una posibilidad es que el directorio contenga por cada
archivo referenciado:

El nombre.

Sus atributos.

Las direcciones en disco donde se almacenan los datos.

Otra posibilidad es que cada entrada del directorio contenga:


El nombre del archivo.
Un apuntador a otra estructura de datos donde se encuentran los
atributos y las direcciones en disco.
Al abrir un archivo el S. O.:
Busca en su directorio el nombre del archivo.
Extrae los atributos y direcciones en disco.

Graba esta informacin en una tabla de memoria real.

Todas las referencias subsecuentes al archivo utilizarn la


informacin de la memoria principal.

El nmero y organizacin de directorios vara de sistema en sistema:


Directorio nico: el sistema tiene un solo directorio con todos los
archivos de todos los usuarios (ver Figura 4.1).
Un directorio por usuario: el sistema habilita un solo directorio
por cada usuario (ver Figura 4.2).

Un rbol de directorios por usuario: el sistema permite que


cada usuario tenga tantos directorios como necesite, respetando
una jerarqua general (ver Figura 4.3).

Descriptores de archivos
El descriptor de archivos o bloque de control de archivos es un bloque
de control que contiene informacin que el sistema necesita para
administrar un archivo.
Es una estructura muy dependiente del sistema.
Puede incluir la siguiente informacin:

Nombre simblico del archivo.


Localizacin del archivo en el almacenamiento secundario.

Organizacin del archivo (mtodo de organizacin y acceso).

Tipo de dispositivo.

Datos de control de acceso.

Tipo (archivo de datos, programa objeto, programa fuente, etc.).

Disposicin (permanente contra temporal).

Fecha y tiempo de creacin.

Fecha de destruccin.

Fecha de la ltima modificacin.

Suma de las actividades de acceso (nmero de lecturas, por


ejemplo).

Los descriptores de archivos suelen mantenerse en el almacenamiento


secundario; se pasan al almacenamiento primario al abrir el archivo.
El descriptor de archivos es controlado por el sistema de archivos ; el
usuario puede no hacer referencia directa a l.
A cada uno de los archivos se le asigna un descriptor el cual contendr
toda la informacin que necesitar el sistema de archivos para ejecutar
con l los comandos que se le soliciten. El descriptor se mantendr en
memoria principal desde que el archivo es abierto hasta que sea
cerrado, y debe tener al menos la siguiente informacin, identificacin
del archivo, lugar de almacenamiento, informacin del modo de acceso.
Identificacin del archivo. Consiste de dos partes que es el nombre
simblico que es el que le da el usuario y un identificador interno que es
asignado por el sistema operativo (nmero). Lugar de almacenamiento

as como el tamao del archivo. Modo de acceso. Se debe indicar en


forma explcita quien puede accesar el archivo y conque derecho.

Fig. 5.5.1 Ejemplo ilustrativo del control de acceso

Mecanismo de control de acceso


Control de un sistema de informacin especializado en detectar los
intectos de acceso, permitiendo el paso de las entidades autorizadas, y
denegando el paso a todas las dems. Involucra medios tcnicos y
procedimientos operativos.
Mecanismo que en funcin de la identificacin ya autenticada permite
acceder a datos o recursos.

Procedimientos para abrir y cerrar archivos


Open (abrir): antes de utilizar un archivo, un proceso debe abrirlo. La
finalidad es permitir que el sistema traslade los atributos y la lista de
direcciones en disco a la memoria principal para un rpido acceso en
llamadas posteriores.
Close (cerrar): cuando concluyen los accesos, los atributos y
direcciones del disco ya no son necesarios, por lo que el archivo debe
cerrarse y liberar la tabla de espacio interno.

Qu sistema de archivos utiliza mi sistema operativo


Mecanismos de recuperacin en caso de fallo
Recuperacin

Los archivos y directorios se mantienen tanto en memoria principal


como en disco, y debe tener. Se cuidado para que los fallos del sistema
no provoquen una prdida de datos o una incoherencia en los mismos.
Comprobacin de coherencia
Como hemos explicado en la Seccin 11.3, parte de la informacin de
directorios se almacena en la memoria principal (o en cach) para
acelerar el acceso. La informacin de directorios en la memoria principal
est, generalmente, ms actualizada que la correspondiente informacin
en el disco, porque la informacin de directorios almacenada en cach
no se escribe necesariamente en el disco nada ms producirse la
actualizacin.
Considere, entonces, el posible ejemplo de un fallo de la computadora.
El contenido de la cach y de los bferes, as como de las operaciones
de E/S que se estuvieran realizando en ese momento, pueden perderse,
y con l se perdern los cambios realizados en los directorios
correspondientes a los archivos abiertos. Dicho suceso puede dejar el
sistema de archivos en un estado incoherente. El estado real de algunos
archivos no ser el que se describe en la estructura de directorios.
Con frecuencia, suele ejecutarse un programa especial durante el
reinicio para comprobar las posibles incoherencias del disco y
corregidas.
El comprobador de coherencia (un programa del sistema tal como fsck
en UNIX o chkdsk en MS-DOS), compara los datos de la estructura de
directorios con los bloques de datos del disco y trata de corregir todas
las incoherencias que detecte. Los algoritmos de asignacin y de gestin
del espacio libre dictan los tipos de problemas que el comprobador
puede tratar de detectar y dictan tambin el grado de xito que el
comprobador puede tener en esta tarea. Por ejemplo, si se utiliza un
sistema de asignacin enlazada y existe un enlace entre cada bloque y
el siguiente, puede reconstruirse el archivo completo a partir de los
bloques de datos y volver a crear la estructura de directorios. Por el
contrario, la prdida de una entrada de directorio en un sistema de
asignacin indexada puede ser desastrosa, porque los bloques de datos
no tienen ningn conocimiento acerca de los dems bloques de datos del
archivo. Por esta razn, UNIX almacena en cach las entradas de
directorio para las lecturas, pero todas las escrituras de datos que
provoquen algn cambio en la asignacin de espacio o en algn otro tipo
de metadato se realizan sncronamente, antes de escribir los
correspondientes bloques de datos. Por supuesto, tambin pueden

aparecer problemas si se interrumpe una escritura sncrona debido a un


fallo catastrfico.

Fig. 5.8.1 Errores


La perdida de la informacin es uno de los factores que se le debe de
dar mayor importancia, por la sencilla razn de que al perder
informacin se puede perder lo que no nos podemos imaginar en cuanto
a la misma y ocasionar perdidas hasta hablar de una gran cantidad de
dinero. Para solucionar este o estos problemas todo sistema operativo
cuenta con al menos una herramienta de software que nos permite
recuperar informacin perdida hasta cierta medida, esto obedece de
acuerdo al dao causado o los daos. Si el sistema no cuenta con la
herramienta necesaria, deber adquirirse el software apropiado de algn
fabricante especializado en el ramo, por ejemplo Norton.
Es necesario proteger la informacin alojada en el sistema de archivos,
efectuando los resguardos correspondientes.
De esta manera se evitan las consecuencias generalmente catastrficas
de la prdida de los sistemas de archivos.
Las prdidas se pueden deber a problemas de hardware, software,
hechos externos, etc.

Manejo de un bloque defectuoso:


Se utilizan soluciones por hardware y por software.
La solucin en hardware:

Consiste en dedicar un sector del disco a la lista de bloques


defectuosos.
Al inicializar el controlador por primera vez:
o

Lee la lista de bloques defectuosos.

Elige un bloque (o pista) de reserva para reemplazar los


defectuosos.

Registra la asociacin en la lista de bloques defectuosos.

En lo sucesivo, las solicitudes del bloque defectuoso


utilizarn el de repuesto.

La solucin en software:

Requiere que el usuario o el sistema de archivos construyan


un archivo con todos los bloques defectuosos.
Se los elimina de la lista de bloques libres.

Se crea un archivo de bloques defectuosos:

Esta constituido por los bloques defectuosos.

No debe ser ledo ni escrito.

No se debe intentar obtener copias de respaldo de este


archivo.

Respaldos (copias de seguridad o de back-up)

Fig. 5.8.2 Es necesario realizar respaldos para asegurar informacin


Es muy importante respaldar los archivos con frecuencia.
Los discos magnticos fallan en ocasiones y es necesario tener cuidado
para garantizar que los datos perdidos debido a esos fallos no se pierdan
para siempre. Con este fin, pueden utilizarse programas del sistema
para realizar una copia de seguridad de los datos del disco en otro
dispositivo de almacenamiento, como por ejemplo un disquete, una
cinta magntica, un disco ptico incluso otro disco duro. La recuperacin
de la prdida de un archivo individual o de un disco completo puede ser

entonces, simplemente, una cuestin de restaurar los datos a partir de


la copia de seguridad.
Los respaldos pueden consistir en efectuar copias completas del
contenido de los discos (flexibles o rgidos).
Una estrategia de respaldo consiste en dividir los discos en reas de
datos y reas de respaldo , utilizndolas de a pares:

Se desperdicia la mitad del almacenamiento de datos en disco


para respaldo.
Cada noche (o en el momento que se establezca), la parte de
datos de la unidad 0 se copia a la parte de respaldo de la unidad 1
y viceversa.

Otra estrategia es el vaciado por incrementos o respaldo


incremental :

Se obtiene una copia de respaldo peridicamente (por ej.: una vez


por mes o por semana), llamada copia total.
Se obtiene una copia diaria solo de aquellos archivos modificados
desde la ltima copia total; en estrategias mejoradas, se copian
solo aquellos archivos modificados desde la ltima vez que dichos
archivos fueron copiados.

Se debe mantener en el disco informacin de control como


una lista de los tiempos de copiado de cada archivo, la que debe
ser actualizada cada vez que se obtienen copias de los archivos y
cada vez que los archivos son modificados.

Puede requerir una gran cantidad de cintas de respaldo dedicadas


a los respaldos diarios entre respaldos completos.

Para minimizar la cantidad de datos que haya que copiar, podemos


utilizar la informacin contenida en la entrada de directorio de cada
archivo. Por ejemplo, si el programa de copia de seguridad sabe cundo
se realiz la ltima copia de seguridad de un archivo y la fecha de ltima
modificacin del archivo contenida en el directorio indica que el archivo
no ha cambiado desde esa fecha, no ser necesario volver a copiar el
archivo. As un plan tpico de copia de seguridad podra ser el siguiente:
Da 1. Copiar en el soporte de copia de seguridad todos los archivos
del disco. Esto se denomina copia de seguridad completa.

Da 2. Copiar en otro soporte fsico todos los archivos que se hayan


modificado desde el da 1. Esta es una copia de seguridad incremental.
Da 3. Copiar en otro soporte fsico todos los archivos que se hayan
modificado desde el da 2.
Da N. Copiar en otro soporte fsico todos los archivos que se hayan
modificado desde el da N - 1. Despus, volver al da 1.
Podemos escribir las copias de seguridad correspondientes al nuevo ciclo
sobre el conjunto anterior de soportes fsicos o en un nuevo conjunto de
soportes de copia de seguridad. De esta forma, podemos restaurar un
disco completo comenzando la restauracin con la copia de seguridad
completa y continuando con cada una de las copias de seguridad
incrementales. Por supuesto, cuanto mayor sea el valor de N, ms cintas
o discos habr que leer para efectuar una restauracin completa. Una
ventaja adicional de este ciclo de copia de seguridad es que podemos
restaurar cualquier archivo que haya sido borrado accidentalmente
durante ese ciclo, extrayendo el archivo borrado de la copia de
seguridad del da anterior. La longitud del ciclo ser un compromiso
entre la cantidad de soportes fsicos de copia de seguridad requeridos y
el nmero de das pasados a partir de los cuales podamos realizar una
restauracin. Para reducir el nmero de cintas que haya que leer para
efectuar una restauracin, una opcin consiste en realizar una copia de
seguridad completa y luego copiar cada da todos los archivos que hayan
cambiado desde la ltima copia de seguridad completa. De esta forma,
puede realizarse la restauracin utilizando slo la copia de seguridad
incremental ms reciente y la copia de seguridad completa, no
necesitndose ninguna otra copia de seguridad incremental. El
compromiso inherente a este sistema es que el nmero de archivos
modificado se incrementa a diario, por lo que cada copia de seguridad
incremental sucesiva contiene ms archivos y requiere ms espacio en
el soporte de copia de seguridad.

Consistencia del sistema de archivos


Muchos sistemas de archivos leen bloques, los modifican y escriben en
ellos despus.
Si el sistema falla antes de escribir en los bloques modificados, el
sistema de archivos puede quedar en un estado inconsistente.
La inconsistencia es particularmente crtica si alguno de los bloques
afectados son:

Bloques de nodos-i.
Bloques de directorios.

Bloques de la lista de bloques libres.

La mayora de los sistemas dispone de un programa utilitario que


verifica la consistencia del sistema de archivos:

Se pueden ejecutar al arrancar el sistema o a pedido.


Pueden actuar sobre todos o algunos de los discos.

Pueden efectuar verificaciones a nivel de bloques y a nivel de


archivos.

La consistencia del sistema de archivos no asegura la consistencia


interna de cada archivo, respecto de su contenido.

Generalmente pueden verificar tambin el sistema de directorios y


/ o de bibliotecas.

Generalmente los utilitarios utilizan dos tablas:

Tabla de bloques en uso.


Tabla de bloques libres.

Cada bloque debe estar referenciado en una de ellas.

Si un bloque no aparece en ninguna de las tablas se trata de una falla


llamada bloque faltante:

No produce daos pero desperdicia espacio en disco.


Se soluciona aadiendo el bloque a la tabla de bloques libres.

Tambin podra detectarse la situacin de falla debida a un bloque


referenciado dos veces en la tabla de bloques libres:

Esta falla no se produce en los sistemas de archivos basados en


mapas de bits, s en los basados en tablas o listas.
La solucin consiste en depurar la tabla de bloques libres.

Una falla muy grave es que el mismo bloque de datos aparezca


referenciado dos o ms veces en la tabla de bloques en uso:

Como parte del mismo o de distintos archivos.


Si uno de los archivos se borra, el bloque aparecera en la tabla de
bloques libres y tambin en la de bloques en uso.

Una solucin es que el verificador del sistema de archivos:


o

Asigne un bloque libre.

Copie en el bloque libre el contenido del bloque conflictivo.

Actualice las tablas afectando el bloque copia a alguno de los


archivos.

Agregue el bloque conflictivo a la tabla de bloques libres.

Informe al usuario para que verifique el dao detectado y la


solucin dada.

Otro error posible es que un bloque est en la tabla de bloques en


uso y en la tabla de bloques libres:

Se soluciona eliminndolo de la tabla de bloques libres.

Las verificaciones de directorios incluyen controles como:

Nmero de directorios que apuntan a un nodo-i con los contadores


de enlaces almacenados en los propios nodos-i; en un sistema
consistente de archivos deben coincidir.

Una posible falla es que el contador de enlaces sea mayor que el


nmero de entradas del directorio:

Aunque se eliminaran todos los archivos de los directorios el


contador sera distinto de cero y no se podra eliminar el nodo-i.
No se trata de un error serio pero produce desperdicio de espacio
en disco con archivos que no se encuentran en ningn directorio.
Se soluciona haciendo que el contador de enlaces en el nodo-i
tome el valor correcto; si el valor correcto es 0, el archivo debe
eliminarse.

Otro tipo de error es potencialmente catastrfico:

Si dos entradas de un directorio se enlazan a un archivo, pero el


nodo-i indica que solo existe un enlace, entonces, al eliminar

cualquiera de estas entradas de directorio, el contador del nodo-i


tomar el valor 0.
Debido al valor 0 el sistema de archivos lo seala como no
utilizado y libera todos sus bloques.

Uno de los directorios apunta hacia un nodo-i no utilizado, cuyos


bloques se podran asignar entonces a otros archivos.

La solucin es forzar que el contador de enlaces del nodo-i sea


igual al nmero de entradas del directorio.

Tambin se pueden hacer verificaciones heursticas , por ej.:

Cada nodo-i tiene un modo, pero algunos modos son vlidos


aunque extraos:
o Ej.: Se prohibe el acceso al propietario y todo su grupo, pero
se permite a los extraos leer, escribir y ejecutar el archivo.
o

La verificacin debera detectar e informar de estas


situaciones.

Se debera informar como sospechosos aquellos directorios con


excesivas entradas, por ej., ms de mil.

Potrebbero piacerti anche