Sei sulla pagina 1di 14

Introdução

Uma visão geral da disciplina

(adaptado dos slides do Prof. Flávio Vidal)


Visão Geral

Introdução à Estrutura de Arquivos


ou Organização de Arquivos

Por quê estudar projetos de organização de


arquivos?

Histórico das Estruturas de Arquivos.


Visão Geral
Definição:
Organização de Arquivos – OA (ou Estrutura de
Arquivos): é a combinação de representação de
dados em arquivos e das operações necessárias
para acessar estes dados;
OA permite aplicações para:
Leitura (read);
Escrita (write);
Alterar (modify);
Também permite busca de dados (finding)
utilizando critérios definidos e leitura de dados
em uma ordem definida.
Visão Geral

Por quê estudar Projeto de Organização de


Arquivos?

Armazenamento de Dados

Memória x Armazenamento Secundário

Como melhorar o tempo de acesso ao


Armazenamento Secundário?
Visão Geral

Armazenamento de Dados
Armazenamento Primário: Memória do Computador
(RAM, E2PROM, ROM,...);

Armazenamento Secundário: Dados Online de


Discos, “Tapes”, CD/DVD ROMs, etc que podem ser
acessados pelo Computador;

Armazenamento Terciário: Arquivamento de Dados


(Dados de Discos, Tapes, CD/DVD ROMs,... Offline que
não são acessados diretamente pelo computador);
Visão Geral

Memória x Armazenamento Secundário


A Memória Secundária (ex.: Discos) pode
armazenar milhares de megabytes em um
pequeno espaço físico;
Memória do Computador (RAM) → LIMITADA!
Acesso à memória do Computador (RAM)
muito mais veloz que a Memória Secundária
• RAM → 120 nanosegundos;
• Memória Secundária → 30 milisegundos;
Visão Geral

Como melhorar o tempo de acesso ao


Armazenamento Secundário?
Melhorando a Organização de Arquivos;
• Principalmente na forma de representar os dados;
• Implementação das operações das operações com
arquivos;
REDUÇÃO DO TEMPO DE ACESSO!
Visão Geral

Objetivos Gerais de Projetos em Organização


de Arquivos:
Ter a informação necessária para acesso às
informações armazenadas em disco;
Se não é possível, acesse alguma informação
da melhor forma possível;
Agrupe toda a informação que se deseja
acessar em um único acesso ao disco;
Visão Geral

Arquivos Estáticos x Arquivos Dinâmicos

O acesso é relativamente simples quando a


informação do arquivo não se modifica;

Entretanto, quando o arquivo aumenta e/ou


diminui de tamanho, adicionando ou apagando
dados, o processo se torna muito mais difícil;
Visão Geral

Histórico de OA
Primeiros Trabalhos
• Arquivamento em fitas magnéticas (Tapes);
• Acesso de forma seqüencial e o custo de acesso aumenta
proporcionalmente com o tamanho do arquivo;
Visão Geral

Histórico de OA
Surgimento dos Discos e Índices
• Crescimento elevado dos arquivos e o acesso seqüencial
não era mais uma boa solução;

• Os discos permitiram o acesso direto;

• Com os Índices foi possível ter uma lista de Chaves (Keys) e


Ponteiros (Pointers) em um pequeno arquivo que poderia
ser localizado rapidamente;

• Com eles foi possível ao usuário ter acesso direto aos


arquivos primários;
Visão Geral

Histórico de OA
Surgimento das Estruturas por Árvores
• Os índices têm características seqüenciais, quando o arquivo
cresce em demasiado:
• dificuldades no gerenciamento;
• Ideia de estrutura baseada em Árvores para gerenciar índices
• início dos anos 60;
• Árvores podem crescer indefinidamente, bem como as
gravações podem ser adicionadas e apagadas, resultando em
longas buscas...
• ... vários acessos ao disco para encontrar a gravação;
Visão Geral

Histórico de OA
Árvores Balanceadas (Balanced Trees)
• 1963: ideia da AVL (Adelson-Velskii and Landis) Trees para
dados na memória;
• AVL Trees não se aplica quando arquivos tem os “nós” das
árvores compostos por dezenas ou centenas de arquivos;
• 1970: ideia das B-Trees
• Surgiu a expressão tempo de acesso O(logk N) onde N é o número
de entrada de gravações no arquivo e K é o número de entradas
indexadas em um único bloco de uma B-Tree;
• Essa estratégia permitiu encontrar uma entrada de dados entre
milhões de outros com somente 3 ou 4 acessos ao disco;
Visão Geral

Histórico de OA
Hash Tables
• Com as B-Trees utilizar 3 ou 4 acessos é razoável, mas não
alcança a meta ideal de acessar dados em um único acesso
ao disco;

• Posteriormente, a Técnica de Hashing foi uma boa


metodologia de alcançar esta “meta” para arquivos que não
tinham grande variação de tamanho com o passar do tempo;

• Extendible Dynamic Hashing permite recuperação com um


ou até dois acessos ao disco, não importando o tamanho do
arquivo;

Potrebbero piacerti anche