Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Taisy Weber
Cluster
cluster ou agregado computadores com mltiplos processadores
termo usado para vasta gama de configuraes
nmero varivel de nodos de computao convencionais: de 2 nodos a poucos milhares opcionalmente alguns dispositivos de armazenamento compartilhados interconexes de alta velocidade exemplo de arquitetura tolerante a falhas exemplo da aplicao de conceitos de sistemas distribudos
Taisy Weber
The Design and Architecture of the Microsoft Cluster Service - A Practical Approach to High-Availability and Scalability, Werner Vogels et al., IEEE 1998
Definio
vantagens pode crescer muito mais do que um nico computador (escalabilidade) pode tolerar defeitos em nodos e continuar a oferecer servios (failover) pode ser construdo a partir de componentes de baixo custo
Taisy Weber
Outra definio
Cluster - um grupo de mquinas fsicas fracamente acopladas capazes de suportar o mesmo conjunto de mquinas virtuais. Qualquer mquina em um cluster pode substituir qualquer outra mquina no mesmo cluster
mquina virtual - um programa de aplicao com um endereo de IP associado, formado por um ou mais processos, que pode migrar entre as mquinas fsicas
A Flexible Clustered Approach to High Availablity Gary Hughes-Fenchel, IEEE 1997
Taisy Weber
Birman (96)
Caractersticas
como IBM-PCs ou estaes de trabalho
componentes padres:
nodos so computadores comerciais convencionais para aproveitar o baixo custo associado produo em massa
subsistema de gerenciamento:
cria a abstrao de uma entidade integrada
Taisy Weber
Caractersticas
infra-estrutura de cluster:
componentes do chassi e de conexo, fontes de energia, adaptadores de comunicao, e outros componentes de hardware especficos para clusters nem todos os clusters usam hardware especial
API de cluster:
coleo de rotinas do sistema para desenvolvedores e administradores inclui recursos para determinar nodos do cluster, monitorar seus estados, executar e monitorar aplicaes em nodos, acessar funes de gerenciamento
Taisy Weber
failover
poder tolerar defeitos em nodos e continuar a oferecer servios
baixo custo
poder ser construdo a partir de componentes COTS
Taisy Weber
Tipos
implementao
por hardware: mais eficiente, pouco adaptvel por software: menor custo
objetivos
alto desempenho balanceamento de carga alta disponibilidade
alguns autores falam de mais um tipo: disponibilidade contnua
Combinaes de tipos
bons esquemas de balanceamento de carga podem contribuir para aumentar a disponibilidade em cluster de alto desempenho:
nodos crticos podem compor um ncleo de alta disponibilidade todos os nodos podem contribuir mantendo rplicas de dados ou processos, checkpoints e logs uns dos outros
10
HA-Cluster
alta disponibilidade
tempo de inicializao aps falha (failover) pode variar de poucos minutos at uma hora MTTR aplicaes em sistemas de misso crtica servidores primrio e backups
disponibilidade contnua
tempo de failover na ordem de 10 segundos
primrio e backup executam mesmos processos (warm backup)
Taisy Weber
11
HA Cluster
A Highly Available Cluster consists of multiple machines interconnected by a common bus. Data is replicated at a primary and one or more backup machines. Data is accessed at the primary, using a location independent mechanism that ensures data integrity. If the primary copy of the data fails, access is recovered by switching to a backup copy. Switchover is transparent to the application, hence called seamless switchover. The fault model is fail-stop. The entire cluster is resilient to at least single failures. Designating data as highly available is selective in scope, and the overhead of replication and recovery is incurred only by applications that access highly available data. Highly Available Cluster: a Case Study Alain Azagury, et al. IEEE, 1994
Taisy Weber
12
13
modelo fail-stop
assume que se um nodo pra de enviar sinais, ele efetivamente no envia mensagens, nem altera dados no armazenamento estvel
tcnica antiga, muito usada antes mesmo dos primeiros clusters (Tandem, Targon, ...)
Taisy Weber
14
VAXcluster da Digital
primeiro cluster de sucesso formado por nodos VAX
VAX
VAX
....
VAX
se um VAX colapsa
contr disco contr disco LAN duplicada
todos os processos nele caem servios precisam ser reiniciados em outro servidor do cluster
no transparente ao usurio
disco
Taisy Weber
15
16
Taisy Weber
17
caso um nodo falhe, um outro nodo assume o seu lugar sem perda de conexo
Taisy Weber
18
19
Taisy Weber
20
Tandem
antiga fornecedora de solues de alta disponibilidade e clusters
produtos
cluster Himalaya software de clusterizao NonStop
comercializado como middleware
para o Unix e para o NT sobre plataforma Intel suporte para processamento de transaes e aplicaes de armazenamento de dados
21
Clusters Linux
servidores independentes executando o sistema operacional Linux maioria das solues baseada puramente em software
sem necessidade de hardware adicional, alm de uma conexo de alta velocidade
Taisy Weber
22
http: //www.linuxnetworx.com
23
Produtos livres
SteelEye Lifekepper Piranha
disponvel para servidores Linux, Unix e NT http://www.steeleue.com
servios de "failover" (um servidor com defeito substitudo)
TurboCluster EnFusion
http://www.turbolinux.com para distribuio TurboLinux
Linux-HA
Taisy Weber
24
Heartbeat no Linux-HA
ferramenta do projeto Linux-HA
http: //www.heng.com/alanr/ha/
permite configurar um nodo de backup para qualquer outro nodo em um cluster
25
Disponibilidade em HAclusters
qual a disponibilidade efetivamente alcanada? promessa de 99,99%
o VAXCluster no chegava a isso
como avaliar?
experimentalmente por injeo de falhas analiticamente atravs de modelos ou durante operao levantando registros de falha (em logs por exemplo) e analisando
Taisy Weber
26
Outros exemplos
vrios outros fabricantes oferecem solues para cluster de alta disponibilidade sugesto de pesquisa:
identificar esses fabricantes procurar nas pginas dos fabricantes por essas solues descobrir quais os recursos efetivamente oferecidos para HA
Taisy Weber
27
Problemas
problema de split-brain
cada computador detecta o outro como defeituoso e assume funes de primrio
modelo fail-stop
assumido pelos fabricantes mas raramente implementado
28
Bibliografia
Birman, K. Building secure and reliable network applications. Manning Publications Co, Geenwich, 1996 Vogels, W. The Design and Architecture of the Microsoft Cluster Service - A Practical Approach to High-Availability and Scalability, FTCS-IEEE, 1998 Azagury, Alain et al. Highly Available Cluster: a Case Study. FTCS-IEEE, 1994 Hughes-Fenchel, Gary. A Flexible Clustered Approach to High Availablity. FTCS-IEEE, 1997 links de fabricantes (ver slides)
Taisy Weber
29