Disciplina: Sistemas Distribudos Professor: Theo Lins
Resumo Crtico do Artigo:
Mecanismos de Failover para Controladores SDN Distribudos
Danielle Cristine Ribeiro Carneiro 10.2.8234
Deise Kelley Silva 12.2.8131
UNIVERSIDADE FEDERAL DE OURO PRETO
INSTITUTO DE CINCIAS EXATAS E APLICADAS Disciplina: Sistemas Distribudos Professor: Theo Lins
Mecanismos de Failover para Controladores SDN Distribudos
O artigo aqui apresentado fala sobre SDN (Software-Defined Network). SDN uma Rede Definida por Software, seu uso proporciona maior controle na configurao da rede, que gerenciada pelo software de forma lgica centralizada, essa tcnica tem sido proposta para resolver o problema de desempenho e resilincia. Este artigo, aborda o problema do failover para controladores SDN distribudos, propondo duas estratgias para controladores ativos de vizinhos para assumirem o controle de switches orfos OpenFlow. A estratgia 1 de uma incorporao gulosa e a 2 um pr-particionamento entre os controladores. O plano de controle pode ser fsico, contendo um controlador centralizado ou ento ter controladores distribudos. Fazendo essa distribuio podemos ter a escalabilidade quando levamos em conta o tamanho da rede. Se existe um plano de controle descentralizado, teremos um benefcio considervel, que seria no ter somente um ponto de falha. Para cada parte dos planos de controle existe um controlador gerenciando. Supondo que haja 03 redes SDN, e 03 domnios (A, B, C), se um switch de um domnio tiver ligao direta com o switch vizinho, ele pode trocar comando de dados entre si, possibilitando a comunicao entre quaisquer elementos da rede global. Com isso possvel evitar uma grande sobrecarga na rede e problemas com escalabilidade, pois no vai existir um plano de controle totalmente entrelaado. Quando um controlador falha, fica impossibilitado realizar qualquer operao entre as redes, pois parte dos switches no teriam conexo com o plano de controle, tornandose switches rfos. Essa situao pode ser considerada uma desvantagem significativa do uso de SDN, pois causaria uma interrupo, atrasando a execuo das tarefas. Mas existem algumas maneiras de contornar essas interrupes. Com o uso de mecanismos de failover possvel garantir que esses switches rfos consigam iniciar uma conectividade entre os controladores restantes. Por exemplo, existe os domnios A, B, e C. A e B so vizinhos, assim como B e C. Se o controlador do domnio B falha, os domnios A e C, que no eram vizinhos diretos, se expandem para controlar o switch rfo do domnio B. Isso geraria uma sobrecarga considervel na rede, mesmo que o objetivo do uso desse mecanismo minimizar esses impactos. Foram abordados 02 mecanismos de failover no estudo para redes de fluxos abertos (OpenFlow), que passam o controle dos switches rfos para os controladores ativos. necessrio agir de forma mais rpido possvel diante dessas falhas, garantindo a conectividade da rede. No primeiro mecanismo utiliza-se o algoritmo guloso ou ganancioso. Nesse caso os switches precisam ser modificados para localizar o novo controlador, enviando mensagens especficas quando se tornam rfos, assim os controladores ativos assumem o controle dos switches rfos.
UNIVERSIDADE FEDERAL DE OURO PRETO
INSTITUTO DE CINCIAS EXATAS E APLICADAS Disciplina: Sistemas Distribudos Professor: Theo Lins
J no segundo mecanismo, utilizado um algoritmo de pr-partio, que faz os
controladores espontaneamente indicarem um switch rfo para seus vizinhos assumirem no caso de falha. Foi implementado os dois mecanismos failover utilizando o controlador Floodlight, o Mininet (simula rede tipo OpenFlow), e uma interface para a comunicao baseada em disco. Com os resultamos notvel que com o algoritmo de pr-particionamento h um curto failover, com impactos no muito significativos e pequena sobrecarga. J o algoritmo guloso ou ganancioso mostra um failover de durao linear equivalente aos switches rfos, porm no foram identificadas sobrecargas adicionais. Com o estudo do artigos conclui-se que a diferena mais significativa entre o mecanismo failover que utiliza o algoritmo guloso, que ele consome uma maior tempo nas interrupes, principalmente quando o nmero de switches rfos alto. J o algoritmo de pr-particionamento consegue se recuperar mais rapidamente dessas interrupes, diminuindo o atraso. Uma maneira de minimizar as perdas em pacotes durante esse processo seria armazenar em buffer os pacotes at restaurar a conectividade entre os controladores. Assim os pacotes chegariam corretamente ao destinatrio mesmo com um atraso. Essa abordagem, porm, poderia encher o buffer. Ento conclui-se que essas abordagens necessitam de um estudo mais aprofundado para garantir que essas falhas, interrupes e atrasos sejam minimizados da melhor forma possvel, tentando chegar a uma soluo tima. As abordagens so teis e resolvem as algumas questes importantes, porm geram outros problemas, que podem ser considerados graves dependendo de cada aplicao. Para finalizar, fica uma imagem que ilustra muito bem o funcionamento da arquitetura dessas abordagens, que explicamos anteriormente.
Figura 01 Arquitetura Distribuda de Controladores SDN