Tolerância a falhas em software

2298 palavras 10 páginas
Os problemas de mascaramento de falhas e fracassos nas comunicações de rede ocorrem já de longa data. No entanto, sabemos que consistência ou atomicidade podem ser mantidas e que a recuperação (resiliency) pode ser suportada apesar das falhas.
Em hardware (HW), as falhas são geralmente causadas por desgaste físico. No entanto, um software (SW) não desgasta com o tempo, ele não tem propriedades físicas, sendo totalmente conceitual. Nele, as falhas são de desenvolvimento e bugs causados por erros humanos.
Outra definição que deve ser observada é que Tolerância a Falhas em Software (TFS) é diferente de Software Tolerante a Falhas (STF), já que este último é uma sub-área do primeiro. Ainda, um STF pode ser visto de duas formas: sobre
…exibir mais conteúdo…

Em sistemas que usam as técnicas de mascaramento de falhas, a detecção e a recuperação de erros ocorrem simultaneamente. Esses sistemas não necessitam incorporar todos os passos relacionados com sistemas tolerantes a falhas mencionados anteriormente, por razões óbvias. A ação de recuperação de erro envolve o uso de algoritmos de recuperação que podem ou não requererem decisões humanas.
A primeira classe de algoritmos é dita automática, ao passo que a segunda é dita controlada manualmente. Algoritmos de recuperação automática podem ser classificados de acordo com o estado do sistema após a ação de recuperação como: recuperação completa; recuperação com degradação; desligamento seguro.
Tratamento da Falha e Continuação do Serviço[editar]
Uma vez que os passos anteriores não asseguram que a falha que provocou o(s) erro(s) seja identificada, outro passo pode ser necessário a fim de evitar que a falha ocorra novamente. Um tipo particular de erro poderia ser o resultado de muitas fontes de falhas. Este passo é utilizado para isolar a falha ou para reconfigurar o resto do sistema em um esforço para evitar suas manifestações repetidas e, usualmente, envolve dois estágios: localização e reparo do sistema.
Defeitos e Erros[editar]
O sistema apresenta defeito porque não está fornecendo o serviço esperado mesmo seguindo a sua especificação.
Um defeito de serviço é um evento que ocorre quando o

Relacionados

  • Web service
    14295 palavras | 58 páginas
  • Portf Lio De Get O Da Qualidade De Softweare
    1380 palavras | 6 páginas
  • Arquitetura de sistema distribuído
    5150 palavras | 21 páginas
  • Desenho de Desenvolvimento de Software. Requisitos, Testes e Qualidade
    3584 palavras | 15 páginas
  • Resumo do capitulo oito (projeto detalhado)
    11028 palavras | 45 páginas
  • Iso/iec 9126
    3516 palavras | 15 páginas
  • Lista-exercicios iii- métricas e qualidade de produto
    957 palavras | 4 páginas
  • Trabalho sobre raid
    1431 palavras | 6 páginas
  • Tópicos Avançados de Engenharia de Software - Prova
    2236 palavras | 9 páginas
  • Lista de exercícios de sistemas distribuídos
    1469 palavras | 6 páginas