Alta Disponibilidade e Tolerância a Falha


Cada vez mais é necessário garantir a disponibilidade de um serviço, mas sendo que muitos componentes dos sistemas de informação atuais contém pontos únicos de falha, a confiabilidade destes é relativamente insuficiente quando a operação do serviço for crítica. Para garantir a ausência de interrupções de um serviço é necessário, muitas vezes, dispor de hardware redundante que entre em funcionamento automaticamente no momento da falha de um dos componentes em utilização.

Quanto mais redundância existir, menores serão os SPOF (Single Point Of Failure), e menor será a probabilidade de interrupções no serviço. Até há poucos anos tais sistemas eram muito dispendiosos e a busca por soluções alternativas tem intensificado. Surgem então os sistemas construídos com hardware acessível (clusters), altamente escaláveis e de custo mínimo.

Todo hardware tem o seu limite, e muitas vezes o mesmo serviço tem que ser repartido por várias máquinas, sob pena de se tornar congestionado. Estas soluções podem-se especializar em pequenos grupos sobre os quais se faz um balanceamento de carga: utilização do CPU, de armazenamento, ou de rede. Qualquer uma delas introduz o conceito de clustering, ou server farm, já que o balanceamento será, provavelmente, feito para vários servidores. Em rede de computadores, o balanceamento de carga é uma técnica para distribuir a carga de trabalho uniformemente entre dois ou mais computadores, enlaces de rede, CPUs, discos rígidos ou outros recursos, a fim de otimizar a utilização de recursos, maximizar o desempenho, minimizar o tempo de resposta e evitar sobrecarga.

Utilizando múltiplos componentes com o balanceamento de carga, em vez de um único componente, pode-se aumentar a confiabilidade através da redundância.