Evaluating the impact of a coordinated checkpointing in distributed data streams processing systems using discrete event simulation

Palavras-chave: Data Streams, Fault-Tolerance, Coordinated Checkpoint, Rollback-Recovery, Simulation Analysis

Resumo

Sistemas de Processamento de Fluxos de Dados processam fluxos contínuos de dados dentro dos requerimentos da Qualidade de Serviço. Fluxos de dados frequentemente contém informações críticas que necessitam de um processamento em tempo real. Para garantir a disponibilidade do sistema, uma estratégia de tolerância à falhas precisa ser utilizada. Entretanto, existem diversas estratégias disponíveis e a verificação de qual mecanismo opera melhor em cada arquitetura é um processo desafiador, especialmente em sistemas distribuídos de larga escala. Neste trabalho, propomos um modelo de simulação de eventos discretos para investigar os impactos da estratégia de Checkpoint Coordenado nos Sistemas de Processamento de Fluxos de Dados. Os resultados demonstram que a estratégia afeta criticamente o processamento de fluxos em situações de ocorrência de falhas devido ao aumento na latência de até 120% e na perda de informação de quase 95% dos dados recebidos na janela de processamento, no pior cenário.

Downloads

Não há dados estatísticos.
Publicado
2020-05-19
Como Citar
[1]
Bernardelli de Moraes, M. e Leon Sampaio Gradvohl, A. 2020. Evaluating the impact of a coordinated checkpointing in distributed data streams processing systems using discrete event simulation. Revista Brasileira de Computação Aplicada. 12, 2 (maio 2020), 16-27. DOI:https://doi.org/10.5335/rbca.v12i2.10295.
Seção
Artigo Original
Share |