Pular para o conteúdo

Performance e escalabilidade

Os SLAs abaixo são valores contratuais, monitorados continuamente em produção. Desvios geram alertas para a equipe de operações da Guardline.

OperaçãoLatência (SLA)
Avaliação de transação no motorP95 de 300ms
Consulta a listas restritivas< 100ms
Criação automática de caso< 500ms
Cálculo de scoring< 300ms

Os valores representam o percentil 95 ou o limite superior observado em condições normais de operação. O monitoramento é contínuo e os dados de latência ficam disponíveis para a equipe de operações.

A arquitetura permite escalabilidade horizontal por componente. Cada parte da plataforma pode ser dimensionada de forma independente conforme a demanda da instituição:

  • Motor de decisão: réplicas adicionais podem ser provisionadas para absorver picos de volume de transações, mantendo a latência dentro dos SLAs definidos.
  • Backends dos módulos: cada módulo (ONP, FPP, CMP) escala de forma independente. Uma instituição com alto volume de onboarding e baixo volume de casos, por exemplo, pode ter mais réplicas da ONP sem alterar o dimensionamento dos demais módulos.
  • Banco de dados: suporte a réplicas de leitura, distribuindo a carga de consultas sem impactar operações de escrita.
  • Cache: suporte a clustering, permitindo distribuição da carga de leitura e aumento da capacidade de armazenamento em memória.

O dimensionamento é ajustado conforme o volume operacional da instituição. A plataforma não impõe limites fixos de transações, onboardings ou casos; a capacidade acompanha a infraestrutura alocada.

As métricas de performance são coletadas continuamente e comparadas com os SLAs contratuais. Quando uma métrica se aproxima ou ultrapassa o limite definido, alertas são gerados automaticamente para a equipe de operações, que atua no redimensionamento ou na investigação da causa.