Performance e escalabilidade

SLAs contratuais

Os SLAs abaixo são valores contratuais, monitorados continuamente em produção. Desvios geram alertas para a equipe de operações da Guardline.

Operação	Latência (SLA)
Avaliação de transação no motor	P95 de 300ms
Consulta a listas restritivas	< 100ms
Criação automática de caso	< 500ms
Cálculo de scoring	< 300ms

Os valores representam o percentil 95 ou o limite superior observado em condições normais de operação. O monitoramento é contínuo e os dados de latência ficam disponíveis para a equipe de operações.

Escalabilidade horizontal

A arquitetura permite escalabilidade horizontal por componente. Cada parte da plataforma pode ser dimensionada de forma independente conforme a demanda da instituição:

Motor de decisão: réplicas adicionais podem ser provisionadas para absorver picos de volume de transações, mantendo a latência dentro dos SLAs definidos.
Backends dos módulos: cada módulo (ONP, FPP, CMP) escala de forma independente. Uma instituição com alto volume de onboarding e baixo volume de casos, por exemplo, pode ter mais réplicas da ONP sem alterar o dimensionamento dos demais módulos.
Banco de dados: suporte a réplicas de leitura, distribuindo a carga de consultas sem impactar operações de escrita.
Cache: suporte a clustering, permitindo distribuição da carga de leitura e aumento da capacidade de armazenamento em memória.

O dimensionamento é ajustado conforme o volume operacional da instituição. A plataforma não impõe limites fixos de transações, onboardings ou casos; a capacidade acompanha a infraestrutura alocada.

Monitoramento

As métricas de performance são coletadas continuamente e comparadas com os SLAs contratuais. Quando uma métrica se aproxima ou ultrapassa o limite definido, alertas são gerados automaticamente para a equipe de operações, que atua no redimensionamento ou na investigação da causa.