Status
Todos os sistemas operacionais
Todos os sistemas operacionais.
Acompanhe atualizações de incidentes, saúde por região e histórico de uptime no dashboard público de status ao vivo.
Arquitetura
Feito para que perda de região não seja incidente.
Multi-região active-active
Decisões de auth, sessões e escritas de auditoria atendem de várias regiões ao mesmo tempo. Não existe warm standby — toda região carrega tráfego vivo.
Failover automático
Se uma região degrada, o tráfego desloca em segundos. Seus usuários não veem banner, não veem tempestade de retry, não veem queda no sign-in.
Meta de SLA de uptime
Desenhamos e operamos para 99,99% de uptime no caminho de auth. Dashboards por tenant e SLAs contratuais entram nos tiers pagos.
Isolamento por tenant
Replicação e rate limits ficam isolados por cliente. Pico de um tenant não vira queda de outro.
Incidentes
Como tratamos falhas.
— 01
Detectar
Fluxos sintéticos de auth rodam de toda região, todo minuto. Anomalias chamam o on-call antes de qualquer cliente perceber.
— 02
Comunicar
Post de status em até 5 minutos de impacto confirmado. Atualizações a cada 30 minutos até a resolução. Resumo de acompanhamento em 24 horas.
— 03
Post-mortem
RCA pública em até 5 dias úteis para qualquer incidente com impacto a cliente. Publicamos o que quebrou, o que mudamos e o que passamos a medir.