Se a sua fatura cloud virou uma reunião mensal com CFO + CTO + ansiedade, você não precisa de opinião. Você precisa de diagnóstico.
O trabalho da Fixx em 48 horas é pegar uma conta que parece “imprevisível” e transformar em uma história simples: quais 2 ou 3 itens puxam o total, por que isso aconteceu, e qual decisão resolve sem travar seu roadmap.
Pra quem isso é (e pra quem não é)
Isso é pra CTO, tech lead e founder técnico que já tem produto rodando e um gasto que saiu do “cartão corporativo” e entrou no “orçamento”.
- Faz sentido se você gasta a partir de uns R$ 15k/mês e não consegue explicar o “por quê” em 10 minutos.
- Faz muito sentido quando rede, logs ou banco aparecem como surpresa (é onde mora o dinheiro esquecido).
- Não faz sentido se você ainda está validando PMF e o custo muda por semana. Aí a auditoria vira fotografia de um alvo em movimento.
O que você precisa mandar (sem drama)
Pra uma auditoria ser rápida, ela precisa de um mínimo de evidência. A gente pede o suficiente pra não ficar no “achismo”, e pouco o bastante pra não virar projeto.
| Você manda | Por quê | Formato |
|---|---|---|
| Fatura do mês + 2 meses anteriores | ver tendência, não print | PDF ou export |
| Dados de custo detalhados | achar drivers reais | CUR ou Cost Explorer |
| Inventário de workloads (bem simples) | ligar custo em serviço | lista (serviço → “pra que serve”) |
| Quem decide + quem executa | o plano precisa de dono | nomes e papéis |
Como são as 48 horas (de verdade)
Quando alguém promete auditoria rápida, o medo é sair uma lista genérica (“reduza logs”, “otimize instâncias”). A gente evita isso com um rito simples: primeiro a fatura, depois os serviços, depois a decisão.
Dia 1 (manhã): onde o dinheiro está indo
- Quebra por categoria (compute, banco, storage, egress, rede, observabilidade).
- Top 10 linhas que mais custam. Sem top 10, todo mundo discute por sensação.
- Diferença mês a mês: o que subiu, o que desceu, o que está estável.
Dia 1 (tarde): o custo tem dono?
Se 70% do seu custo está em “shared” (ou “infra”), você não tem gestão de custo. Você tem um boleto. Nesse bloco a gente mede o quanto dá pra atribuir por time/serviço com as tags que existem hoje, e o que falta pra enxergar melhor.
Sobre tags: a AWS permite ativar cost allocation tags (tags geradas pela AWS e tags suas). Elas viram colunas de relatório e ajudam a quebrar custo por time, app, owner, etc. Documentação oficial: Organizing and tracking costs using cost allocation tags.
Dia 2: por que está assim, e o que fazer
- Mapeamento de workloads: qual serviço gera qual custo (do jeito que dá com os dados atuais).
- Hipóteses testáveis: “isso é egress”, “isso é retenção”, “isso é on-demand por falta de compra”, “isso é duplicação”.
- Plano em 30/60/90: sequência de ações, com risco e dependências.
Entregáveis: o que você recebe no fim
| Entrega | O que vem dentro | Decisão que destrava |
|---|---|---|
| Quebra por categoria | tabela + explicação em português | onde atacar primeiro |
| Top 10 drivers | linhas, valores e motivo provável | o que cortar agora |
| Mapa de workloads | serviço → dono → custo | responsabilidade por custo |
| Plano 30/60/90 | ações com risco, esforço, retorno | sequência sem travar produto |
Exemplo de 30/60/90 (pra você visualizar)
| Janela | Ação | Esforço | Risco | Resultado esperado |
|---|---|---|---|---|
| 0–30 dias | cortar retenção de logs onde não faz sentido | baixo | baixo | redução imediata + menos ruído |
| 0–30 dias | identificar e desligar ambientes ociosos | baixo | médio | corta desperdício recorrente |
| 30–60 dias | right-size de banco e compute (com medição) | médio | médio | custo mais previsível |
| 30–60 dias | organizar custo por serviço (tags + owners) | médio | baixo | governança que não depende de herói |
| 60–90 dias | plano híbrido: trazer carga previsível, manter burst na nuvem | alto | médio | reduz risco de orçamento sem perder elasticidade |
Um exemplo do que costuma aparecer (sem expor cliente)
Um dos motivos de auditoria ser rápida é que os padrões se repetem. Não porque a empresa é “bagunçada”, mas porque cloud esconde custo atrás de nomes simpáticos.
| Achado comum | Como aparece na fatura | Correção típica |
|---|---|---|
| NAT/egress virou imposto | rede cresce sem deploy | endpoint privado, cache, revisar rotas |
| Logs com retenção alta | observabilidade sobe todo mês | retenção por serviço, amostragem, filtro |
| Banco grande “por segurança” | banco estável e caro | right-size, ajustar HA/IOPS |
| Ambientes duplicados | prod + staging quase iguais | staging mais barato, desligamento programado |
| Sem tags, sem dono | custo vira “shared” | ativar cost allocation tags e criar owners |
O erro que a gente evita: “otimizar sem saber o que está comprando”
Uma fatura alta pode esconder dois problemas bem diferentes:
- Você está pagando por risco (alta disponibilidade, redundância, pico) e não percebe. Aí cortar sem cuidado vira incidente.
- Você está pagando por descuido (retenção infinita, tráfego desnecessário, duplicação). Aí dá pra cortar rápido.
A auditoria separa os dois. Esse é o ponto.
Quer rodar?
Se você mandar CUR (ou Cost Explorer) e um inventário simples, a gente devolve em 48h com diagnóstico e plano. Sem “apresentação de 40 slides”, sem proposta colada no final. Só decisão.