Como auditamos sua fatura em 48 horas

Se a sua fatura cloud virou uma reunião mensal com CFO + CTO + ansiedade, você não precisa de opinião. Você precisa de diagnóstico.

O trabalho da Fixx em 48 horas é pegar uma conta que parece “imprevisível” e transformar em uma história simples: quais 2 ou 3 itens puxam o total, por que isso aconteceu, e qual decisão resolve sem travar seu roadmap.

TL;DR

Em 48h, a gente decompõe sua fatura, encontra os drivers reais de custo e entrega um plano 30/60/90 com três saídas: (1) cortar agora, (2) corrigir arquitetura, (3) repatriar parte da carga com risco controlado.

Pra quem isso é (e pra quem não é)

Isso é pra CTO, tech lead e founder técnico que já tem produto rodando e um gasto que saiu do “cartão corporativo” e entrou no “orçamento”.

Faz sentido se você gasta a partir de uns R$ 15k/mês e não consegue explicar o “por quê” em 10 minutos.
Faz muito sentido quando rede, logs ou banco aparecem como surpresa (é onde mora o dinheiro esquecido).
Não faz sentido se você ainda está validando PMF e o custo muda por semana. Aí a auditoria vira fotografia de um alvo em movimento.

O que você precisa mandar (sem drama)

Pra uma auditoria ser rápida, ela precisa de um mínimo de evidência. A gente pede o suficiente pra não ficar no “achismo”, e pouco o bastante pra não virar projeto.

Você manda	Por quê	Formato
Fatura do mês + 2 meses anteriores	ver tendência, não print	PDF ou export
Dados de custo detalhados	achar drivers reais	CUR ou Cost Explorer
Inventário de workloads (bem simples)	ligar custo em serviço	lista (serviço → “pra que serve”)
Quem decide + quem executa	o plano precisa de dono	nomes e papéis

CUR ou Cost Explorer?

Se você já tem AWS CUR, melhor. Ele é o dataset mais completo de custo/uso, entregue em CSV no seu bucket (docs, overview). Se você não tem, dá pra começar pelo Cost Explorer e evoluir depois (overview).

Como são as 48 horas (de verdade)

Quando alguém promete auditoria rápida, o medo é sair uma lista genérica (“reduza logs”, “otimize instâncias”). A gente evita isso com um rito simples: primeiro a fatura, depois os serviços, depois a decisão.

Dia 1 (manhã): onde o dinheiro está indo

Quebra por categoria (compute, banco, storage, egress, rede, observabilidade).
Top 10 linhas que mais custam. Sem top 10, todo mundo discute por sensação.
Diferença mês a mês: o que subiu, o que desceu, o que está estável.

O que a gente procura aqui

Quase sempre aparece um padrão: um item pequeno em “arquitetura” e gigante em dinheiro. NAT, egress, logs, storage duplicado, instância esquecida, banco superdimensionado. É aí que a auditoria se paga.

Dia 1 (tarde): o custo tem dono?

Se 70% do seu custo está em “shared” (ou “infra”), você não tem gestão de custo. Você tem um boleto. Nesse bloco a gente mede o quanto dá pra atribuir por time/serviço com as tags que existem hoje, e o que falta pra enxergar melhor.

Sobre tags: a AWS permite ativar cost allocation tags (tags geradas pela AWS e tags suas). Elas viram colunas de relatório e ajudam a quebrar custo por time, app, owner, etc. Documentação oficial: Organizing and tracking costs using cost allocation tags.

Dia 2: por que está assim, e o que fazer

Mapeamento de workloads: qual serviço gera qual custo (do jeito que dá com os dados atuais).
Hipóteses testáveis: “isso é egress”, “isso é retenção”, “isso é on-demand por falta de compra”, “isso é duplicação”.
Plano em 30/60/90: sequência de ações, com risco e dependências.

Plano em 3 caminhos

Cortar agora é quando dá pra reduzir custo sem mexer em produto. Corrigir arquitetura é quando o custo vem de uma decisão técnica que ficou velha. Repatriar é quando a carga é previsível e a nuvem virou um risco de orçamento.

Entregáveis: o que você recebe no fim

Entrega	O que vem dentro	Decisão que destrava
Quebra por categoria	tabela + explicação em português	onde atacar primeiro
Top 10 drivers	linhas, valores e motivo provável	o que cortar agora
Mapa de workloads	serviço → dono → custo	responsabilidade por custo
Plano 30/60/90	ações com risco, esforço, retorno	sequência sem travar produto

Exemplo de 30/60/90 (pra você visualizar)

Janela	Ação	Esforço	Risco	Resultado esperado
0–30 dias	cortar retenção de logs onde não faz sentido	baixo	baixo	redução imediata + menos ruído
0–30 dias	identificar e desligar ambientes ociosos	baixo	médio	corta desperdício recorrente
30–60 dias	right-size de banco e compute (com medição)	médio	médio	custo mais previsível
30–60 dias	organizar custo por serviço (tags + owners)	médio	baixo	governança que não depende de herói
60–90 dias	plano híbrido: trazer carga previsível, manter burst na nuvem	alto	médio	reduz risco de orçamento sem perder elasticidade

Nota importante

A melhor auditoria não é a que “economiza mais”. É a que te deixa explicar a fatura com calma e evita surpresa no fechamento do mês. O corte vem como consequência.

Um exemplo do que costuma aparecer (sem expor cliente)

Um dos motivos de auditoria ser rápida é que os padrões se repetem. Não porque a empresa é “bagunçada”, mas porque cloud esconde custo atrás de nomes simpáticos.

Achado comum	Como aparece na fatura	Correção típica
NAT/egress virou imposto	rede cresce sem deploy	endpoint privado, cache, revisar rotas
Logs com retenção alta	observabilidade sobe todo mês	retenção por serviço, amostragem, filtro
Banco grande “por segurança”	banco estável e caro	right-size, ajustar HA/IOPS
Ambientes duplicados	prod + staging quase iguais	staging mais barato, desligamento programado
Sem tags, sem dono	custo vira “shared”	ativar cost allocation tags e criar owners

O erro que a gente evita: “otimizar sem saber o que está comprando”

Uma fatura alta pode esconder dois problemas bem diferentes:

Você está pagando por risco (alta disponibilidade, redundância, pico) e não percebe. Aí cortar sem cuidado vira incidente.
Você está pagando por descuido (retenção infinita, tráfego desnecessário, duplicação). Aí dá pra cortar rápido.

A auditoria separa os dois. Esse é o ponto.

FAÇA EM CASA

Se você quiser testar antes de falar com a gente: pegue 1 mês de fatura e force uma quebra em 6 linhas (compute, banco, storage, egress, rede, observabilidade). Se duas linhas passarem de 15% cada, você já tem os “suspeitos” e a conversa fica objetiva.

Quer rodar?

Se você mandar CUR (ou Cost Explorer) e um inventário simples, a gente devolve em 48h com diagnóstico e plano. Sem “apresentação de 40 slides”, sem proposta colada no final. Só decisão.

contato@fixx.com.br

Pra quem isso é (e pra quem não é)

O que você precisa mandar (sem drama)

Como são as 48 horas (de verdade)

Dia 1 (manhã): onde o dinheiro está indo

Dia 1 (tarde): o custo tem dono?

Dia 2: por que está assim, e o que fazer

Entregáveis: o que você recebe no fim

Exemplo de 30/60/90 (pra você visualizar)

Um exemplo do que costuma aparecer (sem expor cliente)

O erro que a gente evita: “otimizar sem saber o que está comprando”

Quer rodar?

Receba a próxima nota técnica.

Continue lendo

FinOps brasileiro: por que a planilha do CFO sempre erra

Kubernetes em bare-metal, em 2026: o que mudou

Por que o agente IA da Fixx não manda nada pra fora