Usando Machine Learning para Detectar Anomalias em Custos na Nuvem (FinOps)

e-Core • May 20, 2025

Gerenciar os custos em ambientes de computação em nuvem é uma tarefa complexa que exige atenção constante. Uma pesquisa global encomendada pela Veritas Technologies mostrou que 94% das empresas entrevistadas relataram que seus gastos com provedores de serviços de nuvem pública excederam o previsto, com uma média de 43% acima do orçamento inicial. 


Este artigo avalia como a união de Machine Learning (ML) e FinOps pode auxiliar profissionais e gestores do setor a manterem a eficiência operacional e financeira de suas infraestruturas em nuvem, explorando os conceitos fundamentais, as metodologias aplicáveis e as melhores práticas para implementar soluções eficazes em ML para detecção de anomalias em custos na nuvem. 


O que são anomalias em custos na nuvem?


Anomalias em custos na nuvem podem ser definidas como perturbações ou irregularidades no padrão de gastos nos serviços de computação em nuvem. Essas anomalias têm diversas origens, como mudanças na demanda, erros de configuração ou uso indevido dos recursos, gerando gastos indesejados e prejudicando planejamentos.


A graph showing a spike in the value of a stock.

Por que usar Machine Learning para detecção de anomalias?


Imagine o seguinte cenário: uma empresa nota um aumento inesperado nos custos de serviços em nuvem. Ao investigar, a equipe de FinOps se depara com vários serviços apresentando gastos elevados de forma repentina. Analisar cada um manualmente seria uma tarefa demorada e ineficaz. Nesse contexto, o uso de Machine Learning se torna essencial por suas capacidades de:

  1. Processar grandes volumes de dados: Capacidade de analisar dados complexos e em escala, como custos distribuídos por serviços, regiões ou projetos.
  2. Identificar padrões rápida e precisamente: Detecta desvios em tempo real, evitando a dependência de análises manuais lentas e reconhece anomalias sutis que passariam despercebidas por métodos tradicionais.
  3. Prevenir anomalias futuras de forma proativa: Opera em tempo real para bloquear gastos anormais antes que impactem o orçamento e gera alertas automáticos para ações corretivas imediatas (ex.: ajustar configurações, encerrar recursos ociosos).
  4. Otimizar recursos: Identifica recursos subutilizados ou mal configurados, sugerindo realocações ou reduções de custo. Amplia o conhecimento sobre padrões de uso, fortalecendo práticas de FinOps.
  5. Adaptar automaticamente a novos dados: Modelos de ML evoluem conforme novos dados são incorporados, mantendo a eficácia em cenários dinâmicos, reduz a necessidade de intervenção manual da equipe.

→ Saiba mais sobre Estratégia de Tagging: 5 recomendações para começar


Como lidar com anomalias?


Para lidar com as anomalias, é necessário:

  1. Realizar uma análise preliminar detalhada de todos os serviços consumidos na nuvem, Identificando padrões históricos de gastos e agrupá-los por projetos, equipes ou regiões para facilitar a identificação de anomalias. 
  2. Organizar os dados financeiros em categorias como tipo de serviço, região de implantação e unidade de negócio. Isso permite uma melhor compreensão das flutuações nos custos e facilita a detecção de anomalias contextuais.
  3. Com base nos dados obtidos na análise, é necessário planejar e implementar ações corretivas que solucionem a anomalia de forma eficaz.
  4. Analisar e documentar como prevenir que outras anomalias do mesmo tipo voltem a surgir por meio de revisões retrospectivas.


A diagram showing the steps of a project

Metodologias de implementação


Ferramenta de detecção de anomalias


Uma ferramenta importante para implementar a detecção de anomalias na nuvem é o AWS Cost Anomaly Detection. Este recurso é gratuito para todos os usuários da AWS, sendo possível ativar e desativar a qualquer momento, e vem equipado com modelos de machine learning para detectar automaticamente anomalias nos padrões de custo, configurando alertas e limites para monitoramento eficiente de gastos na nuvem.

  1. Acesse o console do Billing and Cost Management e selecione a opção de “Detecção de Anomalias em Custos”.
  2. Configure um monitor para os serviços AWS, definindo os parâmetros de frequência dos alertas, os destinatários e os limites de acionamento. 
  3. Revise as configurações e crie o monitor para iniciar o monitoramento dos custos de forma automatizada.

Essa solução é fácil e rapidamente implementável, sendo executada nativamente na AWS, fornecendo insights e métricas suficientes para análises.


Modelos de ML para detectar anomalias


Uma outra solução possível é a criação de um modelo customizado para encontrar anomalias. Essa solução requer um ambiente apropriado para construir, treinar e implantar modelos de machine learning. Uma opção disponível no mercado é o Amazon SageMaker, uma ferramenta para desenvolver e implementar aplicações de IA desde a sua concepção, além de oferecer ótimos recursos para o gerenciamento dos modelos. 


Para criar um modelo de detecção de anomalias customizado para o seu negócio:

  1. Avalie os dados disponíveis a partir dos relatórios de custos disponíveis na provedora de nuvem utilizada.
  2. Determine se o problema será tratado como aprendizagem supervisionada ou não supervisionada. Com isso, tome conhecimento dos tipos de modelos de aprendizado de máquina e pondere sobre qual deles é o mais adequado para a implementação desejada, por exemplo, Regressão Linear, Isolation Forest e Autoencoders.
  3. Estabeleça métricas claras para avaliar os resultados do modelo. Métricas como Área sob a curva ROC (ROC-AUC), F1-Score e Taxa de alarmes falsos (FAR) podem ser usadas na identificação de anomalias e aumentam a credibilidade do modelo desenvolvido.
  4. Integre com uma solução de notificação em e-mails, dashboards interativos ou gatilhos para realizar ações automatizadas.

Esta solução tem como benefícios a possibilidade de personalização conforme as necessidades específicas do negócio, proporcionando maior controle na detecção de anomalias, além de automatizar grande parte dos processos que, em maior escopo, podem se mostrar extensivos de se executar em tempo hábil.


Técnicas e metodologias aplicáveis


Além dos algoritmos apresentados acima, outras técnicas estatísticas e de machine learning podem ser utilizadas nesse tema, como: 

  • Métodos estatísticos, como a análise de desvio padrão, permitem detectar valores que se afastam do esperado, enquanto médias móveis ajudam a suavizar flutuações curtas e destacar tendências de longo prazo.
  • Abordagens de Machine Learning também se mostram eficazes, como a clusterização, que agrupa padrões de consumo semelhantes para identificar anomalias, e modelos de regressão, que preveem os custos esperados e sinalizam desvios significativos.
  • A análise de séries temporais examina os dados ao longo do tempo para identificar tendências, sazonalidade e padrões cíclicos, permitindo a detecção de variações inesperadas.

→Veja como o Ouribank otimizou custos de cloud com e-Core e AWS


Melhores práticas de FinOps para gerenciar anomalias


Obtenha melhor aproveitamento das detecções certificando-se que a solução está em conformidade com as melhores práticas de FinOps, como:

  1. Monitorar constantemente para notificar anomalias assim que surgirem
  2. Integrar a solução desenvolvida com ferramentas de FinOps, como o Focus, que padroniza os dados para facilitar a leitura e entendimento dos dados.
  3. Revisar e ajustar regularmente os limites especulados, refinar constantemente os algoritmos baseados nos feedbacks e nas condições de negócios.
  4. Manter a comunicação clara entre os times para informar rapidamente a ocorrência de uma anomalia.
  5. Utilizar as anomalias detectadas para formulação de estratégias de otimização de gastos mais robustas.

→ Veja Os 6 princípios que guiam o sucesso em FinOps


Conclusão


Implementar Machine Learning para detectar anomalias nos custos de nuvem é importante para fortalecer a cultura FinOps dentro da empresa, fornecendo insights sobre o consumo de recursos, facilitando a colaboração entre TI, finanças e negócios para decisões estratégicas. Com esse tipo de solução, podemos gerar economia imediata ao identificar recursos ociosos, configurações inadequadas e picos de demanda. Integrando Machine Learning com práticas de FinOps, é possível assegurar uma gestão financeira sustentável na nuvem, com controle orçamentário preciso e escalabilidade eficiente.


Quer usar machine learning para para entender melhor os custos da cloud e não sabe por onde começar? Nossos especialistas estão prontos para te ajudar! Entre em contato conosco e veja como podemos apoiar o seu negócio!



Lucas Chagas Henrichs

Lucas Chagas Henrichs

Data Scientist I

Maíra Santos
FinOps Analyst II

Maíra Santos

FinOps Analyst II


e-Core

Combinamos experiência global com tecnologias emergentes para ajudar empresas como a sua a criar produtos digitais inovadores, modernizar plataformas de tecnologia e melhorar a eficiência nas operações digitais.


Isso pode te interessar:

Guia de Recursos: Técnicas de Fine Tuning em GenAI
By e-Core August 11, 2025
Por trás da popularização de GenAI e dos benefícios em eficiência e tomada de decisões, existe um grande trabalho ao identificar padrões em enormes volumes de dados, estabelecendo relações entre essas informações que precisa ser otimizada. Nesse e-book iremos conhecer melhor uma delas, o fine tunning.
By e-Core August 7, 2025
Durante o processo de procura de novas oportunidades de emprego é comum surgirem algumas dúvidas com relação a candidatura, processo, como se comportar e etc. Nesse texto você vai encontrar algumas dicas que podem te ajudar em diversas situações. Primeiro passo: A procura! Durante a pesquisa por vagas, que fazem sentido para cada um, é comum levarmos em consideração coisas como nome da empresa, nível da vaga, benefícios e se de fato temos a compatibilidade técnica e comportamental exigida. Porém, é de extrema importância analisar o quanto de afinidade a empresa e a oportunidade tem com você, pessoa candidata. Além de colocar na balança as exigências e as oportunidades, e fatores como a distância, horários e modelo de trabalho, lembre-se de prestar atenção à estrutura, à cultura e ao negócio da empresa. Uma boa forma de fazer isso é conferindo os feedbacks das pessoas que trabalham ou trabalharam na empresa, tanto nas redes sociais quanto no Glassdoor, por exemplo, para que você possa compreender no detalhe como é a cultura daquela empresa de acordo com os seus valores. Isso aumenta sua assertividade na hora de avaliar a Oferta de Emprego, bem como traz um prognóstico mais fiel de como será sua adaptação no novo desafio. Segundo passo: Participando do processo. O Processo começou, e agora? Nesta etapa é extremamente importante esclarecer as dúvidas e perguntar. Calma! O nervosismo é normal, mas lembre-se que é extremamente importante organizar as ideias e perguntar. Por exemplo, aqui na e-core temos algumas etapas onde você poderá tirar dúvidas direcionadas em cada fase: Na etapa de RH : nessa fase você consegue tirar dúvidas sobre benefícios, estrutura da empresa, iniciativas de saúde e bem estar, dentre outros pontos, principalmente relacionados à cultura no geral. Na etapa técnica : Nesta etapa você tem contato com pessoas da sua área, então as perguntas podem ser aprofundadas – como é o dia a dia de trabalho com seu futuro time? Como é o contato com o cliente? Quais tecnologias são utilizadas? Você gosta de trabalhar na empresa – e por quê? Na etapa de liderança: você consegue não só tirar dúvidas sobre o time, mas sobre desafios futuros, expectativas para o cargo e desenvolvimento profissional. Durante o processo seletivo, o ideal é aproveitar ao máximo e ter em mente que estamos nos avaliando mutuamente, e por isso tanto a empresa quanto você deve perguntar e esclarecer dúvidas sobre o que for necessário. Afinal é como o início de um relacionamento. Uma experiência positiva, durante um processo seletivo, está sempre ligada à transparência e feedback, independente do resultado. Tome alguns cuidados ao trazer seus exemplos vividos, lembre-se que o tempo de uma entrevista apesar de parecer longo, é muito curto, mas ele é tudo que temos para nos conhecer e ter um overview geral das suas experiências, e é onde nós do RH podemos entender se faz ou não sentido avançar com você para as próximas etapas. Por isso, busque organizar suas ideias para trazer suas experiências, evite ser prolixo (nós sempre pediremos mais informações quando necessário então não precisa se preocupar em contar tudo de uma vez, pois vamos focar nos pontos que são importantes para a oportunidade em questão), e o importante é focar em suas experiências, nos seus objetivos, metas e vulnerabilidades (afinal, todos temos!). Terceiro passo: Recebendo feedback do processo. Feedbacks nem sempre são fáceis, podem nos trazer um sentimento de medo antes mesmo de sabermos qual o assunto, mas respire, lembre-se que todo feedback nos traz um crescimento. Essa é uma etapa muito importante, pois estar com a mente aberta para feedbacks vai ajudar no seu desenvolvimento pessoal e profissional e vai deixar você, pessoa candidata, cada vez mais preparada. Todo feedback abre um espaço para pedir dicas de como se preparar, de como aprender mais, de como crescer! Pedir feedbacks não é problema, seu desenvolvimento é exclusivamente seu, por isso, esse comportamento é extremamente valorizado e vai te ajudar a criar redes de networking além de impulsionar seu desenvolvimento. Boa sorte na sua jornada! Bom, agora que já falamos sobre algumas dicas rápidas, lembre-se que você é o protagonista da sua carreira. Por isso, é importante analisar com cuidado e atenção os passos que você escolhe dar nesse trajeto. Busque conhecimento e não tenha medo de pedir feedbacks, assim, você estará cada vez mais perto de conquistar a oportunidade ideal e de crescer profissionalmente. Boa sorte na sua jornada!
A group of people are having a meeting in a conference room.
By e-Core July 29, 2025
Com mais de 150 mil times ativos em todo o mundo e presença em mais de 200 países, a Atlassian tem se consolidado como uma referência em colaboração e produtividade empresarial.