Empresas que passaram o último ano incentivando seus funcionários a usar ferramentas de IA da forma mais agressiva possível agora estão com dificuldades para gerenciar os custos.
Os diretores financeiros agora exigem retornos mensuráveis sobre as crescentes faturas de API, o que ameaça as projeções de crescimento da OpenAI, Anthropic e outros grandes fornecedores de modelos de linguagem.
As empresas estão agora reduzindo seus gastos com IA, à medida que os diretores financeiros exigem justificativas para as crescentes faturas de API. Essa reversão marca o fim do que o setor apelidou de "tokenmaxxing", e a correção está acontecendo rapidamente.
Recentemente, a Amazon desativou um ranking interno que traco uso de IA pelos funcionários, após a liderança concluir que o sistema estava gerando mais tarefas repetitivas automatizadas do que resultados úteis. "Por favor, não usem IA apenas por usar", disse um vice-presidente sênior da Amazon aos funcionários.
A Uber consumiu todo o seu orçamento de programação de IA para 2026 em apenas quatro meses, e a Meta enviou um memorando interno para cerca de 6.000 funcionários alertando para o que chamou de "aumento exponencial" no uso de IA e avisando que a empresa enfrentaria bilhões em custos internos com IA. Desde então, a Uber impôs um limite de gastos de US$ 1.500 por funcionário por mês para ferramentas de programação de IA.
A gigante de consultoria Accenture já havia alertado seus funcionários de que eles poderiam "correr o risco de perder promoções" caso não adotassem ferramentas de IA. Agora, a Accenture está tentando impedir que seus funcionários usem IA em tarefas triviais.
Um áudio vazado de uma reunião interna capturou um executivo da Accenture dizendo que os gastos com IA estão "se tornando muito imprevisíveis". O mesmo executivo afirmou que a liderança nos níveis de "CFO, COO e CIO ainda questiona se está obtendo retorno do investimento"
Adam McDaniel e Markus Eisele, da International Business Machines (IBM), argumentaram em uma análise recente que a minimização de tokens é tão prejudicial quanto a maximização de tokens, pois ambas priorizam o consumo de tokens em vez dos resultados de negócios.
A IBM defende o que chama de "maximização de valor", que se concentra em medir tarefas concluídas, tempo economizado e retrabalho evitado, em vez de tokens consumidos.
A OpenAI e a Anthropic basearam seus planos de crescimento na ideia de que as empresas continuariam consumindo cada vez mais tokens.
A OpenAI ultrapassou os US$ 25 bilhões em receita anualizada no início deste ano, enquanto sua própria avaliação de mercado chegou a US$ 1 trilhão, ao passo que a Anthropic é avaliada em alguns bilhões de dólares a menos. Ambas as empresas estão queimando cash em computação, pesquisa e contratações, na esperança de que a adoção corporativa as torne lucrativas.
Mas as empresas já estão reservando os modelos mais caros e sofisticados para trabalhos complexos e usando alternativas menores e mais baratas para tarefas rotineiras. Algumas estão migrando cargas de trabalho para modelos de código aberto que são executados em sua própria infraestrutura, sem cobranças por token.
A International Data Corporation (IDC) prevê que, até 2028, 70% das principais empresas orientadas por IA usarão múltiplos modelos em vez de depender de um único fornecedor. Isso transformaria a IA em uma commodity, onde os fornecedores competiriam por preço em vez de apenas por capacidade.
A questão financeira , porém, não vai desaparecer tão cedo. Até mesmo o CEO da OpenAI, Sam Altman, reconheceu que o custo da IA se tornou um "grande problema" para os clientes este ano.
Se você está lendo isto, já está um passo à frente. Continue assim assinando nossa newsletter.