O CEO da Coinbase propôs experimentar modelos de IA de código aberto mais baratos para controlar os gastos com IA à medida que o consumo de tokens aumenta.
Essa proposta gerou preocupações quanto aos riscos de segurança e geopolíticos de direcionar cargas de trabalho empresariais por meio de sistemas de origem chinesa.
Os controles de exportação dos EUA dificultaram o acesso das empresas chinesas aos chips de IA americanos, mas isso não as impediu de desenvolver modelos competitivos e vendê-los a preços muito mais baixos.
Por exemplo, o GLM 5.2 da Zhipu custa US$ 1,40 por milhão de tokens de entrada e US$ 4,40 por milhão de tokens de saída, em comparação com o Opus 4.8 da Anthropic, que custa US$ 5 e US$ 25, respectivamente, para o mesmo volume.
O GLM 5.2 obteve 62,1 pontos no SWE-bench Pro, um importante benchmark de programação, superando o GPT-5.5 da OpenAI, que alcançou 58,6 pontos. Um pesquisador de IA afirmou que o GLM 5.2 "é pelo menos tão bom quanto o Opus 4.8 e o GPT 5.5"
Outro o chamou de "o primeiro modelo aberto que realmente pode competir com sistemas de código fechado"
da Coinbase, Brian Armstrongtronafirma que a melhor maneira de controlar o aumento dos custos de IA é usar modelos de código aberto mais baratos, incluindo sistemas da China como o GLM 5.2.
tronafirmou que, em vez de gastar cada vez mais em IA, as empresas precisam de "configurações padrão, roteamento e armazenamento em cache melhores". Sua sugestão de usar modelos chineses, mesmo que sejam mais baratos, gerou preocupações sobre segurança e riscos políticos.
Além do preço acessível, o GLM 5.2 utiliza uma licença MIT, o que significa que as empresas podem baixá-lo, modificá-lo e executá-lo em seus próprios servidores, eliminando qualquer risco de enviar dados confidenciais da empresa para uma API externa.
Os gastos com IA tornaram-se um problema real, fazendo com que as empresas reduzam o uso da tecnologia em suas operações.
Cryptopolitan noticiou recentemente que a Uber esgotou todo o seu orçamento de programação de IA para 2026 já em abril e agora limita o gasto de engenheiros a US$ 1.500 por ferramenta por mês. A Meta enviou um memorando alertando sobre um “aumento exponencial” no uso de IA e começou a implementar controles de gastos. A Amazon descartou um ranking interno que classificava os funcionários por consumo de IA porque as pessoas estavam manipulando o sistema e elevando os custos.
Uma pesquisa da KPMG revelou que apenas 26% das empresas têm visibilidade completa de seus custos com IA, enquanto 22% só descobrem os gastos após receberem a fatura. O Goldman Sachs prevê que o consumo de tokens de IA poderá aumentar 24 vezes até 2030, atingindo 120 quatrilhões de tokens por mês.
A International Data Corporation prevê que 70% das principais empresas orientadas por IA usarão vários modelos até 2028, em vez de depender de um único fornecedor.
A API em nuvem da Z.ai, que permite que desenvolvedores e empresas usem seus modelos de IA (incluindo o GLM 5.2), está sujeita à Lei Nacional de Inteligência da China. Isso gera sérias preocupações para qualquer empresa que lide com informações sensíveis.
Em maio, legisladores dos EUA abriram uma investigação formal sobre os riscos de segurança cibernética provenientes de modelos de IA de origem chinesa em infraestruturas críticas.
Há também preocupações de que modelos treinados sob diferentes sistemas jurídicos possam apresentar comportamentos não divulgados. Além disso, um desenvolvedor de IA testou o GLM 5.2 contra o GPT-5.5 em uma tarefa de depuração e descobriu que ele "nem se compara" à capacidade do modelo da OpenAI de detectar problemas, apesar de relatos de que os modelos chineses superam seus concorrentes mais caros.
A Anthropic revelou em uma carta aberta ao Comitê Bancário do Senado que operadores do Alibaba Qwen realizaram 28,8 milhões de transações com o modelo Claude por meio de cerca de 25.000 contas falsas entre abril e junho. Eles classificaram a ação como a maior campanha conhecida para roubar as funcionalidades de um modelo.
Hospedar os pesos abertos em servidores próprios elimina o risco de roteamento de dados via API, já que as empresas que executam o modelo em seus próprios servidores não enviam dados para a China. Mas a preocupação com os próprios modelos persiste.
Não se limite a ler notícias sobre criptomoedas. Compreenda-as. Assine nossa newsletter. É grátis.