De acordo com uma reportagem do Financial Times, o Google impôs um limite defià quantidade de recursos da sua plataforma de IA Gemini que a Meta pode utilizar, depois que a demanda da empresa de tecnologia e mídia por computação de IA excedeu a capacidade disponível.
A divisão de nuvem da Alphabet informou a Meta por volta de março que suas demandas de capacidade no Gemini não poderiam ser atendidas, uma situação que acabou atrasando e interrompendo alguns dos projetos internos de IA da Meta.
A Meta recorreu aos modelos Gemini do Google porque eles superaram seus próprios modelos Llama de código aberto para tarefas específicas. A empresa estava usando o Gemini para processos de moderação de conteúdo que incluíam a remoção de conteúdo prejudicial e a detecção de golpes.
O modelo de IA também foi usado para automação de atendimento ao cliente, chatbots para anunciantes e programação. O Engadget informou que a Meta também usa o Claude, da Anthropic, para cargas de trabalho semelhantes.
A Meta, que não opera seu próprio negócio de nuvem, prometeu investir US$ 600 bilhões em computação em nuvem nos próximos dois anos para reduzir essa dependência.
Na sequência das restrições, a Meta instruiu os funcionários a utilizarem os tokens de IA de forma mais eficiente, segundo o Financial Times. A empresa também acelerou o desenvolvimento do Muse Spark, um modelo interno criado pela sua divisão Superintelligence Labs, e começou a transferir cargas de trabalho da Gemini para esta plataforma.
Em maio, a Meta cortou 8.000 postos de trabalho e realocou 7.000 funcionários para funções focadas em IA.
De acordo com a reportagem do Financial Times, vários outros clientes do Google também estão enfrentando acesso reduzido, embora em menor grau. Mesmo operando um dos maiores conjuntos de infraestrutura de IA do mundo, o gigante da tecnologia ainda não consegue atender à enorme demanda por computação de IA.
A receita do Google Cloud atingiu US$ 20 bilhões no primeiro trimestre, mas o CEO Sundar Pichai reconheceu que as limitações de computação impediram um crescimento maior e contribuíram para que a carteira de pedidos da unidade de nuvem dobrasse no último trimestre.
o Google também concordou em pagar à SpaceX US$ 920 milhões por mês pelo acesso a 110.000 GPUs da Nvidia como "capacidade de ponte" para o Gemini Enterprise.
A concorrente do Google, a Anthropic, também está alugando separadamente um data center inteiro da SpaceX, o que comprova que a maior limitação da indústria de IA atualmente é a infraestrutura física para executar modelos de IA, e não o talento para criá-los.
Se você está lendo isto, já está um passo à frente. Continue assim assinando nossa newsletter.