A OpenAI descobriu que desenvolvedores pagantes não conseguiam acessar o agente de codificação de IA por vários dias porque uma falha na lógica de prevenção de fraudes esgotou o saldo de créditos do Codex. Odent resultou em três redefinições de uso e levantou novas preocupações sobre a confiabilidade das ferramentas de IA, cujo uso é limitado devido às suas demandas computacionais.
Thibault Sottiaux, membro da equipe de engenharia do Codex, documentou o incidentedent várias postagens no fórum X nos dias 28 e 29 de junho. Isso levou a equipe do Codex a trabalhar durante o fim de semana em uma "sala de guerra" para investigar os registros do sistema e determinar a causa do problema.
O sistema sistêmico de prevenção a abusos e fraudes foi identificado como a causa da limitação de taxa de requisições não intencional dos usuários, conforme confirmado pela página de status da OpenAI.
Os desenvolvedores começaram a notar uma estranha redução de créditos por volta de meados de junho. Até 25 de junho, muitos deles recorreram ao GitHub e às redes sociais para relatar que o consumo de tokens estava significativamente maior do que o normal para a execução das mesmas tarefas. Transmissões ao vivo da KuCoin News, que utilizaram dados do site de monitoramento Beating como fonte, estimaram o uso de algumas contas em 10 a 20 vezes acima do normal.
Aqueles que assinaram o plano Pro da OpenAI (US$ 200/mês) relataram um rápido esgotamento dos créditos suplementares de US$ 40 (ou seja, em questão de horas). Também houve vários relatos de orçamentos reservados para 5 horas de programação sendo consumidos com apenas alguns prompts. Houve até um engenheiro de software no site X que afirmou ter consumido o equivalente a uma semana de uso em um único dia, em duas sessões.
Sottiaux confirmou, em 28 de junho, que essa era uma questão preocupante para ele e que não havia dúvidas sobre a dimensão do problema. "A equipe do Codex está em alerta máximo neste domingo, analisando registros e verificando se há algo que possa levar ao aumento do consumo de dados por alguns usuários", escreveu ele. "Estamos levando isso muito a sério e não descansaremos até descobrirmos a causa."
A OpenAI revelou gradualmente seu plano para ajudar seus usuários após relatos de que o Codex estava sendo usado em ritmo acelerado. Sottiaux realizou uma reinicialização completa de todos os limites de uso do Codex até 28 de junho, o que também zerou as reinicializações previamente acumuladas pelos usuários (máximo de três). Ele também prometeu fornecer reinicializações manuais para qualquer usuário que ainda estivesse sendo afetado.
No dia seguinte (29 de junho), a equipe descobriu que múltiplas vulnerabilidades na infraestrutura de limitação de taxa do Codex causaram o uso inesperado do serviço. Houve uma terceira reinicialização completa, e Sottiaux informou que todos os usuários receberiam uma reinicialização adicional acumulada, que poderia ser usada em até 24 horas.
Ele afirmou que haviam recebido diversos relatos de que o Codex estava sendo usado em uma taxa maior do que a prevista inicialmente e declarou que “não havia um problema central”. Os reparos preliminares foram concluídos nesse momento.
A infeliz coincidência desse incidentedent destacada por Sottiaux, já que o sistema de calendário da OpenAI tinha esse mesmo período como "semana de RESET" para uma iniciativa não relacionada.
A questão do Codex surge num momento em que há uma restrição notável ao acesso à computação por parte das empresas de IA. Em março, houve dois problemas significativos relacionados às limitações de uso do produto Claude da Anthropic devido ao uso em larga escala.
Além disso, durante o mesmo mês, houve uma interrupção no serviço Claude devido a um bug que causou uma falha, o que fez com que muitos desenvolvedores profissionais percebessem o quão dependentes se tornaram do uso de um produto baseado em IA para auxiliar na programação, visto que muitos reclamaram publicamente de ter que programar manualmente devido à falta de acesso.
A OpenAI também teve uma interrupção separada do Codex em junho, onde apenas três dias antes, eles haviam experimentado três problemas de estabilidade que ocorreram em um período de 24 horas, o que forçou Sottiaux a alterar os limites de uso em todos os planos pagos e dizer aos usuários: "Que os tokens voltem a fluir".
Com a evolução do mercado, tem havido uma clara tensão estrutural entre as empresas de IA, que estão começando a eliminar a precificação ilimitada baseada em taxas, devido à demanda por computação de inferência estar excedendo em muito a capacidade.
A OpenAI implementou, em 12 de junho, um sistema de reinicialização de saldo bancário que permite aos usuários de produtos baseados no Codex, nos planos de assinatura Go, Plus, Pro e Business, iniciar uma reinicialização manual de sua cota e utilizá-la conforme sua conveniência. Essa implementação reconhece que os rígidos prazos de espera são frustrantes para os desenvolvedores quando estão em meio ao seu trabalho. No entanto, como demonstrado com o bug de drenagem de crédito, isso também evidencia a importância da medição como componente crítico de um sistema desse tipo.
Os desenvolvedores que estão tentando criar fluxos de trabalho que incorporem assistentes de codificação baseados em IA continuarão limitados pelas múltiplas interrupções de uso, o que dificulta o desenvolvimento de planos futuros. Da mesma forma, os desenvolvedores que planejam seu tempo com base nas janelas de uso estabelecidas (algo relatado pelo Business Insider e que está se tornando cada vez mais comum) continuarão a sofrer com a perda cumulativa de produtividade.
A OpenAI continuará monitorando a situação e fornecerá novas atualizações após a conclusão do processo de investigação.
As mentes mais brilhantes do mundo das criptomoedas já leem nossa newsletter. Quer participar? Junte-se a elas.