O OpenAIT atualizou o operador de alimentação do modelo de IA da versão personalizada anterior do GPT-4O para um modelo baseado no O3, um dos mais recentes modelos de "raciocínio" do Openai. O operador O3 foi ajustado com dados de segurança adicionais para uso do computador e incluiu conjuntos de dados de segurança projetados para ensinar os limites da decisão do modelo.
O OpenAIAI atualizou o operador no ChatGPT com um novo modelo de agente de uso de computador (CUA) com base em uma versão do OpenAI O3. Com o novo modelo, o operador tornou -se mais persistente e mais preciso ao interagir com o navegador, melhorando a taxa geral de sucesso da tarefa. Ele também oferece respostas melhor estruturadas que são mais claras e completas.
Segundo o OpenAI , o novo modelo CUA mostrou o tron Ger em relação à indústria, alcançando o SOTA em Osworld e Webarena. Ele também mostrou o desempenho relativo da versão anterior, tanto em benchmarks estabelecidos quanto em avaliações de preferência humana tron
Openai sugere uma grande atualização para o agente do operador chatgpt pic.twitter.com/igpqp9butd
- Sabatage (@sabatage) 22 de maio de 2025
O OpenAI substituiu o modelo existente baseado em GPT-4O para operador por uma versão baseada no OpenAI O3, embora a versão da API permaneça com base no 4O. A empresa de IA também alegou que o operador O3 usa a mesma abordagem de segurança de várias camadas usada para a versão 4O.
No entanto, em comparação com outros modelos da família O3, o operador O3 foi ajustado com dados de segurança adicionais para uso do computador, incluindo conjuntos de dados de segurança projetados para ensinar os limites da decisão do modelo em confirmações e recusas.
O OpenAI divulgou um relatório técnico mostrando o desempenho do operador da O3 em avaliações de segurança específicas. Comparado ao modelo do operador GPT-4O, o operador da O3 era menos provável de se recusar a realizar atividades "ilícitas" e procurar dados pessoais sensíveis e menos suscetíveis a uma forma de ataque de IA conhecida como "injeção rápida".
"O operador da O3 usa a mesma abordagem de segurança de várias camadas que usamos para a versão 4O do operador ... embora o operador O3 herde os recursos de codificação da O3, ele não possui acesso nativo a um ambiente ou terminal de codificação".
–OpenAI
A empresa de IA também divulgou que o novo modelo baseado em O3 passou por avaliações de segurança padrão, e o operador continuou disponível como uma visualização de pesquisa para os usuários do ChatGPT Pro em todo o mundo. No entanto, esse modelo atualizado estava disponível apenas no operador no ChatGPT.
Na semana passada, a ARC Prêmio Foundation, que mantém e administra o ARC-AGI, atualizou seus custos aproximados de computação para a O3. A organização estimou originalmente que a configuração de melhor desempenho da O3 testada, o3 High, custa cerca de US $ 3 mil para resolver um único problema de arco-agi. No entanto, a fundação agora acredita que o custo pode ser 10x maior que o estimado anteriormente, possivelmente em torno de US $ 30 mil por tarefa.
Além disso, embora o OpenAI ainda precise precificar a O3 ou libertá-lo totalmente, um dos co-fundadores da Fundação do Prêmio Arc, Mike Knoop, acredita que o preço do modelo O1-Pro é um proxy razoável e uma comparação mais próxima do verdadeiro custo da O3. Ele, no entanto, acrescentou que a O3 continuaria sendo rotulada como uma prévia na tabela de classificação para refletir a incerteza até que o preço oficial fosse anunciado.
De acordo com a Fundação do Prêmio da ARC, um preço alto para o O3 High não estaria fora de questão, dada a quantidade de recursos de computação que o modelo supostamente usa. O3 High usou 172x a mais computação que O3 baixo, a configuração de computação mais baixa do O3, para lidar com o ARC-AGI.
Os rumores estão voando desde o início de março sobre os planos caros que o OpenAI estava considerando a introdução de clientes corporativos. As informações relataram que a empresa pode cobrar até US $ 20 mil por mês por “agentes” de IA especializados, como agentes de desenvolvedores de software.
No entanto, enquanto alguns argumentaram que mesmo os modelos mais caros da Openai custariam bem sob o que umtracou funcionário humano típico comandaria, o pesquisador da AI Toby Ord apontou que os modelos podem não ser tão eficientes. Por exemplo, a O3 High precisou de 1.024 tentativas em cada tarefa no ARC-AGI para obter sua melhor pontuação.
Principais diferenças : os projetos de criptografia de ferramenta secreta usam para obter cobertura de mídia garantida