O agente operador do OpenAI recebe um impulso com o novo modelo de IA

Fonte Cryptopolitan

O OpenAIT atualizou o operador de alimentação do modelo de IA da versão personalizada anterior do GPT-4O para um modelo baseado no O3, um dos mais recentes modelos de "raciocínio" do Openai. O operador O3 foi ajustado com dados de segurança adicionais para uso do computador e incluiu conjuntos de dados de segurança projetados para ensinar os limites da decisão do modelo.

O OpenAIAI atualizou o operador no ChatGPT com um novo modelo de agente de uso de computador (CUA) com base em uma versão do OpenAI O3. Com o novo modelo, o operador tornou -se mais persistente e mais preciso ao interagir com o navegador, melhorando a taxa geral de sucesso da tarefa. Ele também oferece respostas melhor estruturadas que são mais claras e completas.

Segundo o OpenAI , o novo modelo CUA mostrou o tron Ger em relação à indústria, alcançando o SOTA em Osworld e Webarena. Ele também mostrou o desempenho relativo da versão anterior, tanto em benchmarks estabelecidos quanto em avaliações de preferência humana tron

OpenAI substitui o modelo baseado em GPT-4o por uma versão baseada em O3

O OpenAI substituiu o modelo existente baseado em GPT-4O para operador por uma versão baseada no OpenAI O3, embora a versão da API permaneça com base no 4O. A empresa de IA também alegou que o operador O3 usa a mesma abordagem de segurança de várias camadas usada para a versão 4O.

No entanto, em comparação com outros modelos da família O3, o operador O3 foi ajustado com dados de segurança adicionais para uso do computador, incluindo conjuntos de dados de segurança projetados para ensinar os limites da decisão do modelo em confirmações e recusas.

O OpenAI divulgou um relatório técnico mostrando o desempenho do operador da O3 em avaliações de segurança específicas. Comparado ao modelo do operador GPT-4O, o operador da O3 era menos provável de se recusar a realizar atividades "ilícitas" e procurar dados pessoais sensíveis e menos suscetíveis a uma forma de ataque de IA conhecida como "injeção rápida".

"O operador da O3 usa a mesma abordagem de segurança de várias camadas que usamos para a versão 4O do operador ... embora o operador O3 herde os recursos de codificação da O3, ele não possui acesso nativo a um ambiente ou terminal de codificação".

OpenAI

A empresa de IA também divulgou que o novo modelo baseado em O3 passou por avaliações de segurança padrão, e o operador continuou disponível como uma visualização de pesquisa para os usuários do ChatGPT Pro em todo o mundo. No entanto, esse modelo atualizado estava disponível apenas no operador no ChatGPT.

Os suspeitos de knoop que executam o modelo O3 do OpenAI podem ser mais caros do que o esperado

Na semana passada, a ARC Prêmio Foundation, que mantém e administra o ARC-AGI, atualizou seus custos aproximados de computação para a O3. A organização estimou originalmente que a configuração de melhor desempenho da O3 testada, o3 High, custa cerca de US $ 3 mil para resolver um único problema de arco-agi. No entanto, a fundação agora acredita que o custo pode ser 10x maior que o estimado anteriormente, possivelmente em torno de US $ 30 mil por tarefa.

Além disso, embora o OpenAI ainda precise precificar a O3 ou libertá-lo totalmente, um dos co-fundadores da Fundação do Prêmio Arc, Mike Knoop, acredita que o preço do modelo O1-Pro é um proxy razoável e uma comparação mais próxima do verdadeiro custo da O3. Ele, no entanto, acrescentou que a O3 continuaria sendo rotulada como uma prévia na tabela de classificação para refletir a incerteza até que o preço oficial fosse anunciado.

De acordo com a Fundação do Prêmio da ARC, um preço alto para o O3 High não estaria fora de questão, dada a quantidade de recursos de computação que o modelo supostamente usa. O3 High usou 172x a mais computação que O3 baixo, a configuração de computação mais baixa do O3, para lidar com o ARC-AGI.

Os rumores estão voando desde o início de março sobre os planos caros que o OpenAI estava considerando a introdução de clientes corporativos. As informações relataram que a empresa pode cobrar até US $ 20 mil por mês por “agentes” de IA especializados, como agentes de desenvolvedores de software.

No entanto, enquanto alguns argumentaram que mesmo os modelos mais caros da Openai custariam bem sob o que umtracou funcionário humano típico comandaria, o pesquisador da AI Toby Ord apontou que os modelos podem não ser tão eficientes. Por exemplo, a O3 High precisou de 1.024 tentativas em cada tarefa no ARC-AGI para obter sua melhor pontuação.

Principais diferenças : os projetos de criptografia de ferramenta secreta usam para obter cobertura de mídia garantida

Isenção de responsabilidade: Apenas para fins informativos. O desempenho passado não é indicativo de resultados futuros.
placeholder
Dólar australiano se movimenta pouco enquanto o dólar americano permanece firme antes da decisão de política do FedO dólar australiano (AUD) permanece estável nesta quarta-feira, após sofrer perdas na sessão anterior.
Autor  FXStreet
3 Mês 19 Dia Qua
O dólar australiano (AUD) permanece estável nesta quarta-feira, após sofrer perdas na sessão anterior.
placeholder
Dólar australiano cai após dados de emprego e decisão de taxa de juros da China.O Dólar Australiano (AUD) enfraquece frente ao Dólar Americano (USD) nesta quinta-feira, revertendo os ganhos da sessão anterior.
Autor  FXStreet
3 Mês 20 Dia Qui
O Dólar Australiano (AUD) enfraquece frente ao Dólar Americano (USD) nesta quinta-feira, revertendo os ganhos da sessão anterior.
placeholder
O Doge de Elon Musk causou danos irreparáveis ​​aos benefícios da Seguridade Social dos AmericanosOs americanos, dependendo das verificações mensais do Seguro Social, agora estão sendo esmagados por clawbacks brutais, apenas algumas semanas após a administração da seguridade social desencadear o pânico com uma nova política de retenção de 100%, graças ao Departamento de Eficiência do Governo de Elon Musk (DOGE). Esse número agora foi reduzido para 50% - mas as consequências financeiras já estão se espalhando rapidamente, com muitos [...]
Autor  Cryptopolitan
5 Mês 06 Dia Ter
Os americanos, dependendo das verificações mensais do Seguro Social, agora estão sendo esmagados por clawbacks brutais, apenas algumas semanas após a administração da seguridade social desencadear o pânico com uma nova política de retenção de 100%, graças ao Departamento de Eficiência do Governo de Elon Musk (DOGE). Esse número agora foi reduzido para 50% - mas as consequências financeiras já estão se espalhando rapidamente, com muitos [...]
placeholder
Previsão de preço do Solana: 1,4 milhão de SOL não apostados em 24 horas, quebra de $150 ou quebra de $200K?O preço do Solana caiu 3,8% na quinta-feira, sendo negociado a US$ 169 no momento da publicação, com ganhos semanais reduzidos a um dígito.
Autor  FXStreet
5 Mês 16 Dia Sex
O preço do Solana caiu 3,8% na quinta-feira, sendo negociado a US$ 169 no momento da publicação, com ganhos semanais reduzidos a um dígito.
placeholder
Previsão de preço da Cardano: ADA à beira de uma correção com o enfraquecimento do momentumA Cardano (ADA) é negociada no vermelho na terça-feira, no momento em que este artigo foi escrito, pairando em torno de seu nível de suporte principal de US$ 0,72. Um fechamento decisivo abaixo desse nível poderia desencadear uma correção. A queda dos endereços ativos diários da ADA e o volume de negociação da Bolsa Descentralizada (DEX) apóiam ainda mais a perspectiva de baixa.
Autor  FXStreet
5 Mês 20 Dia Ter
A Cardano (ADA) é negociada no vermelho na terça-feira, no momento em que este artigo foi escrito, pairando em torno de seu nível de suporte principal de US$ 0,72. Um fechamento decisivo abaixo desse nível poderia desencadear uma correção. A queda dos endereços ativos diários da ADA e o volume de negociação da Bolsa Descentralizada (DEX) apóiam ainda mais a perspectiva de baixa.
goTop
quote