A OpenAI revela capacidades de atuação independente no lançamento do novo modelo de IA GPT-5.5

Fonte Cryptopolitan

A OpenAI lançou oficialmente o GPT-5.5 em 23 de abril de 2026, projetado especificamente para entender a intenção do usuário em situações reais. O modelo possui funcionalidades nativas de uso geral que permitem navegar em aplicativos de desktop, clicar em botões e digitar texto em fluxos de trabalho com várias etapas.

A equipe da OpenAI afirma que o GPT-5.5 combina o uso nativo de computadores com raciocínio avançado. Ele navega autonomamente pelas ferramentas de software necessárias para tarefas profissionais de alto nível. A janela de contexto do modelo, com cerca de 1,1 milhão de tokens, permite processar conjuntos de dados financeiros massivos que antes exigiam fragmentação manual.

A equipe financeira da OpenAI usou o GPT-5.5 para analisar 24.771 formulários fiscais K-1 (71.637 páginas) e concluiu a tarefa duas semanas mais rápido do que no ano anterior.

O GPT-5.5 também obteve 88,5% em tarefas internas de modelagem de banco de investimento e 60% no benchmark FinancialAgent v1.1, superando o GPT-5.4 em quatro pontos percentuais. Um funcionário da equipe de Go-to-Market confirmou que a automatização de relatórios comerciais semanais economizará aproximadamente de 5 a 10 horas de trabalho manual por semana. 

O GPT-5.5 ajuda a escrever código para sua própria infraestrutura de serviço

Notavelmente, a OpenAI afirma que o GPT-5.5 foi usado para ajudar a escrever o código de sua própria infraestrutura de servidores. O modelo alcançou a "Otimização em Nível de Sistema" ao analisar padrões de tráfego de produção para escrever heurísticas personalizadas de balanceamento de carga, aumentando sua própria velocidade de geração de tokens em 20%. 

Em um teste, um desenvolvedor pediu ao modelo para "reestruturar um editor de Markdown". Ele retornou uma pilha de 12 diferenças quase completa, com correções humanas mínimas. A OpenAI observa que o novo modelo é mais eficiente, chegando à resposta correta em menos tentativas e usando 40% menos tokens para as mesmas tarefas do Codex. No entanto, o preço por token é o dobro do GPT-5.4.

Enquanto isso, Dan Shipper, fundador e CEO da Every, descreve o GPT-5.5 como o primeiro modelo de codificação com "clareza conceitual genuína". Para testar o GPT-5.5, Shipper o implementou depois que ele e seu melhor engenheiro passaram dias depurando um problema pós-lançamento em um aplicativo para reescrever parte do sistema.

Ele afirma que o GPT-5.5 alcançou o que o GPT-5.4 não conseguiu: examinou o código defeituoso e produziu a reescrita que o engenheiro acabou adotando. O modelo consegue "memorizar" e fazer referências cruzadas em bibliotecas inteiras de informações sem se perder, reduzindo as "alucinações" que afetavam as versões anteriores.

A OpenAI também afirma que o GPT-5.5 é otimizado para "autocorreção" e autonomia. Ele é melhor em interpretar instruções ambíguas e usar uma interface de computador (clicar, digitar, navegar) para concluir objetivos sem intervenção humana.

No entanto, a principal fonte de entusiasmo é a mudança do GPT-5.5 em direção à autonomia de agentes. O modelo torna-se particularmente útil quando um agente é necessário para operar software, gerenciar fluxos de trabalho com uso intensivo de terminais ou raciocinar sobre toda uma base de código (mais de 500 mil tokens) com alta precisão de recuperação.

A OpenAI afirma que o 'GPT-5.5 Thinking' oferece ajuda mais rápida para problemas mais complexos

Em relação ao ChatGPT , a OpenAI afirma que o "Pensamento GPT-5.5" oferece ajuda mais rápida para problemas mais complexos. O recurso fornece respostas mais inteligentes e concisas para ajudar os usuários a concluir tarefas complicadas com mais eficiência. Ele se destaca em trabalhos profissionais, como síntese e análise de informações, programação e tarefas que envolvem muitos documentos, como pesquisa, especialmente quando se utilizam plugins.

Entretanto, os primeiros usuários do GPT-5.5 Pro afirmam que houve uma grande melhoria tanto na qualidade quanto na dificuldade das tarefas que o ChatGPT consegue executar. Sua menor latência o torna mais prático para tarefas exigentes do que o GPT-5.4 Pro. As respostas do GPT-5.5 Pro são bem estruturadas, relevantes, úteis e precisas. Elas apresentam um desempenho particularmente bom nas áreas de direito, ciência de dados, negócios e educação.

Consequentemente, o GPT-5.5 obteve 84,9% no GDPval, que testa a capacidade dos agentes de produzir conhecimento específico em 44 ocupações. No OSWorld-Verified (que mede as operações autônomas do modelo em computadores reais), o modelo alcançou 78,7%. E obteve uma pontuação alta de 98% no Tau2-bench Telecom, que testa fluxos de trabalho de atendimento ao cliente extremamente complexos. 

No entanto, a principal desvantagem desse aumento de capacidade é o preço elevado. Embora exista uma versão básica, a versão mais completa (GPT-5.5 Pro) custa US$ 100 por mês para assinantes individuais. 

Por outro lado, para as empresas, o custo por token de saída é aproximadamente o dobro do GPT-5.4, mesmo com uma eficiência de token 40% maior. O gasto total para implantações de agentes em larga escala pode ser substancial. Há também uma crescente preocupação de que o raciocínio de nível mais alto se torne um "luxo" acessível apenas a empresas bem financiadas, o que pode ampliar a lacuna de produtividade entre grandes empresas e startups menores.

Se você está lendo isto, já está um passo à frente. Continue assim assinando nossa newsletter .

Isenção de responsabilidade: Apenas para fins informativos. O desempenho passado não é indicativo de resultados futuros.
placeholder
O ouro parece vulnerável perto da mínima de duas semanas, à medida que o impasse entre os EUA e o Irã e os temores de inflação impulsionam o dólar americanoO ouro (XAU/USD) continua em baixa abaixo da marca de US$ 4.700 durante o pregão asiático desta sexta-feira, próximo à mínima de duas semanas registrada no dia anterior, e parece prestes a registrar perdas semanais pela primeira vez em cinco semanas.
Autor  FXStreet
10 horas atrás
O ouro (XAU/USD) continua em baixa abaixo da marca de US$ 4.700 durante o pregão asiático desta sexta-feira, próximo à mínima de duas semanas registrada no dia anterior, e parece prestes a registrar perdas semanais pela primeira vez em cinco semanas.
placeholder
A TD Cowen manteve sua recomendação de compra para a Nvidia, apesar dos chips de IA concorrentes do GoogleApesar do novo desafio de chips da Google e da perda de umtracbilionário com um de seus principais fornecedores, a Nvidia continua sendo a força dominante em hardware de inteligência artificial, com novos acordos no Reino Unido, na China e no setor automotivo reforçando essa posição. A empresa de pesquisa de Wall Street TD Cowen reafirmou sua recomendação de compra para as ações da Nvidia nesta quinta-feira, […]
Autor  Cryptopolitan
14 horas atrás
Apesar do novo desafio de chips da Google e da perda de umtracbilionário com um de seus principais fornecedores, a Nvidia continua sendo a força dominante em hardware de inteligência artificial, com novos acordos no Reino Unido, na China e no setor automotivo reforçando essa posição. A empresa de pesquisa de Wall Street TD Cowen reafirmou sua recomendação de compra para as ações da Nvidia nesta quinta-feira, […]
placeholder
Washington enfrenta pressão de mais de 120 grupos de criptomoedas devido a projeto de lei sobre o mercadoWashington está sob pressão de uma ampla coalizão de participantes do setor de criptomoedas em relação ao projeto de lei sobre a estrutura de mercado. Mais de 120 organizações se mobilizaram para instar formalmente o Comitê Bancário do Senado dos EUA a aprovar os projetos de lei. Isso inclui especificamente o aguardado CLARITY Act. No entanto, o grupo é liderado pela Blockchain Association e pelo Crypto Council for […]
Autor  Cryptopolitan
14 horas atrás
Washington está sob pressão de uma ampla coalizão de participantes do setor de criptomoedas em relação ao projeto de lei sobre a estrutura de mercado. Mais de 120 organizações se mobilizaram para instar formalmente o Comitê Bancário do Senado dos EUA a aprovar os projetos de lei. Isso inclui especificamente o aguardado CLARITY Act. No entanto, o grupo é liderado pela Blockchain Association e pelo Crypto Council for […]
placeholder
Os mercados de previsão apostam que o Estreito de Ormuz permanecerá fechado por mais algumas semanasOs mercados de previsão apostam que o Estreito de Ormuz permanecerá bloqueado por mais tempo, mesmo após Washington e Teerã terem estendido o cessar-fogo. Os operadores em Kalshi reduziram as probabilidades de um rápido retorno à normalidade do tráfego marítimo, depois que ambos os lados disseram muito pouco sobre o que realmente importa para o mercado: se o Irã reabrirá o estreito e […]
Autor  Cryptopolitan
14 horas atrás
Os mercados de previsão apostam que o Estreito de Ormuz permanecerá bloqueado por mais tempo, mesmo após Washington e Teerã terem estendido o cessar-fogo. Os operadores em Kalshi reduziram as probabilidades de um rápido retorno à normalidade do tráfego marítimo, depois que ambos os lados disseram muito pouco sobre o que realmente importa para o mercado: se o Irã reabrirá o estreito e […]
placeholder
Aave congela reservas de rsETH em Ethereum Core, Arbitrum, Base, Mantle e LineaAave congelou as reservas de rsETH no Ethereum Core, Arbitrum, Base, Mantle e Linea, à medida que as consequências da exploração da vulnerabilidade KelpDAO passam do modo de emergência para o modo de recuperação. Ao anunciar a decisão na X, o protocolo afirmou que isso ajudará a recuperar mais fundos enquanto os planos de recuperação continuam avançando após a exploração de 18 de abril, que drenou 116.500 rsETH, […]
Autor  Cryptopolitan
14 horas atrás
Aave congelou as reservas de rsETH no Ethereum Core, Arbitrum, Base, Mantle e Linea, à medida que as consequências da exploração da vulnerabilidade KelpDAO passam do modo de emergência para o modo de recuperação. Ao anunciar a decisão na X, o protocolo afirmou que isso ajudará a recuperar mais fundos enquanto os planos de recuperação continuam avançando após a exploração de 18 de abril, que drenou 116.500 rsETH, […]
goTop
quote