O GPT-Realtime-2 traz a inteligência do GPT-5 para a API de voz

Autor: Cryptopolitan
Atualizado em
Mitrade Team
Artigos em destaque
coverImg
Fonte: DepositPhotos

A OpenAI lançou na quarta-feira uma nova geração de modelos de voz em sua API, fornecendo aos desenvolvedores ferramentas para criar aplicativos capazes de analisar solicitações faladas, traduzir entre mais de 70 idiomas e transcrever a fala em tempo real.

Os três modelos são chamados GPT-Realtime-2, GPT-Realtime-Translate e GPT-Realtime-Whisper. Eles levam as interfaces de voz com IA além de simples trocas de perguntas e respostas, para um território onde um agente de IA pode ouvir, pensar e agir durante a conversa.

O GPT-Realtime-2 traz um raciocínio mais preciso para a voz

O GPT-Realtime-2 é o carro-chefe. A OpenAI afirma que ele oferece raciocínio equivalente ao do GPT-5, um avanço significativo em relação ao seu antecessor, o GPT-Realtime-1.5.

O modelo obteve uma pontuação 15,2% superior no Big Bench Audio, um teste de referência para inteligência de áudio, e 13,8% superior no Audio MultiChallenge, que testa o seguimento de instruções em diálogos falados com múltiplas interações.

As melhorias práticas são direcionadas a desenvolvedores que criam agentes de voz para produção. O modelo agora suporta uma janela de contexto de 128 mil caracteres, quatro vezes maior que o limite anterior de 32 mil, e oferece cinco níveis de esforço de raciocínio ajustável, de "mínimo" a "extremamente alto"

Ele pode chamar várias ferramentas simultaneamente, recuperar-se de erros com confirmações de voz e produzir frases curtas de transição, como "deixe-me verificar isso", durante o processamento de uma solicitação.

O GPT-Realtime-Translate realiza a tradução de fala em tempo real. Ele aceita mais de 70 idiomas de entrada e produz traduções em 13, projetado para acompanhar o ritmo do falante em tempo real.

O GPT-Realtime-Whisper oferece conversão de fala em texto (STT) em tempo real, transcrevendo as palavras à medida que são faladas, em vez de esperar que a frase seja concluída.

Zillow e Deutsche Telekom testam os modelos em produção

Diversas empresas tiveram acesso antecipado. A Zillow está desenvolvendo um assistente de voz capaz de processar consultas complexas sobre imóveis, gerenciar chamadas de ferramentas para busca de anúncios e estar em conformidade com as regulamentações de Habitação Justa.

A empresa reportou uma melhoria de 26 pontos percentuais na taxa de sucesso das chamadas em seu benchmark adversário mais difícil, após otimização imediata com o GPT-Realtime-2, atingindo 95% em comparação com os 69% anteriores.

A Deutsche Telekom está testando a tradução em tempo real para o suporte ao cliente, permitindo que os usuários falem em seu idioma preferido enquanto o sistema cuida da conversão em ambas as partes.

A Priceline está explorando um assistente de viagens baseado em voz que poderá gerenciar buscas de voos, alterações de hotéis e traduções no local em uma única sessão.

Os modelos são direcionados a empresas que buscam expandir suas capacidades de atendimento ao cliente, mas também apontam aplicações potenciais em educação, mídia, eventos e plataformas para criadores de conteúdo.

A OpenAI afirmou ter incorporado moderação de conteúdo aos novos modelos, com gatilhos que podem interromper conversas detectadas como violando as diretrizes de conteúdo prejudicial. A empresa apresentou as medidas de segurança como proteção contra spam, fraude e outras formas de abuso.

Em relação aos preços, os modelos Translate e Whisper são cobrados por minuto. O GPT-Realtime-2 é cobrado por consumo de tokens. Os três estão disponíveis através da API Realtime da OpenAI, acessível via WebRTC, WebSocket e SIP.

Leia mais

  • Ondo, JPMorgan, Mastercard e Ripple concluem liquidação de tesouraria tokenizada na XRP Ledger
  • A Anthropic recorre ao supercomputador da SpaceX para dar aos usuários do Claude mais espaço de trabalho
  • Michael Saylor anuncia que venderá suas participações em Bitcoin da Strategy após o terceiro resultado financeiro abaixo do esperado consecutivo
  • O ouro mantém tendência positiva acima dos US$ 4.700, próximo da maior cotação em mais de uma semana, devido à desvalorização do dólar americano
  • Fortuna de Satoshi Nakamoto ultrapassa US$ 133 bilhões após novo recorde do Bitcoin
  • Ouro corrige a partir do recorde histórico à medida que a alta das ações asiáticas estimula a realização de lucros
  • Isenção de responsabilidade: este artigo representa apenas a opinião do autor e não pode ser usado como consultoria de investimento. O conteúdo do artigo é apenas para referência. Os leitores não devem tomar este artigo como base para investimento. Antes de tomar qualquer decisão de investimento, procure orientação profissional independente para garantir que você entenda os riscos.

     

    Os Contratos por Diferença (CFDs) são produtos alavancados que podem resultar na perda de todo o seu capital. Esses produtos não são adequados para todos os clientes; por favor, invista com rigor. Consulte este arquivo para obter mais informações.


    goTop
    quote
    Artigos Relacionados
    placeholder
    A Anthropic recorre ao supercomputador da SpaceX para dar aos usuários do Claude mais espaço de trabalhoA Anthropic fechou um acordo de computação com a SpaceX para que os usuários do Claude possam obter limites maiores em vez de enfrentarem o mesmo problema de lentidão durante tarefas pesadas. A empresa está utilizando capacidade do data center Colossus 1 da SpaceX, e o acordo lhe dá acesso a mais de 300 megawatts de nova energia, conectados a mais de 220.000...
    Autor  Cryptopolitan
    Ontem 02: 00
    A Anthropic fechou um acordo de computação com a SpaceX para que os usuários do Claude possam obter limites maiores em vez de enfrentarem o mesmo problema de lentidão durante tarefas pesadas. A empresa está utilizando capacidade do data center Colossus 1 da SpaceX, e o acordo lhe dá acesso a mais de 300 megawatts de nova energia, conectados a mais de 220.000...
    placeholder
    A DeepSeek está buscando financiamento com uma avaliação acima de US$ 20 bilhõesA DeepSeek agora busca uma avaliação acima de US$ 20 bilhões, enquanto a Tencent Holdings e o Alibaba Group discutem possíveis investimentos na startup chinesa de IA. A informação foi divulgada na quarta-feira pelo The Information, citando quatro fontes a par das negociações. A DeepSeek, que pertence ao fundo de hedge High-Flyer Capital Management, havia acabado de iniciar as conversas com investidores externos […]
    Autor  Cryptopolitan
    4 Mês 23 Dia Qui
    A DeepSeek agora busca uma avaliação acima de US$ 20 bilhões, enquanto a Tencent Holdings e o Alibaba Group discutem possíveis investimentos na startup chinesa de IA. A informação foi divulgada na quarta-feira pelo The Information, citando quatro fontes a par das negociações. A DeepSeek, que pertence ao fundo de hedge High-Flyer Capital Management, havia acabado de iniciar as conversas com investidores externos […]
    placeholder
    Agentes de IA que negociam criptomoedas de forma autônoma representam a próxima grande mudança no blockchainO próximo grande desenvolvimento no mundo das criptomoedas centra-se em agentes financeiros autônomos, e não apenas em novas moedas ou plataformas de negociação. Trata-se de programas de computador capazes de gerir finanças e concluir transações sem intervenção humana. A tese central do Hong Kong Web3 Festival desta semana foi a de que uma mudança significativa no setor é iminente. Autoridades e líderes […]
    Autor  Cryptopolitan
    4 Mês 22 Dia Qua
    O próximo grande desenvolvimento no mundo das criptomoedas centra-se em agentes financeiros autônomos, e não apenas em novas moedas ou plataformas de negociação. Trata-se de programas de computador capazes de gerir finanças e concluir transações sem intervenção humana. A tese central do Hong Kong Web3 Festival desta semana foi a de que uma mudança significativa no setor é iminente. Autoridades e líderes […]
    placeholder
    Um robô da Honor quebrou o recorde mundial, completando a prova em 50 minutos e 26 segundosUm robô desenvolvido pela fabricante chinesa de smartphones Honor acaba de quebrar o recorde mundial de tempo mais rápido em uma meia maratona na competição Beijing E-Town. A tão aguardada meia maratona entre robôs e humanos de Pequim foi realizada no último domingo, e houve um salto significativo no desempenho dos robôs em relação ao ano anterior. “A velocidade dos robôs aumentou consideravelmente […]
    Autor  Cryptopolitan
    4 Mês 21 Dia Ter
    Um robô desenvolvido pela fabricante chinesa de smartphones Honor acaba de quebrar o recorde mundial de tempo mais rápido em uma meia maratona na competição Beijing E-Town. A tão aguardada meia maratona entre robôs e humanos de Pequim foi realizada no último domingo, e houve um salto significativo no desempenho dos robôs em relação ao ano anterior. “A velocidade dos robôs aumentou consideravelmente […]
    placeholder
    A escalada de dívidas das grandes empresas de tecnologia para financiar inteligência artificial está colidindo com um obstáculo de refinanciamento de US$ 3,6 trilhõesA endividamento desenfreado das grandes empresas de tecnologia com foco em IA está colidindo com uma barreira de refinanciamento de US$ 3,6 trilhões nos EUA e no sistema global, à medida que o dinheiro barato se transforma em uma pressão de refinanciamento onerosa. O setor de tecnologia possui mais de US$ 330 bilhões em dívidas de software e tecnologia, incluindo empréstimos alavancados de alto rendimento e dívidas vinculadas a empresas de desenvolvimento de negócios, com vencimento até 2028. […]
    Autor  Cryptopolitan
    4 Mês 20 Dia Seg
    A endividamento desenfreado das grandes empresas de tecnologia com foco em IA está colidindo com uma barreira de refinanciamento de US$ 3,6 trilhões nos EUA e no sistema global, à medida que o dinheiro barato se transforma em uma pressão de refinanciamento onerosa. O setor de tecnologia possui mais de US$ 330 bilhões em dívidas de software e tecnologia, incluindo empréstimos alavancados de alto rendimento e dívidas vinculadas a empresas de desenvolvimento de negócios, com vencimento até 2028. […]
    Cotações em tempo real
    Nome / SímboloGráfico% Variação / Preço
    US500
    US500
    0.00%0.00

    inteligência artificial Artigos relacionados

    • Nvidia ações em alta em 2026: vale a pena investir agora? Análise completa + previsões
    • 10 Melhores sites de inteligência artificial gratuitos em 2026 (Atualizado)
    • Top 20 Maiores Empresas de Tecnologia do Brasil e do Mundo em 2025
    • 6 Ações de Inteligência Artificial (IA) para Ficar de Olho
    • Ações de empresas de tecnologia: Ainda vale a pena investir em 2025?
    • Inteligência Artificial no Mercado Financeiro em 2025: Como a IA Está Transformando Investimentos

    Clique para ver mais