O GPT-Realtime-2 traz a inteligência do GPT-5 para a API de voz

Autor: Cryptopolitan
Atualizado em
Mitrade Team
Artigos em destaque
coverImg
Fonte: DepositPhotos

A OpenAI lançou na quarta-feira uma nova geração de modelos de voz em sua API, fornecendo aos desenvolvedores ferramentas para criar aplicativos capazes de analisar solicitações faladas, traduzir entre mais de 70 idiomas e transcrever a fala em tempo real.

Os três modelos são chamados GPT-Realtime-2, GPT-Realtime-Translate e GPT-Realtime-Whisper. Eles levam as interfaces de voz com IA além de simples trocas de perguntas e respostas, para um território onde um agente de IA pode ouvir, pensar e agir durante a conversa.

O GPT-Realtime-2 traz um raciocínio mais preciso para a voz

O GPT-Realtime-2 é o carro-chefe. A OpenAI afirma que ele oferece raciocínio equivalente ao do GPT-5, um avanço significativo em relação ao seu antecessor, o GPT-Realtime-1.5.

O modelo obteve uma pontuação 15,2% superior no Big Bench Audio, um teste de referência para inteligência de áudio, e 13,8% superior no Audio MultiChallenge, que testa o seguimento de instruções em diálogos falados com múltiplas interações.

As melhorias práticas são direcionadas a desenvolvedores que criam agentes de voz para produção. O modelo agora suporta uma janela de contexto de 128 mil caracteres, quatro vezes maior que o limite anterior de 32 mil, e oferece cinco níveis de esforço de raciocínio ajustável, de "mínimo" a "extremamente alto"

Ele pode chamar várias ferramentas simultaneamente, recuperar-se de erros com confirmações de voz e produzir frases curtas de transição, como "deixe-me verificar isso", durante o processamento de uma solicitação.

O GPT-Realtime-Translate realiza a tradução de fala em tempo real. Ele aceita mais de 70 idiomas de entrada e produz traduções em 13, projetado para acompanhar o ritmo do falante em tempo real.

O GPT-Realtime-Whisper oferece conversão de fala em texto (STT) em tempo real, transcrevendo as palavras à medida que são faladas, em vez de esperar que a frase seja concluída.

Zillow e Deutsche Telekom testam os modelos em produção

Diversas empresas tiveram acesso antecipado. A Zillow está desenvolvendo um assistente de voz capaz de processar consultas complexas sobre imóveis, gerenciar chamadas de ferramentas para busca de anúncios e estar em conformidade com as regulamentações de Habitação Justa.

A empresa reportou uma melhoria de 26 pontos percentuais na taxa de sucesso das chamadas em seu benchmark adversário mais difícil, após otimização imediata com o GPT-Realtime-2, atingindo 95% em comparação com os 69% anteriores.

A Deutsche Telekom está testando a tradução em tempo real para o suporte ao cliente, permitindo que os usuários falem em seu idioma preferido enquanto o sistema cuida da conversão em ambas as partes.

A Priceline está explorando um assistente de viagens baseado em voz que poderá gerenciar buscas de voos, alterações de hotéis e traduções no local em uma única sessão.

Os modelos são direcionados a empresas que buscam expandir suas capacidades de atendimento ao cliente, mas também apontam aplicações potenciais em educação, mídia, eventos e plataformas para criadores de conteúdo.

A OpenAI afirmou ter incorporado moderação de conteúdo aos novos modelos, com gatilhos que podem interromper conversas detectadas como violando as diretrizes de conteúdo prejudicial. A empresa apresentou as medidas de segurança como proteção contra spam, fraude e outras formas de abuso.

Em relação aos preços, os modelos Translate e Whisper são cobrados por minuto. O GPT-Realtime-2 é cobrado por consumo de tokens. Os três estão disponíveis através da API Realtime da OpenAI, acessível via WebRTC, WebSocket e SIP.

Leia mais

  • Vitalik Buterin relaciona o DeepSeek V4 ao futuro da privacidade do Ethereum
  • Últimas notícias: Nível de suporte crucial de US$ 4.400 é rompido, com o ouro caindo para a menor cotação em dois meses devido a uma nova escalada na tensão com o Irã
  • Ouro cai abaixo de US$ 4.400; suporte em US$ 4.360 pode definir reação do XAU/USD
  • As vendas de veículos elétricos na Europa aumentaram 29,4% no primeiro trimestre de 2026
  • O ETF Bitcoin da BlackRock registra uma saída de US$ 527 milhões, ficando muito perto de seu pior dia da história
  • Dólar fica perto de 99,00 com notícias divergentes sobre o Irã e PCE no radar
  • Isenção de responsabilidade: este artigo representa apenas a opinião do autor e não pode ser usado como consultoria de investimento. O conteúdo do artigo é apenas para referência. Os leitores não devem tomar este artigo como base para investimento. Antes de tomar qualquer decisão de investimento, procure orientação profissional independente para garantir que você entenda os riscos.

     

    Os Contratos por Diferença (CFDs) são produtos alavancados que podem resultar na perda de todo o seu capital. Esses produtos não são adequados para todos os clientes; por favor, invista com rigor. Consulte este arquivo para obter mais informações.


    goTop
    quote
    Artigos Relacionados
    placeholder
    SoftBank aposta em IA física no Japão, mas mercado teme demanda fragmentadaA SoftBank aposta no desenvolvimento de IA física com apoio de empresas japonesas e subsídios do governo, mas o mercado ainda teme a fragmentação da demanda e os desafios de integração dos dados industriais.
    Autor  TradingKey
    Ontem 10: 47
    A SoftBank aposta no desenvolvimento de IA física com apoio de empresas japonesas e subsídios do governo, mas o mercado ainda teme a fragmentação da demanda e os desafios de integração dos dados industriais.
    placeholder
    A Wix sofreu cortes de empregos na área de IA, com o CEO reduzindo em 20% sua força de trabalho após resultados do primeiro trimestre abaixo do esperadoO CEO da Wix, Avishai Abrahami, anunciou aos funcionários na quarta-feira que a empresa está cortando cerca de 20% de sua força de trabalho, eliminando aproximadamente 1.000 posições, no maior corte de pessoal da história da companhia. A empresa israelense opera uma plataforma que permite que pessoas e empresas criem sites sem escrever código. Ele publicou o anúncio no X (antigo Twitter) e no LinkedIn.
    Autor  Cryptopolitan
    Ontem 01: 38
    O CEO da Wix, Avishai Abrahami, anunciou aos funcionários na quarta-feira que a empresa está cortando cerca de 20% de sua força de trabalho, eliminando aproximadamente 1.000 posições, no maior corte de pessoal da história da companhia. A empresa israelense opera uma plataforma que permite que pessoas e empresas criem sites sem escrever código. Ele publicou o anúncio no X (antigo Twitter) e no LinkedIn.
    placeholder
    Sam Altman disse que a OpenAI quer que a IA funcione como um serviço público, pelo qual as pessoas pagam conforme o usoO fundador e CEO da OpenAI, Sam Altman, sentou-se diante de uma enorme plateia em uma conferência e disse, com a maior seriedade: "Nós vemos um futuro onde a inteligência é um serviço público, como eletricidade ou água, e então faremos com que as pessoas a comprem de nós, mediante pagamento." Assustador, não é? Sam disse que a OpenAI espera que a demanda...
    Autor  Cryptopolitan
    5 Mês 27 Dia Qua
    O fundador e CEO da OpenAI, Sam Altman, sentou-se diante de uma enorme plateia em uma conferência e disse, com a maior seriedade: "Nós vemos um futuro onde a inteligência é um serviço público, como eletricidade ou água, e então faremos com que as pessoas a comprem de nós, mediante pagamento." Assustador, não é? Sam disse que a OpenAI espera que a demanda...
    placeholder
    Larry Fink, da BlackRock, diz aos americanos que eles serão forçados a investir trilhões em IAO CEO da BlackRock (NYSE: BLK), Larry Fink, afirma que a gigantesca expansão da inteligência artificial nos Estados Unidos precisará de trilhões de dólares, e o dinheiro das pessoas comuns faz parte do plano. Segundo Larry, os investimentos em inteligência artificial, incluindo aqueles destinados a data centers, redes elétricas, chips e cabos, entre outros, virão de fontes como poupanças bancárias e fundos de pensão.
    Autor  Cryptopolitan
    5 Mês 26 Dia Ter
    O CEO da BlackRock (NYSE: BLK), Larry Fink, afirma que a gigantesca expansão da inteligência artificial nos Estados Unidos precisará de trilhões de dólares, e o dinheiro das pessoas comuns faz parte do plano. Segundo Larry, os investimentos em inteligência artificial, incluindo aqueles destinados a data centers, redes elétricas, chips e cabos, entre outros, virão de fontes como poupanças bancárias e fundos de pensão.
    placeholder
    DeepSeek torna permanente o corte de 75% no preço do V4-Pro, enquanto a guerra de preços da IA ​​entra em uma nova faseA DeepSeek anunciou neste sábado que manterá permanentemente o desconto de 75% em seu modelo principal, o V4-Pro, que expiraria em 31 de maio. Os tokens de saída da API do V4-Pro agora custam US$ 0,87 por milhão, uma redução em relação aos US$ 3,48 cobrados no lançamento, há um mês. A DeepSeek anunciou neste sábado que o desconto de 75% em seu modelo principal, o V4-Pro, agora está...
    Autor  Cryptopolitan
    5 Mês 25 Dia Seg
    A DeepSeek anunciou neste sábado que manterá permanentemente o desconto de 75% em seu modelo principal, o V4-Pro, que expiraria em 31 de maio. Os tokens de saída da API do V4-Pro agora custam US$ 0,87 por milhão, uma redução em relação aos US$ 3,48 cobrados no lançamento, há um mês. A DeepSeek anunciou neste sábado que o desconto de 75% em seu modelo principal, o V4-Pro, agora está...
    Cotações em tempo real
    Nome / SímboloGráfico% Variação / Preço
    US500
    US500
    0.00%0.00

    inteligência artificial Artigos relacionados

    • Aplicativo de Inteligência Artificial: Os 10 Melhores Apps de IA para Investir e Aumentar a Produtividade em 2026
    • Nvidia ações em alta em 2026: vale a pena investir agora? Análise completa + previsões
    • 10 Melhores sites de inteligência artificial gratuitos em 2026 (Atualizado)
    • Top 20 Maiores Empresas de Tecnologia do Brasil e do Mundo em 2025
    • 6 Ações de Inteligência Artificial (IA) para Ficar de Olho
    • Ações de empresas de tecnologia: Ainda vale a pena investir em 2025?

    Clique para ver mais