O GPT-Realtime-2 traz a inteligência do GPT-5 para a API de voz

Fonte Cryptopolitan

A OpenAI lançou na quarta-feira uma nova geração de modelos de voz em sua API, fornecendo aos desenvolvedores ferramentas para criar aplicativos capazes de analisar solicitações faladas, traduzir entre mais de 70 idiomas e transcrever a fala em tempo real.

Os três modelos são chamados GPT-Realtime-2, GPT-Realtime-Translate e GPT-Realtime-Whisper. Eles levam as interfaces de voz com IA além de simples trocas de perguntas e respostas, para um território onde um agente de IA pode ouvir, pensar e agir durante a conversa.

O GPT-Realtime-2 traz um raciocínio mais preciso para a voz

O GPT-Realtime-2 é o carro-chefe. A OpenAI afirma que ele oferece raciocínio equivalente ao do GPT-5, um avanço significativo em relação ao seu antecessor, o GPT-Realtime-1.5.

O modelo obteve uma pontuação 15,2% superior no Big Bench Audio, um teste de referência para inteligência de áudio, e 13,8% superior no Audio MultiChallenge, que testa o seguimento de instruções em diálogos falados com múltiplas interações.

As melhorias práticas são direcionadas a desenvolvedores que criam agentes de voz para produção. O modelo agora suporta uma janela de contexto de 128 mil caracteres, quatro vezes maior que o limite anterior de 32 mil, e oferece cinco níveis de esforço de raciocínio ajustável, de "mínimo" a "extremamente alto"

Ele pode chamar várias ferramentas simultaneamente, recuperar-se de erros com confirmações de voz e produzir frases curtas de transição, como "deixe-me verificar isso", durante o processamento de uma solicitação.

O GPT-Realtime-Translate realiza a tradução de fala em tempo real. Ele aceita mais de 70 idiomas de entrada e produz traduções em 13, projetado para acompanhar o ritmo do falante em tempo real.

O GPT-Realtime-Whisper oferece conversão de fala em texto (STT) em tempo real, transcrevendo as palavras à medida que são faladas, em vez de esperar que a frase seja concluída.

Zillow e Deutsche Telekom testam os modelos em produção

Diversas empresas tiveram acesso antecipado. A Zillow está desenvolvendo um assistente de voz capaz de processar consultas complexas sobre imóveis, gerenciar chamadas de ferramentas para busca de anúncios e estar em conformidade com as regulamentações de Habitação Justa.

A empresa reportou uma melhoria de 26 pontos percentuais na taxa de sucesso das chamadas em seu benchmark adversário mais difícil, após otimização imediata com o GPT-Realtime-2, atingindo 95% em comparação com os 69% anteriores.

A Deutsche Telekom está testando a tradução em tempo real para o suporte ao cliente, permitindo que os usuários falem em seu idioma preferido enquanto o sistema cuida da conversão em ambas as partes.

A Priceline está explorando um assistente de viagens baseado em voz que poderá gerenciar buscas de voos, alterações de hotéis e traduções no local em uma única sessão.

Os modelos são direcionados a empresas que buscam expandir suas capacidades de atendimento ao cliente, mas também apontam aplicações potenciais em educação, mídia, eventos e plataformas para criadores de conteúdo.

A OpenAI afirmou ter incorporado moderação de conteúdo aos novos modelos, com gatilhos que podem interromper conversas detectadas como violando as diretrizes de conteúdo prejudicial. A empresa apresentou as medidas de segurança como proteção contra spam, fraude e outras formas de abuso.

Em relação aos preços, os modelos Translate e Whisper são cobrados por minuto. O GPT-Realtime-2 é cobrado por consumo de tokens. Os três estão disponíveis através da API Realtime da OpenAI, acessível via WebRTC, WebSocket e SIP.

Não se limite a ler notícias sobre criptomoedas. Compreenda-as. Assine nossa newsletter. É grátis.

Isenção de responsabilidade: Apenas para fins informativos. O desempenho passado não é indicativo de resultados futuros.
placeholder
Michael Saylor anuncia que venderá suas participações em Bitcoin da Strategy após o terceiro resultado financeiro abaixo do esperado consecutivoMichael Saylor finalmente revelou o que todos esperavam. A Strategy (MSTR) pode vender Bitcoin se essa medida beneficiar a empresa, mesmo após ter construído suadentpública em torno da manutenção do ativo durante todas as bruscas oscilações do mercado. Saylor fez o comentário na teleconferência de resultados do primeiro trimestre da Strategy, em 5 de maio, após mais um relatório negativo ter gerado novas pressões...
Autor  Cryptopolitan
5 Mês 06 Dia Qua
Michael Saylor finalmente revelou o que todos esperavam. A Strategy (MSTR) pode vender Bitcoin se essa medida beneficiar a empresa, mesmo após ter construído suadentpública em torno da manutenção do ativo durante todas as bruscas oscilações do mercado. Saylor fez o comentário na teleconferência de resultados do primeiro trimestre da Strategy, em 5 de maio, após mais um relatório negativo ter gerado novas pressões...
placeholder
A Anthropic recorre ao supercomputador da SpaceX para dar aos usuários do Claude mais espaço de trabalhoA Anthropic fechou um acordo de computação com a SpaceX para que os usuários do Claude possam obter limites maiores em vez de enfrentarem o mesmo problema de lentidão durante tarefas pesadas. A empresa está utilizando capacidade do data center Colossus 1 da SpaceX, e o acordo lhe dá acesso a mais de 300 megawatts de nova energia, conectados a mais de 220.000...
Autor  Cryptopolitan
23 horas atrás
A Anthropic fechou um acordo de computação com a SpaceX para que os usuários do Claude possam obter limites maiores em vez de enfrentarem o mesmo problema de lentidão durante tarefas pesadas. A empresa está utilizando capacidade do data center Colossus 1 da SpaceX, e o acordo lhe dá acesso a mais de 300 megawatts de nova energia, conectados a mais de 220.000...
placeholder
Ondo, JPMorgan, Mastercard e Ripple concluem liquidação de tesouraria tokenizada na XRP LedgerO JPMorgan Chase (JPM), a Mastercard (MA), Ripplee a Ondo Finance concluíram um resgate de títulos do Tesouro dos EUA tokenizados, integrando o XRP Ledger aos sistemas de liquidação bancária internacionais. A Ondo afirmou que o teste foi o primeiro resgate transfronteiriço e interbancário quase em tempo real de um fundo do Tesouro dos EUA tokenizado. A configuração proporcionou às instituições um caminho funcional para ativos tokenizados 24 horas por dia, 7 dias por semana...
Autor  Cryptopolitan
23 horas atrás
O JPMorgan Chase (JPM), a Mastercard (MA), Ripplee a Ondo Finance concluíram um resgate de títulos do Tesouro dos EUA tokenizados, integrando o XRP Ledger aos sistemas de liquidação bancária internacionais. A Ondo afirmou que o teste foi o primeiro resgate transfronteiriço e interbancário quase em tempo real de um fundo do Tesouro dos EUA tokenizado. A configuração proporcionou às instituições um caminho funcional para ativos tokenizados 24 horas por dia, 7 dias por semana...
placeholder
Bitcoin atinge máxima em três meses com negociações EUA-Irã reduzindo prêmio de risco do petróleoOs mercados globais oscilaram bruscamente na quarta-feira, com sinais de progresso nas negociações entre EUA e Irã desencadeando um rápido desmantelamento de posições beligerantes, derrubando os preços do petróleo e impulsionando as ações e as criptomoedas. Bitcoin ultrapassou os US$ 81.000, seu maior valor em três meses, enquanto o petróleo Brent caiu cerca de 11%, para aproximadamente US$ 98 por barril. O índice S&P 500 subiu 0,85%...
Autor  Cryptopolitan
23 horas atrás
Os mercados globais oscilaram bruscamente na quarta-feira, com sinais de progresso nas negociações entre EUA e Irã desencadeando um rápido desmantelamento de posições beligerantes, derrubando os preços do petróleo e impulsionando as ações e as criptomoedas. Bitcoin ultrapassou os US$ 81.000, seu maior valor em três meses, enquanto o petróleo Brent caiu cerca de 11%, para aproximadamente US$ 98 por barril. O índice S&P 500 subiu 0,85%...
placeholder
O ouro mantém tendência positiva acima dos US$ 4.700, próximo da maior cotação em mais de uma semana, devido à desvalorização do dólar americanoO ouro (XAU/USD) é negociado com tendência positiva pelo terceiro dia consecutivo e mantém-se estável acima da marca de US$ 4.700 durante o pregão asiático desta quinta-feira, logo abaixo da máxima de uma semana e meia registrada no dia anterior.
Autor  FXStreet
19 horas atrás
O ouro (XAU/USD) é negociado com tendência positiva pelo terceiro dia consecutivo e mantém-se estável acima da marca de US$ 4.700 durante o pregão asiático desta quinta-feira, logo abaixo da máxima de uma semana e meia registrada no dia anterior.
goTop
quote