O chip de IA de US$ 20 bilhões da Nvidia pode superar as capacidades do ChatGPT

Fonte Cryptopolitan

A gigante dos chips NVIDIA está se preparando para apresentar um novo e poderoso processador de inteligência artificial projetado para acelerar a forma como chatbots e outras ferramentas de IA geram respostas, potencialmente fazendo com que sistemas atuais como o ChatGPT pareçam lentos em comparação.

A nova plataforma, com lançamento previsto para a conferência anual de desenvolvedores GTC da NVIDIA, é otimizada para inferência de IA, a etapa em que os modelos treinados produzem respostas às solicitações do usuário. Ao contrário das GPUs tradicionais, projetadas para lidar tanto com treinamento quanto com inferência, o novo processador se concentra especificamente em fornecer respostas com mais rapidez e eficiência.

O produto, se lançado, marcará o primeiro resultado tangível do acordo de dezembro que trouxe os fundadores da Groq para a empresa, especializada em hardware de processamento de IA de alta velocidade.

No final do ano passado, a NVIDIA teria gasto cerca de US$ 20 bilhões para licenciar tecnologia da startup de chips Groq e recrutar pessoal-chave, incluindo seu CEO. Quase simultaneamente, o CEO da NVIDIA, Jensen Huang, disse aos funcionários: "Planejamos integrar os processadores de baixa latência da Groq à arquitetura NVIDIA AI Factory, expandindo a plataforma para atender a uma gama ainda maior de cargas de trabalho de inferência de IA e em tempo real."

Agora, espera-se que o novo chip de inferência processe consultas complexas de IA em alta velocidade, e a OpenAI e outros clientes líderes provavelmente o adotarão, de acordo com o The Wall Street Journal. A reportagem também mostrou que o novo chip pode processar cerca de 10% da carga de trabalho de inferência da OpenAI.

Fontes dizem que o chip no estilo Groq usará SRAM

Durante uma recente teleconferência sobre resultados financeiros, o CEO da NVIDIA insinuou que vários novos produtos serão apresentados no próximo evento GTC, frequentemente descrito como o "Super Bowl da IA". Ele comentou: "Tenho algumas ótimas ideias que gostaria de compartilhar com vocês no GTC."

A maioria dos analistas concorda que o chip no estilo Groq pode fazer parte da linha de produtos. Eles também afirmaram que seu design pode esclarecer como a NVIDIA pretende lidar com as limitações de memória na computação inferencial. Essas plataformas normalmente utilizam memória de alta largura de banda (HBM). No entanto, a HBM tem sido difícil de encontrar ultimamente.

Fontes internas afirmam que a empresa planeja usar SRAM no chip em vez da RAM dinâmica associada à HBM. Idealmente, a SRAM é mais acessível e pode melhorar o desempenho das cargas de trabalho de raciocínio de IA.

Se o chip for apresentado, poderá representar um grande avanço para a empresa de semicondutores e para os modelos de IA treinados. No entanto, ao falar sobre seu possível lançamento, Sid Sheth, fundador e CEO da d-Matrix, lançou dúvidas sobre seu desenvolvimento. Ele observou que, embora a NVIDIA continue sendo a líder incontestável em treinamento de IA, a inferência representa um cenário muito diferente. Ele afirmou: "Os desenvolvedores podem recorrer a concorrentes que não sejam a NVIDIA, porque executar modelos de IA finalizados não exige o mesmo tipo de programação que treiná-los." 

No entanto, outras gigantes da tecnologia também estão avançando na computação inferencial. A Meta revelou esta semana quatro processadores projetados especificamente para inferência, levando um investidor do Vale do Silício a afirmar que o setor pode estar entrando em uma fase não dominada pela NVIDIA.

No entanto, mais recentemente, June Paik, diretora executiva da FuriosaAI, uma concorrente da NVIDIA, ao comentar sobre o benefício da computação de inferência de fácil implementação, alertou que a maioria dos centros de dados não consegue acomodar as GPUs mais recentes com refrigeração líquida.

Apesar das preocupações, os analistas do Bank of America preveem que as cargas de trabalho de inferência representarão 75% dos gastos com data centers de IA até 2030, quando o mercado atingirá cerca de US$ 1,2 trilhão, um aumento em relação aos cerca de 50% do ano passado. Ben Bajarin, analista de tecnologia da Creative Strategies, também afirmou que os data centers do futuro não seguirão um modelo único, prevendo que as empresas adotarão abordagens diferentes para o desenvolvimento de chips e instalações.

A NVIDIA deverá lançar os chips Vera Rubin ainda em 2026

A NVIDIA também lançou recentemente seus chips de IA de última geração, os chips Vera Rubin AI, prevendo que a ascensão de plataformas de IA de raciocínio, como o DeepSeek, impulsionará uma demanda ainda maior por computação. A empresa afirmou que os chips ajudarão a treinar modelos de IA maiores e a fornecer resultados mais sofisticados para uma base de usuários mais ampla.

Segundo Huang, o Rubin também chegará ao mercado no segundo semestre de 2026, com uma versão "ultra" de alta gama prevista para 2027.

Ele também explicou que um único sistema Rubin combinaria 576 GPUs individuais em um único chip. Atualmente, o chip Blackwell da NVIDIA agrupa 72 GPUs em seu sistema NVL72, o que significa que o Rubin contará com uma memória mais avançada.

Se você está lendo isto, já está um passo à frente. Continue assim assinando nossa newsletter .

Isenção de responsabilidade: Apenas para fins informativos. O desempenho passado não é indicativo de resultados futuros.
placeholder
Previsão Semanal do Ethereum: ETH sob pressão em meio ao aumento das tensões geopolíticas, e rejeição técnica sinaliza risco de quedaO Ethereum (ETH) opera em queda, deslizando para abaixo de US$ 2.200 nesta sexta-feira, após ser rejeitado na zona de resistência chave no início desta semana. O apetite por risco diminui à medida que as tensões geopolíticas aumentam após as declarações do presidente dos EUA, Donald Trump, sobre possíveis novas ações contra o Irã.
Autor  FXStreet
Ontem 06: 03
O Ethereum (ETH) opera em queda, deslizando para abaixo de US$ 2.200 nesta sexta-feira, após ser rejeitado na zona de resistência chave no início desta semana. O apetite por risco diminui à medida que as tensões geopolíticas aumentam após as declarações do presidente dos EUA, Donald Trump, sobre possíveis novas ações contra o Irã.
placeholder
A Metaplanet adquire BTC discretamente, tornando-se a terceira maior empresa com reservas Bitcoin no primeiro trimestre de 2026A Metaplanet anunciou a aquisição de mais de 5.000 BTC durante o primeiro trimestre de 2026, elevando seu total para mais de 40.000 BTC. O anúncio comprovou que a empresa japonesa se manteve ativa no mercado após o que muitos consideravam um longo período de inatividade nas compras. As aquisições, realizadas durante um período de grande apreensão e […]
Autor  Cryptopolitan
Ontem 01: 51
A Metaplanet anunciou a aquisição de mais de 5.000 BTC durante o primeiro trimestre de 2026, elevando seu total para mais de 40.000 BTC. O anúncio comprovou que a empresa japonesa se manteve ativa no mercado após o que muitos consideravam um longo período de inatividade nas compras. As aquisições, realizadas durante um período de grande apreensão e […]
placeholder
A Tesla entregou 358.023 veículos no primeiro trimestre, um aumento de 6% em relação ao ano passadoA Tesla vendeu mais carros nos primeiros três meses deste ano do que no mesmo período do ano passado. Mas os números ainda ficaram aquém do que Wall Street esperava. A empresa entregou 358.023 veículos em todo o mundo entre janeiro e março, informou na quinta-feira. Isso representa um aumento de 6% em relação ao ano anterior. Também […]
Autor  Cryptopolitan
Ontem 01: 49
A Tesla vendeu mais carros nos primeiros três meses deste ano do que no mesmo período do ano passado. Mas os números ainda ficaram aquém do que Wall Street esperava. A empresa entregou 358.023 veículos em todo o mundo entre janeiro e março, informou na quinta-feira. Isso representa um aumento de 6% em relação ao ano anterior. Também […]
placeholder
A Amazon quer comprar a empresa de satélites Globalstar por US$ 9 bilhõesA Amazon quer comprar a Globalstar, a empresa de satélites que mantém os iPhones conectados durante emergências. O negócio pode chegar a US$ 9 bilhões. O problema é que a Apple detém uma parte significativa da empresa e usa a maior parte da rede para alimentar os recursos de emergência em centenas de milhões de telefones. As ações da Globalstar subiram mais de 15% quando o Financial Times […]
Autor  Cryptopolitan
Ontem 01: 48
A Amazon quer comprar a Globalstar, a empresa de satélites que mantém os iPhones conectados durante emergências. O negócio pode chegar a US$ 9 bilhões. O problema é que a Apple detém uma parte significativa da empresa e usa a maior parte da rede para alimentar os recursos de emergência em centenas de milhões de telefones. As ações da Globalstar subiram mais de 15% quando o Financial Times […]
placeholder
A Eightco detém US$ 326 milhões em caixa, com forte ênfase em inteligência artificial devido à sua exposição à Worldcoin e à OpenAI.A Eightco, listada na Nasdaq e também conhecida como ORBS, divulgou que suas participações totais em criptomoedas no início de abril somavam US$ 326 milhões, com investimentos em Worldcoin e inteligência artificial (IA) representando a maior parte desse valor. A ZeroStack, outra empresa listada na Nasdaq, informou ter feito um aporte institucional de US$ 107 milhões, como parte de seus planos de aumentar seu investimento estratégico em criptomoedas
Autor  Cryptopolitan
Ontem 01: 47
A Eightco, listada na Nasdaq e também conhecida como ORBS, divulgou que suas participações totais em criptomoedas no início de abril somavam US$ 326 milhões, com investimentos em Worldcoin e inteligência artificial (IA) representando a maior parte desse valor. A ZeroStack, outra empresa listada na Nasdaq, informou ter feito um aporte institucional de US$ 107 milhões, como parte de seus planos de aumentar seu investimento estratégico em criptomoedas
goTop
quote