TradingKey - Em 24 de junho, horário do leste, na assembleia de acionistas da Nvidia ( NVDA) anual, o CEO Jensen Huang usou um discurso de duas horas para definir o tom da próxima fase de desenvolvimento da indústria de IA. Ele declarou a chegada oficial da "era da IA útil", afirmando que os agentes se tornarão o motor principal a impulsionar a demanda por poder computacional nas próximas décadas, e caracterizou essa mudança de paradigma computacional como o maior reset do setor em 60 anos.
Jensen Huang enfatizou repetidamente em seu discurso que a IA concluiu a transição da experimentação tecnológica para a produção comercial.
Citando dados de desenvolvedores do GitHub, ele observou que o número de pull requests mesclados por desenvolvedores globais foi de 400 milhões em 2024, subindo para 500 milhões em 2025 e disparando quase três vezes apenas nos primeiros meses de 2026. Por trás desses números está a realidade de que os agentes de IA estão substituindo humanos em escala massiva em tarefas como programação, design e análise de dados, com cada token gerado se tornando uma unidade de lucro monetizável.
Huang destacou que, embora a função principal dos data centers no passado fosse armazenar e transmitir arquivos, a missão central das modernas fábricas de IA é produzir tokens — essas unidades monetizáveis de inteligência que servem como matéria-prima para códigos, respostas, designs, ações e serviços.
Ele usou a estrutura de um "bolo de cinco camadas" para descrever o ecossistema industrial de IA que, de baixo para cima, consiste em energia, chips e sistemas, infraestrutura, modelos e aplicações. Esse modelo implica que o escopo de atuação da Nvidia vai muito além dos chips, abrangendo toda a cadeia de produção de IA.
Sob este novo paradigma, os clientes que adquirem sistemas da Nvidia não estão apenas comprando ferramentas de computação; eles estão construindo fábricas de IA capazes de gerar receita diretamente.
Huang enfatizou que a eficiência da arquitetura da fábrica — especificamente, quantos tokens podem ser produzidos por watt e quão baixo pode ser o custo por token — tornou-se a dimensão mais crítica da concorrência.
Para o ano fiscal de 2026, a receita anual da Nvidia atingiu US$ 216 bilhões, uma alta de 65% em termos anuais, com a receita de data centers representando US$ 194 bilhões, o que equivale a um aumento de 68% na comparação anual. O fluxo de caixa operacional alcançou US$ 103 bilhões, com US$ 41 bilhões retornados aos acionistas durante o ano.
Huang observou especificamente que, embora o preço de compra dos sistemas da Nvidia possa não ser o mais baixo, la empresa consegue produzir a maior quantidade de tokens ao menor custo, alcançando o maior rendimento (throughput). Esse modelo de negócios foi totalmente validado pelo mercado, estabelecendo uma base sólida para a liderança contínua da Nvidia na era da IA.
Com a rápida adoção do treinamento de grandes modelos, inferência e aplicações de agentes de IA, o valor estratégico da memória e do armazenamento em data centers está aumentando de forma constante. Aproveitando suas vantagens tecnológicas full-stack, a Nvidia está se estabelecendo como a principal propulsora desta revolução industrial de IA.
Jensen Huang posicionou a plataforma Vera Rubin como "um dos produtos mais importantes da história da empresa". Ao contrário da plataforma Hopper anterior, focada em treinamento, e da plataforma Blackwell, voltada para inferência, a Vera Rubin é uma solução completa de fábrica de IA projetada especificamente para a era dos agentes de IA, com a CPU Vera representando o marco da entrada da Nvidia no mercado de CPUs de uso geral.
Huang explicou que o modo como os agentes de IA funcionam é completamente diferente dos humanos; eles habitam um mundo computacional na escala de nanossegundos, acionando ferramentas constantemente, acessando bancos de dados, executando códigos e iterando tarefas. Nesse cenário, se a CPU se tornar um gargalo, as caras GPUs ficarão ociosas, e cada segundo de ociosidade se traduzirá em perda de receita para a fábrica de IA. Para resolver isso, a Nvidia desenvolveu do zero a CPU Vera, específica para agentes — sem mais se promover pela contagem de núcleos, ela busca uma capacidade de resposta de latência extremamente baixa para atender às demandas simultâneas de bilhões de agentes de IA em todo o mundo.
Sendo a primeira CPU a contar com memória LPDDR5, a Vera é 1,8 vez mais rápida do que as CPUs x86 tradicionais, com um aumento de 50% no desempenho de núcleo único. Ela também oferece suporte nativo à precisão FP8, o que permite lidar diretamente com tarefas de inferência de IA e aprendizado por reforço, sem a necessidade de intermediação da GPU.
Atualmente, a Vera Rubin entrou em produção em larga escala, com os principais desenvolvedores de modelos globais, nuvens públicas, nuvens de IA e clientes de hiperescala já iniciando a implantação.
Huang disse: "A Vera Rubin não é um chip, mas uma plataforma de fábrica de IA, e o ecossistema já está em movimento. Todos os principais desenvolvedores de modelos, nuvens públicas, nuvens de IA e provedores de hiperescala estão se preparando para construir sobre ela."
Os produtos de IA de terceira geração da Nvidia têm uma divisão clara de funções. A Hopper foca no pré-treinamento; a Blackwell escala a inferência no nível do rack; e a plataforma Vera Rubin, composta pela CPU Vera para escalonamento e pela GPU Rubin para computação, foi projetada especificamente para a era dos agentes de IA.
Notavelmente, a Nvidia é o único player do setor que possui simultaneamente três sistemas de rede de alta velocidade — NVLink, Spectrum-X Ethernet e InfiniBand. Isso fornece uma base de interconexão exclusiva para a CPU Vera, garantindo resposta de baixa latência e coordenação altamente eficiente em cenários de IA agêntica.
Além dos agentes digitais, Jensen Huang também voltou sua atenção para a IA física no mundo real. Ele destacou que a inteligência artificial está rompendo as barreiras do mundo virtual e está sendo totalmente implantada em terminais como condução autônoma, robôs humanoides e equipamentos industriais inteligentes, equipando o hardware físico com capacidades inteligentes completas de percepção, raciocínio, planejamento e ação. A implementação em larga escala nesse campo catalisará uma nova onda de investimentos em infraestrutura de trilhões de dólares.
Huang comparou a infraestrutura de IA a grandes projetos de infraestrutura da história humana, como a rede elétrica e a internet, acreditando que este será um boom de construção que durará décadas. Ele enfatizou que a tecnologia da Nvidia não apenas apoiará agentes digitais, mas também fornecerá capacidade de processamento essencial para a IA física, que deve se tornar o próximo grande motor de crescimento da empresa.
Diante do desempenho abaixo do esperado das ações em relação ao mercado norte-americano mais amplo este ano, Jensen Huang buscou fortalecer a confiança do mercado ao reforçar a visão de que o superciclo de gastos de capital em IA ainda está em seus estágios iniciais.
Ele reiterou que mais de 50% do fluxo de caixa livre será devolvido aos acionistas e definiu diversas políticas de retorno de capital como compromissos de longo prazo. Durante sua teleconferência de resultados mais recente, a Nvidia anunciou um programa autorizado de recompra de ações de US$ 80 bilhões.
Olhando para o futuro, Huang expressou forte confiança: "A infraestrutura de IA não é mais experimental; ela entrou na fase de produção". Ele previu que a demanda por poder computacional na era dos agentes de IA crescerá exponencialmente, e a Nvidia, aproveitando suas vantagens tecnológicas full-stack e o fosso de seu ecossistema, continuará a liderar a maior expansão de infraestrutura da história humana.