Na quinta-feira, o Google DeepMind lançou o SIMA 2, seu agente de IA de raciocínio que, segundo a empresa, se comporta como um humano em mundos virtuais. A empresa de tecnologia afirmou que o SIMA 2 ajuda o DeepMind a ir além de simples ações na tela e a avançar em direção a uma IA que planeja e explica a si mesma, além de aprender com a experiência.
A empresa afirmou que o lançamento representa um passo significativo rumo à Inteligência Artificial Geral (AGI). A DeepMind também alertou que o SIMA 2 tem importantes implicações gerais para o futuro da robótica e da incorporação de IA.
SIMA 2 é o nosso agente de IA mais capaz para mundos virtuais 3D. 👾🌐
Com a tecnologia Gemini, ele vai além de seguir instruções básicas, pensando, entendendo e agindo em ambientes interativos — o que significa que você pode conversar com ele por texto, voz ou até mesmo imagens. Veja como 🧵 pic.twitter.com/DuVWGJXW7W
— Google DeepMind (@GoogleDeepMind) 13 de novembro de 2025
A empresa de tecnologia lançou a primeira versão do SIMA (Scalable Instructable MultiWorld Agent) em março. O Google afirmou que o agente de IA aprendeu centenas de habilidades básicas observando a tela e usando controles virtuais de teclado e mouse. A empresa também reconheceu que a versão mais recente do agente de IA dá um passo além, permitindo que a IA pense por si mesma.
O Google DeepMind também revelou que o Gemini alimenta o agente de IA. A empresa de tecnologia afirmou que a integração do SIMA 2 com o Gemini ajuda o agente de IA a entender o objetivo geral do usuário, realizar raciocínios complexos e executar ações orientadas a objetivos com habilidade em jogos.
A empresa afirmou que o SIMA 2 é o agente de IA mais capaz da empresa para mundos virtuais 3D. A DeepMind descobriu que interagir com o agente era menos como dar comandos e mais como colaborar com um companheiro que raciocinava sobre a tarefa em questão.
Segundo o anúncio, o SIMA 2 vai além de seguir instruções básicas, sendo capaz de pensar, compreender e agir em ambientes interativos. O agente de IA permitirá que os usuários interajam com ele por meio de texto, voz ou até mesmo imagens.
O Google afirmou que seu modelo de IA Gemini ajuda o SIMA 2 a interpretar objetivos de alto nível e a discutir as etapas que pretende seguir. A empresa acrescentou que o Gemini ajuda o novo agente centrado no ser humano a colaborar em jogos com um nível de raciocínio que o sistema original não conseguia alcançar.
A empresa de tecnologia também relatou uma generalizaçãotronem ambientes virtuais. A DeepMind confirmou que o SIMA 2 completou tarefas mais longas e complexas, incluindo comandos lógicos, esboços desenhados na tela e emojis. O Google afirmou que essa capacidade aproxima o desempenho do SIMA 2 ao de um jogador humano em uma ampla gama de tarefas. A empresa também observou que o agente de IA teve uma taxa de conclusão de tarefas de 65%, em comparação com 31% do SIMA 1.
A DeepMind descobriu que o SIMA 2 interpretou instruções e agiu dentro de mundos 3D completamente novos, gerados pelo Genie 3. O projeto, lançado no ano passado, cria ambientes interativos a partir de uma única imagem ou texto. A empresa de tecnologia afirmou que o SIMA 2 conseguiu se orientar, compreender objetivos e tomar ações significativas em mundos que nunca havia encontrado antes dos testes.
O Google argumentou que o agente centrado no ser humano agora é muito melhor em executar instruções detalhadas, mesmo em mundos que nunca experimentou antes. A empresa afirmou que o SIMA 2 pode transferir conceitos aprendidos de um jogo para outro, conectando os pontos entre tarefas semelhantes.
Os pesquisadores observaram que o agente passou a jogar de forma autônoma após aprender com demonstrações humanas. O agente utilizou tentativa e erro, juntamente com o feedback gerado pelo Gemini, para criar novos dados de experiência. Esses novos dados incluem um ciclo de treinamento no qual o SIMA 2 tentou executar as tarefas que gerou e alimentou a próxima versão do modelo com seus próprios dados de trajetória.
Embora a DeepMind tenha elogiado o SIMA 2 como um avanço na inteligência artificial, a pesquisa também identificou lacunas que precisam ser abordadas. O Googledentalgumas dessas lacunas, incluindo a dificuldade em lidar com uma janela de memória limitada, problemas com tarefas muito longas e complexas, e desafios de interpretação visual comuns em sistemas de IA 3D.
A DeepMind revelou que o SIMA 2 serviu como plataforma de testes para habilidades que poderão ser usadas em robótica e navegação no futuro. A empresa afirmou que sua pesquisa com o SIMA 2 oferece um tron para aplicações em robótica e também em Inteligência Artificial Geral (AGI) no mundo real.
Seja visto onde importa. Anuncie na Cryptopolitan Research e alcance os investidores e criadores mais experientes em criptomoedas.