Google DeepMind presentó el jueves SIMA 2, su agente de IA de razonamiento que, según la empresa, se comporta como un humano en mundos virtuales. La compañía tecnológica afirmó que SIMA 2 ayuda a DeepMind a ir más allá de las simples acciones en pantalla y avanzar hacia una IA capaz de planificar, explicarse y aprender de la experiencia.
La empresa afirmó que el lanzamiento representaba un paso significativo hacia la Inteligencia Artificial General (IAG). DeepMind también advirtió que SIMA 2 tiene importantes implicaciones generales para el futuro de la robótica y la encarnación de la IA.
SIMA 2 es nuestro agente de IA más potente para mundos virtuales 3D. 👾🌐
Gracias a la tecnología Gemini, va más allá de seguir instrucciones básicas para pensar, comprender y actuar en entornos interactivos; es decir, puedes comunicarte con él mediante texto, voz o incluso imágenes. Aquí te explicamos cómo 🧵 pic.twitter.com/DuVWGJXW7W
— Google DeepMind (@GoogleDeepMind) 13 de noviembre de 2025
La empresa tecnológica lanzó la primera versión de SIMA (Agente Multimundo Escalable e Instructable) en marzo. Google afirmó que el agente de IA aprendió cientos de habilidades básicas observando la pantalla y utilizando controles virtuales de teclado y ratón. La compañía también reconoció que la última versión del agente de IA va un paso más allá al permitirle pensar por sí mismo.
Google DeepMind también reveló que Gemini impulsa el agente de IA. La compañía tecnológica afirmó que la integración de SIMA 2 y Gemini ayuda al agente de IA a comprender el objetivo general del usuario, realizar razonamientos complejos y ejecutar hábilmente acciones orientadas a objetivos en los juegos.
La empresa afirmó que SIMA 2 es su agente de IA más potente para mundos virtuales 3D. DeepMind descubrió que interactuar con el agente se sentía menos como darle órdenes y más como colaborar con un compañero racional en la tarea en cuestión.
Según el anuncio, SIMA 2 va más allá de seguir instrucciones básicas, permitiendo a los usuarios pensar, comprender y actuar en entornos interactivos. El agente de IA les permitirá interactuar con él mediante texto, voz o incluso imágenes.
Google afirmó que su modelo de IA Gemini ayuda a SIMA 2 a interpretar objetivos de alto nivel y a explicar los pasos que pretende seguir. La empresa añadió que Gemini permite al nuevo agente, centrado en el usuario, colaborar en juegos con un nivel de razonamiento que el sistema original no podía alcanzar.
La empresa tecnológica también informó de unatroncapacidad de generalización en entornos virtuales. DeepMind confirmó que SIMA 2 completó tareas más largas y complejas, incluyendo instrucciones lógicas, bocetos en pantalla y el uso de emojis. Google afirmó que esta capacidad acerca el rendimiento de SIMA 2 al de un jugador humano en una amplia gama de tareas. La empresa también señaló que el agente de IA alcanzó una tasa de finalización de tareas del 65%, en comparación con el 31% de SIMA 1.
DeepMind descubrió que SIMA 2 interpretaba instrucciones y actuaba dentro de mundos 3D completamente nuevos generados por Genie 3. Este proyecto, lanzado el año pasado, crea entornos interactivos a partir de una sola imagen o texto. La empresa tecnológica afirmó que SIMA 2 podía orientarse, comprender objetivos y realizar acciones significativas en mundos que nunca había explorado hasta antes de las pruebas.
Google argumentó que el agente centrado en el ser humano ahora ejecuta instrucciones detalladas con mucha mayor eficacia, incluso en entornos desconocidos. La empresa afirmó que SIMA 2 puede transferir conceptos aprendidos de un juego a otro, estableciendo conexiones entre tareas similares.
Los investigadores observaron que el agente pasó a un modo de juego autodirigido tras aprender de las demostraciones humanas. El agente empleó el método de ensayo y error, junto con la retroalimentación generada por Gemini, para crear nuevos datos de experiencia. Estos nuevos datos incluyen un ciclo de entrenamiento en el que SIMA 2 intentó las tareas que había generado y retroalimentó la siguiente versión del modelo con sus propios datos de trayectoria.
Aunque DeepMind elogió a SIMA 2 como un avance en inteligencia artificial, la investigación también reveló deficiencias que deben abordarse. Googledentdeficiencias, como el funcionamiento con una memoria limitada, las dificultades con tareas largas y complejas, y los desafíos de interpretación visual propios de los sistemas de IA 3D.
DeepMind reveló que SIMA 2 sirvió como banco de pruebas para habilidades que podrían utilizarse en robótica y navegación en el futuro. La empresa afirmó que su investigación con SIMA 2 ofrece un tron hacia aplicaciones en robótica e inteligencia artificial general (IAG) en el mundo real.
Si estás leyendo esto, ya estás al tanto. Sigue leyendo nuestro boletín .