Anthropic lanzó el miércoles Claude Mythos Preview, un nuevo modelo de IA cibernética, pero el público no puede usarlo.
En una publicación en su blog, la compañía afirmó: "Los modelos de IA han alcanzado un nivel de capacidad de codificación que les permite superar a todos, excepto a los humanos más habilidosos, a la hora de encontrar y explotar vulnerabilidades de software"
La empresa de inteligencia artificial afirmó haber estimado que los costes globales del cibercrimen ascienden a unos 500.000 millones de dólares al año.
Según Anthropic , el grupo que lanzó Mythos Preview incluye a Amazon Web Services, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorgan Chase, la Linux Foundation, Microsoft, NVIDIA y Palo Alto Networks.
Más de 40 organizaciones que desarrollan o mantienen software crítico también obtuvieron acceso. Anthropic anunció que proporcionará hasta 100 millones de dólares en créditos de uso y 4 millones de dólares en apoyo directo a grupos de seguridad de código abierto.
En su comunicado de prensa, Anthropic afirma que Mythos Preview supuestamente ha encontrado miles de vulnerabilidades de alta gravedad en todos los principales sistemas operativos y todos los principales navegadores web.
Un ejemplo fue una vulnerabilidad de 27 años de antigüedad en OpenBSD que permitía a un atacante bloquear remotamente una máquina con solo conectarse a ella. Otro ejemplo fue una vulnerabilidad de 16 años de antigüedad en FFmpeg, oculta en un código que las herramientas automatizadas habían explotado cinco millones de veces sin detectarla.
El modelo también detectó y encadenó varias vulnerabilidades en el núcleo de Linux, de modo que un atacante podría pasar del acceso de usuario ordinario al control total de una máquina.
Anthropic ha declarado que, en lo que respecta a otros errores, planea publicar ahora los hashes criptográficos y revelará más información una vez que se hayan implementado las correcciones, ya que el modelo descubrió casi todas esas vulnerabilidades y creó por sí mismo muchos exploits relacionados.
En CyberGym, Mythos Preview obtuvo una puntuación del 83,1 % en reproducción de vulnerabilidades, en comparación con el 66,6 % de Claude Opus 4.6. VentureBeat informó por separado un 93,9 % en SWE-bench Verified, frente al 80,8 % de Opus 4.6.
Anthropic explicó entonces que los sistemas de vanguardia recientes han reducido el coste, el esfuerzo y la habilidad necesarios para encontrar y explotar las vulnerabilidades de seguridad.
En el marco del proyecto Glasswing, los socios utilizarán Mythos Preview para trabajos de seguridad en sistemas internos y código abierto.
Anthropic afirmó que el trabajo incluirá la detección de vulnerabilidades locales, pruebas de caja negra de binarios, seguridad de puntos finales y pruebas de penetración.
Tras la presentación preliminar de la investigación, los participantes podrán acceder al modelo a través de la API de Claude, Amazon Bedrock, Google Cloud Vertex AI y Microsoft Foundry a un precio de 25 dólares por millón de tokens de entrada y 125 dólares por millón de tokens de salida.
La compañía también anunció que donó 2,5 millones de dólares a Alpha-Omega y OpenSSF a través de la Linux Foundation, además de 1,5 millones de dólares a la Apache Software Foundation.
AWS afirmó que analiza más de 400 billones de flujos de red al día, Microsoft indicó que el modelo mostró mejoras con respecto a CTI-REALM, CrowdStrike afirmó que la brecha entre encontrar una vulnerabilidad y explotarla se ha reducido drásticamente, y Google anunció que pondrá el modelo a disposición a través de Vertex AI, mientras que Palo Alto Networks declaró que los defensores necesitan estas herramientas antes de que los atacantes las obtengan.
Según informó The New York Times, a finales del año pasado, Anthropic afirmó que piratas informáticos chinos respaldados por el Estado utilizaron su inteligencia artificial en un intento por atacar a unas 30 empresas y agencias gubernamentales, mientras que los operadores humanos solo realizaron entre el 10% y el 20% del trabajo.
El informe también señala que los atacantes ya están utilizando la IA para redactar correos electrónicos de phishing, escribir notas de rescate, clasificar datos robados y acelerar la venta de información filtrada.
Tu banco está usando tu dinero. Tú te quedas con las migajas. Mira nuestro video gratuito sobre cómo convertirte en tu propio banco.