Amazon ha lanzado su proyecto Rainier, valorado en 11.000 millones de dólares, que utilizará más de un millón de chips Trainium 2 para impulsar el modelo Claude de Anthropic antes de que finalice el año. El complejo rural de 485 hectáreas, ubicado en Indiana, cerca del lago Michigan, está dedicado exclusivamente al entrenamiento de los modelos de IA de Anthropic con chips de Amazon.
La empresa tecnológica afirmó que el clúster de centros de datos Rainier opera actualmente con aproximadamente 500 000 chips Tranium2, y Anthropic se ha comprometido a duplicar su inversión en la infraestructura de IA de Amazon. Por su parte, Amazon ha comprometido cerca de 8000 millones de dólares y Google ha invertido aproximadamente 3000 millones de dólares en Anthropic. Amazon Web Services (AWS) se refiere al Proyecto Rainier como el clúster de computación para entrenamiento de IA más potente del mundo.
Cryptopolitan informó que Anthropic no está realizando pruebas; está calculando, de forma metódica y escalando su infraestructura al máximo . Sus modelos Claude se distribuyen entre las GPU de Nvidia, las TPU de Google y los chips Trainium de Amazon, y cada chip realiza una tarea específica. La investigación se lleva a cabo en una ubicación, el entrenamiento en otra y las inferencias en una tercera.
El CEO de AWS, Matt Garman, afirmó que el clúster de computación Rainier no es un concepto futuro, sino un proyecto ya en funcionamiento. Sin embargo, según se informa, los escépticos se preguntan si existe la financiación, la energía y el apoyo de la comunidad suficientes para llevar a buen término estos ambiciosos centros de datos de IA.
El ejecutivo afirmó que Amazon está cumpliendo con creces, gracias a sus décadas de experiencia en el manejo de datos logísticos a gran escala. Además, ha forjado vínculos estrechos y sólidos con funcionarios locales y estatales a través de sus enormes centros de distribución, el proyecto HQ2, los centros de datos de AWS y sus centros logísticos.
“Esto no es un proyecto futuro del que hayamos hablado y que tal vez se haga realidad… Esto es ejecutar y entrenar sus modelos hoy mismo.”
– Matt Garman, director ejecutivo de Amazon Web Services
Mike Krieger, director de producto de Anthropic, afirmó que los acuerdos solo lucen bien en teoría, pero que solo se materializarán una vez que los sistemas estén instalados, configurados y disponibles para los clientes. Sin embargo, reconoció que Amazon es increíblemente eficiente en este aspecto. Josh Sallabedra, responsable del centro de datos de Rainier en Indiana y con más de 14 años de experiencia en la construcción de centros de datos para Amazon, declaró que nunca había visto a la empresa tecnológica moverse con tanta rapidez. Garman lo describió como una transición casi instantánea de campos de maíz a centros de datos.
Mike Krieger, de Anthropic, destacó la alta demanda de los modelos de IA de su empresa y añadió que la estrategia de múltiples chips les ha permitido alcanzar el volumen de negocio que han tenido este año. Sin embargo, señaló que la empresa necesitará toda la capacidad de procesamiento posible.
Mientras tanto, Garman afirmó estar al tanto de los esfuerzos en materia de múltiples chips y nubes, pero aclaró que Amazon no tiene planes de realizar ninguna medida drástica, como una oferta por Anthropic. Añadió que ambas compañías están satisfechas con la alianza actual.
Anthropic también ha declarado que no depende exclusivamente de Amazon para definir su estrategia futura. La empresa anunció la semana pasada su alianza con Alphabet para acceder a TPU (Unidades de Procesamiento de Tensores) personalizadas de Google por valor de un millón de dólares. La compañía de IA reveló que el acuerdo asciende a decenas de miles de millones de dólares, aunque no se ofrecieron detalles específicos.
Anthropic ha recalcado que avanza a un ritmo vertiginoso e invierte grandes sumas de cash para mantenerse al día con otros gigantes de la IA. Su chatbot Claude ya da soporte a más de 300.000 empresas, lo que supone un aumento de 300 veces en los últimos dos años. Los grandes clientes corporativos, cada uno con ingresos anuales superiores a los 100.000 dólares, han crecido casi siete veces en un año. Mientras tanto, el Claude Code de la compañía generó 500 millones de dólares en ingresos anualizados en sus primeras ocho semanas.
Prasad Kalyanaraman,dent de Servicios de Infraestructura de AWS, considera fundamental desarrollar el conjunto adecuado de capacidades que requieren los proveedores de modelos. Añadió que controlar la pila desde las capas inferiores de la infraestructura es igualmente crucial.
¿Quieres que tu proyecto esté presente en las mentes más brillantes del mundo de las criptomonedas? Preséntalo en nuestro próximo informe del sector, donde los datos se combinan con el impacto.