Amazon's AWS (Amazon Web Services) está listo para desafiar el dominio del mercado de NVIDIA en el sector de chips de IA, ya que empuja a su estrategia de chips personalizada a través de las CPU de Graviton4 y los aceleradores de la Serie de Entrenium. Los chips personalizados están diseñados para maximizar los márgenes de ganancias en las cargas de trabajo de IA mediante la reducción de los costos de transferencia de datos en entornos en la nube.
AWS anunció una actualización de su chip Graviton4 que incluye 600 gigabits por segundo de ancho de banda de red, que la compañía llama la mayor oferta en la nube pública. Ali Saidi, un ingeniero de AWS, comparó la velocidad con una lectura de 100 CD de música a máquina por segundo. La CPU de Graviton4 es uno de los muchos productos de chips de Amazon Annapurna Labs en Austin, Texas, y es una victoria para la estrategia personalizada de la compañía, lo que lo pone frente a jugadores tradicionales como Intel y AMD.
Con la actualización de Graviton4 en el horizonte y los chips de entrenamiento de Project Rainier, Amazon demostró su ambición de controlar toda la pila de infraestructura de IA, desde las redes hasta el entrenamiento hasta la inferencia. A medida que más modelos de IA principales como Claude 4 demostraron que podían entrenar con éxito en hardware no nvidia, la pregunta no era si AWS podía competir con el gigante de los chips, sino cuánta participación de mercado podría tomar.
El Director Senior de AWS para Ingeniería de Clientes y Productos, Gadi Hutt, dijo que Amazon quería reducir los costos de capacitación de IA y proporcionar alternativas a las costosas unidades de procesamiento de gráficos (GPU) de NVIDIA Según AWS, el modelo Claude Opus 4 AI de Anthrope se lanzó en GPU de Trainium2, y Project Rainier funciona con más de 500k chips, un orden que generalmente habría ido a Nvidia.
Hutt dijo que si bien el Blackwell de Nvidia era un chip de mayor rendimiento que Trainium2, el chip AWS ofreció un mejor rendimiento de costos. También señaló que Trainium3 se acercaba este año, y estaba duplicando el rendimiento de Entrenium2, y ahorraría energía en un 50%adicional. Rami Sinno, director de ingeniería de Annapurna Labs de AWS, dijo que la demanda de estos chips ya estaba superando a la oferta.
"Nuestro suministro es muy, muy grande, pero cada servicio que construimos tiene un cliente adjunto".
- Rami Sinno , Director de Ingeniería en Annapurna Labs de AWS
El equipo de AWS enfatizó que, si bien la compañía reconoció brechas específicas, prefería trabajar con nuevas empresas más pequeñas e innovadoras como antrópico, IA de escala y violinista en lugar de confiar en grandes proveedores. Amazon a menudo apoya a estas empresas a través de inversiones estratégicas, formando relaciones mutuamente beneficiosas a cambio de proporcionar capital o infraestructura, como en el caso de antrópico. AWS anunció el Proyecto Rainier, una supercomputadora de IA construida para la startup antrópica, en la conferencia Invent 2024 en diciembre pasado y, según los informes, puso $ 8B en antiprópico de respaldo.
El equipo de Amazon reveló que los chips de Graviton4 y Entrenium3 actualizados establecidos para finales de 2025 prometieron un salto de rendimiento 4x y un 40% mejor eficiencia energética, comprimiendo aún más los márgenes de Nvidia. Agregó que esto no fue solo una victoria para el crecimiento de la línea de AWS, sino un asalto directo a la prima de GPU de NVIDIA.
Rahul Kulkarni, director de gestión de productos de Amazon para Compute and AI, dijo que el Graviton4 actualizado prometió entregar tres veces la potencia y la memoria de cómputo de su predecesor, un 75% más de ancho de banda de memoria y un rendimiento 30% mejor mejor. Agregó que colectivamente, se esperaba que ofreciera más rendimiento de los precios, lo que significa que los usuarios obtuvieron mucho más rendimiento por cada dólar gastado.
Patrick Moorhead, CEO y analista jefe de Moor Insights & Strategy, dijo que todas las compañías de IA estaban gastando mucho dinero en desarrollar chips, y agregó que tenían presupuestos gigantes de I + D a pesar de no revelar las cifras exactas de cuánto se estaba invertiendo. Moorhead, quien pasó más de una década como vicepresidente dent AMD , agregó que Nvidia aún seguía siendo un jugador dominante en el mercado de chips de IA. Sin embargo, había suficiente demanda para apoyar a múltiples competidores, incluido AWS.
Academia Cryptopolitan: Próximamente, una nueva forma de obtener ingresos pasivos con DeFi en 2025. Obtenga más información