Meta está avanzando más hacia los chips de IA personalizados a medida que la lucha para reducir la dependencia de Nvidia se vuelve más seria en las grandes tecnológicas.
La compañía dijo que comenzó el Meta Training and Inference Accelerator, o MTIA, en 2023, y ahora está preparando cuatro nuevas generaciones de chips durante los próximos dos años.
Según Meta, estos chips supuestamente se están construyendo para trabajos de clasificación, recomendaciones y GenAI en todos los productos de Meta.
La compañía también afirmó que no apuesta por un solo proveedor ni por un solo hardware. Meta planea seguir comprando silicio de diversas empresas del sector, manteniendo a MTIA como eje central de su propio plan de infraestructura de IA.
En palabras de la empresa, está adoptando un enfoque de cartera a medida que sus cargas de trabajo de IA crecen y cambian. Esto implica combinar chips externos con silicio interno en lugar de confiar todo el conjunto a un solo proveedor.
Meta dijo que ya utiliza cientos de miles de chips MTIA para trabajos de inferencia vinculados tanto al contenido orgánico como a los anuncios en sus aplicaciones.
Los chips están diseñados para las tareas propias de la empresa, no para uso general. Esto es importante porque Meta afirmó que el hardware forma parte de una solución integral personalizada, lo que le proporciona un sistema más optimizado para el trabajo diario.
La compañía dijo que la configuración ofrece una mejor eficiencia computacional para sus casos de uso específicos y reduce los costos en comparación con los chips para propósitos más amplios.
La siguiente fase consiste en una implementación más amplia. Meta afirmó estar desarrollando MTIA 300, 400, 450 y 500, y cada versión aportará mejoras en capacidad de procesamiento, ancho de banda de memoria y eficiencia. MTIA 300 ya está en producción y se encargará del entrenamiento de clasificación y recomendaciones.
MTIA 400, 450 y 500 pueden ejecutar todas las cargas de trabajo, pero Meta dijo que esos chips se utilizarán principalmente para la producción de inferencia GenAI en el corto plazo y hasta 2027.
La compañía también afirmó que el silicio es modular, lo que permite integrar nuevos chips en la infraestructura del sistema de rack existente. Esto reduce el tiempo de espera entre el diseño y la implementación.
Sobre la velocidad de lanzamiento, Meta dijo que la industria generalmente lanza un nuevo chip de IA cada uno o dos años, pero ahora tiene la capacidad de lanzar sus propios chips cada seis meses o menos reutilizando diseños modulares.
La compañía dijo que su estrategia MTIA se basa en tres partes: iteración rápida, un diseño de inferencia primero y fácil adopción a través de estándares comunes.
En el primer punto, Meta dijo que el ciclo de lanzamiento más corto le ayuda a adaptarse más rápido a medida que cambian las técnicas de IA, incorporan tecnología de hardware más nueva y reducen el costo de desarrollo e implementación de nuevas versiones de chips.
En cuanto al segundo punto, Meta trazó una línea divisoria entre su plan y el modelo de mercado habitual. La compañía afirmó que la mayoría de los chips convencionales se fabrican primero para grandes trabajos de preentrenamiento de GenAI y luego se utilizan para otras tareas, a menudo a un coste inferior.
Meta afirmó que está haciendo lo contrario. MTIA 450 y 500 se están optimizando primero para la inferencia GenAI, y luego se usarán para la clasificación, el entrenamiento e inferencia de recomendaciones, y el entrenamiento GenAI cuando sea necesario.
La compañía también afirmó que MTIA se basa desde el principio en herramientas y sistemas estándar, como PyTorch, vLLM, Triton y el Open Compute Project. Sus diseños de sistemas y racks también cumplen con los estándares OCP para su uso en centros de datos.
Meta agregó que ningún chip puede cubrir todas las demandas que tiene, por lo que planea implementar diferentes chips para diferentes cargas de trabajo mientras avanza hacia lo que llamó "superinteligencia personal para todos"
¿Quieres que tu proyecto esté presente en las mentes más brillantes del mundo de las criptomonedas? Preséntalo en nuestro próximo informe del sector, donde los datos se combinan con el impacto.