El director ejecutivo de Coinbase ha propuesto experimentar con modelos de IA de ponderación abierta más económicos para controlar el gasto en IA a medida que aumenta el consumo de tokens.
Esta propuesta ha generado preocupación por los riesgos de seguridad y geopolíticos que supone dirigir las cargas de trabajo empresariales a través de sistemas de origen chino.
Los controles a las exportaciones estadounidenses han dificultado el acceso de las empresas chinas a los chips de IA estadounidenses, pero eso no les ha impedido desarrollar modelos competitivos y venderlos a precios mucho más bajos.
Por ejemplo, el GLM 5.2 de Zhipu cuesta 1,40 dólares por millón de tokens de entrada y 4,40 dólares por millón de tokens de salida, en comparación con el Opus 4.8 de Anthropic, que cuesta 5 y 25 dólares respectivamente para el mismo volumen.
GLM 5.2 obtuvo una puntuación de 62,1 en SWE-bench Pro, una prueba de rendimiento clave para la codificación, superando a GPT-5.5 de OpenAI, que obtuvo 58,6. Un investigador de IA afirmó que GLM 5.2 "es al menos tan bueno como Opus 4.8 y GPT 5.5"
Otro lo calificó como "el primer modelo abierto que realmente puede competir con los sistemas de código cerrado"
de Coinbase, Brian Armstrongtronafirma que la mejor manera de controlar el aumento de los costes de la IA es utilizar modelos de ponderación abierta más económicos, incluidos sistemas de China como GLM 5.2.
tronafirmó que, en lugar de invertir cada vez más en IA, las empresas necesitan "mejores configuraciones predeterminadas, enrutamiento y almacenamiento en caché". Su sugerencia de utilizar modelos chinos, incluso si son más baratos, ha generado preocupación por los riesgos políticos y de seguridad.
Además de su precio asequible, GLM 5.2 utiliza una licencia MIT, lo que significa que las empresas pueden descargarlo, modificarlo y ejecutarlo en sus propios servidores, eliminando cualquier riesgo de enviar datos confidenciales de la empresa a una API externa.
El gasto en inteligencia artificial se ha convertido en un problema real, lo que ha provocado que las empresas reduzcan el uso de esta tecnología en sus operaciones.
Cryptopolitan informó recientemente que Uber agotó su presupuesto de codificación de IA para 2026 en abril y ahora limita el gasto de sus ingenieros a 1500 dólares por herramienta al mes. Meta envió un memorando advirtiendo sobre un "aumento exponencial" en el uso de la IA y comenzó a implementar controles de gasto. Amazon eliminó una clasificación interna que ordenaba a los empleados según su consumo de IA porque se estaba abusando de ella y aumentando los costos.
Una encuesta de KPMG reveló que solo el 26 % de las empresas tienen total visibilidad de sus costos de IA, mientras que el 22 % descubre los gastos solo después de recibir la factura. Goldman Sachs proyecta que el consumo de tokens de IA podría multiplicarse por 24 para 2030, alcanzando los 120 billones de tokens mensuales.
La International Data Corporation predice que el 70% de las empresas líderes impulsadas por IA utilizarán múltiples modelos para 2028 en lugar de depender de un solo proveedor.
La API en la nube de Z.ai, que permite a desarrolladores y empresas utilizar sus modelos de IA (incluido GLM 5.2), está sujeta a la Ley Nacional de Inteligencia de China. Esto genera serias preocupaciones para cualquier empresa que maneje información sensible.
En mayo, los legisladores estadounidenses abrieron una investigación formal sobre los riesgos de ciberseguridad que suponen los modelos de IA de origen chino en infraestructuras críticas.
También existe preocupación por la posibilidad de que los modelos entrenados bajo diferentes sistemas legales presenten comportamientos no revelados. Además, un desarrollador de IA comparó GLM 5.2 con GPT-5.5 en una tarea de depuración y descubrió que su capacidad para detectar problemas era muy inferior a la del modelo de OpenAI, a pesar de los informes que indican que los modelos chinos superan a sus contrapartes más costosas.
Anthropic reveló en una carta abierta al Comité Bancario del Senado que los operadores de Alibaba Qwen realizaron 28,8 millones de transacciones en Claude a través de unas 25.000 cuentas falsas entre abril y junio. Lo calificaron como la mayor campaña conocida para robar las funcionalidades de un modelo.
El autoalojamiento de los pesos abiertos elimina el riesgo de enrutamiento de datos de la API, ya que las empresas que ejecutan el modelo en sus propios servidores no envían datos a China. Sin embargo, persiste la preocupación por los modelos en sí.
Si estás leyendo esto, ya llevas ventaja. Mantente al día con nuestro boletín informativo.