QWEN3 de Alibaba desatora el R1 de Deepseek, ahora lidera modelos de IA de código abierto

Fuente Cryptopolitan

La nueva familia QWEN3 de AI de Alibaba ha superado a Deepseek's R1 para convertirse en el mejor modelo de código abierto del mundo. Según los informes, QWEN3 fue mejor que R1 en las pruebas que miden las habilidades de los modelos de IA de código abierto en áreas como la instrucción del idioma, las matemáticas, la codificación y el análisis de datos. 

La familia Qwen3 fue lanzada la semana pasada por la unidad de computación en la nube de Alibaba. Tiene ocho modelos mejorados con entre 600 millones y 235 mil millones de parámetros. En el aprendizaje automático, los parámetros son las variables en un sistema de IA mientras se está entrenando.

Según LiveBench , una dent que prueba modelos de idiomas grandes, antes de estas nuevas pruebas, R1 de Deepseek había sido el mejor modelo de IA de código abierto en el mundo desde que salió en enero. Pero ya no.

Las empresas estadounidenses y chinas se apresuran a adoptar Qwen 3

El surgimiento de Qwen3 en el ranking de LiveBench muestra qué tan rápido se está desarrollando AI en China. La industria tecnológica china ha crecido mucho gracias a las herramientas de código abierto. El código de método de código abierto de Alibaba ha permitido que otros desarrolladores de software de terceros compartan el diseño, arreglen los enlaces rotos o hagan que el programa sea más potente. 

Sin embargo, los resultados generales de LiveBench mostraron que QWEN3 no era tan bueno como el O3 de OpenAi, Gemini Pro 2.5 de Google y Claude 3.7 de Anthrope, que son los mejores modelos de IA de código cerrado del mundo. LiveBench dice que el O3-Mini High, el modelo de IA más popular de Operai, fue el mejor del mundo en general. Microsoft respalda OpenAi.

Por cada 1 millón de tokens, se necesitan $ 10 para ejecutar O3. Por otro lado, QWEN3 es más barato de usar porque solo cuesta $ 0.55 por 1 millón de tokens para funcionar. Debido a que Qwen3 es más barato y funciona mejor, muchas empresas dijeron que respaldarían el nuevo modelo de IA de Alibaba tan pronto como salió.

Huawei Technologies, Moore Threads, Cambricon Technologies y Hygon Information Technology son compañías de chips que han dicho que apoyarán QWEN3.

Cambricon dijo el martes pasado que había optimizado con éxito QWEN3 para funcionar rápidamente en sus unidades de procesamiento de gráficos. Esto se hizo porque los desarrolladores de IA en Filipinas querían chips hechos en China.

QWEN3 también se está utilizando en los servicios de computación en la nube de hiperbólicos y fuegos artificiales. AI, dos compañías de infraestructura de IA. Los fabricantes de chips estadounidenses Nvidia e Intel han comenzado a apoyar QWEN3.

Muchos centros de big data en China, como los de Beijing, Shanghai, Hangzhou y las provincias de Hubei, Jilin y Northwest Shaanxi, también han dicho que utilizarán los modelos Qwen AI de tercera generación de Alibaba. La red de supercomputación en China también ha adoptado QWEN3. Esta red vincula más de 20 centros de datos en 20 ciudades en 14 provincias.

El CEO de Anthrope dice que Deepseek fue "un poco exagerado"

En un evento comercial, un cofundador de Anthrope, la compañía que realizó los modelos Claude AI, dijo que Deepseek todavía está "seis a ocho meses detrás de donde están las empresas fronterizas estadounidenses". También dijo que el reciente rumor alrededor de la nueva empresa china fue "quizás un poco exagerada".

Deepseek llamó la atención en todo el mundo a fines de diciembre de 2024 y principios de enero de 2025 al compartir dos modelos AI avanzados de IA, V3 y R1. Estos modelos se hicieron para una pequeña fracción del costo y el poder informático que las grandes compañías tecnológicas generalmente necesitan para proyectos LLM.

No está claro cuándo Deepseek lanzará la próxima generación de sus modelos. La compañía con sede en Hangzhou lanzó silenciosamente su Prover-V2 de 671 mil millones de parámetros a fines de abril . Esta fue una actualización de su modelo especializado para manejar pruebas matemáticas. Sin embargo, no ha dicho nada sobre el progreso de su tan esperado modelo de razonamiento R2.

Academia Cryptopolitan: Próximamente, una nueva forma de obtener ingresos pasivos con DeFi en 2025. Obtenga más información

Descargo de responsabilidad: Sólo con fines informativos. Rentabilidades pasadas no son indicativas de resultados futuros.
placeholder
El Peso mexicano cae antes de la decisión de la Fed, con los datos de inflación en el punto de miraEl Peso mexicano (MXN) comenzó la semana con pérdidas de alrededor del 0.58% frente al Dólar estadounidense (USD) antes de una semana crucial, con la Reserva Federal (Fed) preparándose para llevar a cabo su reunión de política monetaria el 7 de mayo y el anuncio de las cifras de inflación de México.
Autor  FXStreet
19 hace una horas
El Peso mexicano (MXN) comenzó la semana con pérdidas de alrededor del 0.58% frente al Dólar estadounidense (USD) antes de una semana crucial, con la Reserva Federal (Fed) preparándose para llevar a cabo su reunión de política monetaria el 7 de mayo y el anuncio de las cifras de inflación de México.
placeholder
El precio del Oro salta a su máximo de dos semanas mientras los riesgos geopolíticos sustentan a los activos de refugio seguroEl precio del Oro (XAU/USD) atrae a algunos compradores de continuación por segundo día consecutivo y salta a un máximo de casi dos semanas, alrededor del área de 3.381-3.382$ durante la sesión asiática del martes.
Autor  FXStreet
19 hace una horas
El precio del Oro (XAU/USD) atrae a algunos compradores de continuación por segundo día consecutivo y salta a un máximo de casi dos semanas, alrededor del área de 3.381-3.382$ durante la sesión asiática del martes.
placeholder
El Banco Central de Chile mantiene su tasa de interés en el 5% por tercera reunión consecutiva, en línea con lo esperadoEl Banco Central de Chile ha anunciado a última hora del martes que mantiene sus tasas de interés sin cambios en el 5% por tercera reunión consecutiva, tal como se esperaba. La decisión ha sido tomada por unanimidad.
Autor  FXStreet
4 Mes 30 Día Mier
El Banco Central de Chile ha anunciado a última hora del martes que mantiene sus tasas de interés sin cambios en el 5% por tercera reunión consecutiva, tal como se esperaba. La decisión ha sido tomada por unanimidad.
placeholder
El Peso mexicano se fortalece a medida que datos estadounidenses más suaves impulsan el apetito por el riesgoEl Peso mexicano (MXN) se apreció frente al Dólar estadounidense (USD) tras tocar un mínimo diario de 19.65, ya que el apetito por el riesgo mejoró tras la publicación de datos más débiles de lo esperado. Al momento de escribir, el USD/MXN se cotiza en 19.56, con una caída del 0.12%.
Autor  FXStreet
4 Mes 30 Día Mier
El Peso mexicano (MXN) se apreció frente al Dólar estadounidense (USD) tras tocar un mínimo diario de 19.65, ya que el apetito por el riesgo mejoró tras la publicación de datos más débiles de lo esperado. Al momento de escribir, el USD/MXN se cotiza en 19.56, con una caída del 0.12%.
placeholder
El S&P 500 extiende sus ganancias y alcanza máximos de tres semanas y mediaEl S&P 500 marcó un mínimo del día en 5.466, encontrando compradores que impulsaron el índice a un máximo no visto desde el 3 de abril en 5.549.
Autor  FXStreet
4 Mes 29 Día Mar
El S&P 500 marcó un mínimo del día en 5.466, encontrando compradores que impulsaron el índice a un máximo no visto desde el 3 de abril en 5.549.
goTop
quote