Las empresas de inteligencia artificial dependen de editores premium para obtener datos de capacitación, según una nueva investigación

Fuente Cryptopolitan

En la investigación, el abogado de inteligencia artificial de Ziff Davis, George Wukoson, y el director de tecnología, Joey Fortuna, afirmaron que las empresas de inteligencia artificial eligen los datos de capacitación en función de la clasificación de sitios web autorizados con altas clasificaciones en los motores de búsqueda. Se eligieron sitios web populares y de alta calidad para mejorar los modelos, ya que tienen buena reputación. Una estrategia que, según el estudio, permite a los desarrolladores de IA afinar el modelo del lenguaje.

Ziff Davis ha señalado que proveedores de contenidos de primer nivel como Axel Springer, Future PLC, Hearst, News Corp y The New York Times, entre otros, han contribuido al desarrollo de conjuntos de datos de entrenamiento. En particular, se ha dent que el 12,04% de OpenWebText2, que se utilizó para la creación de GPT-3 de OpenAI, provino de estos editores de confianza.

Mark Zuckerberg también intervino en el debate en curso sobre el uso de contenidos en la formación de IA. En una entrevista reciente con The Verge, Zuckerberg reconoció que la extracción de datos para la IA es un desafío, pero también señaló que el contenido de los creadores o editores individuales podría no tener tanto impacto. Dijo : "Creo que los creadores o editores individuales tienden a sobreestimar el valor de su contenido específico en el gran esquema de esto".

Los editores presentan demandas contra las empresas de inteligencia artificial

El secreto en torno a las fuentes de datos de capacitación ha generado preocupación tanto entre los editores como entre los consumidores. El New York Times y el Wall Street Journal presentaron recientemente demandas contra empresas de inteligencia artificial, alegando que habían violado las leyes de derechos de autor al utilizar su contenido.

Si bien OpenAI ha avanzado en sus esfuerzos para obtener licencias de contenido de organizaciones de medios como Financial Times y DotDash Meredith, varias empresas de IA todavía trabajan sin las licencias adecuadas. El informe afirma además que "los principales desarrolladores de LLM ya no divulgan sus datos de capacitación como lo hacían antes".

Si bien los valores de las empresas de IA aumentan, la brecha entre los titanes de la tecnología y las empresas de medios convencionales sigue siendo enorme. Gigantes tecnológicos como Google y Meta, que tienen un valor estimado de 2,2 billones de dólares y 1,5 billones de dólares, respectivamente, siguen a la vanguardia de la IA generativa, mientras que empresas emergentes como OpenAI y Anthropic están valoradas en 157 mil millones de dólares y 40 mil millones de dólares respectivamente.

Por otro lado, los editores todavía se enfrentan a despidos y reestructuraciones, lo que demuestra la presión financiera que supone adaptarse a un entorno cada vez más defi por la IA. Como resultado de la competencia con el contenido generado por los usuarios y basado en IA, numerosos editores enfrentan desafíos en términos de reducción de costos y personal.

Descargo de responsabilidad: Sólo con fines informativos. Rentabilidades pasadas no son indicativas de resultados futuros.
placeholder
EUR/USD retrocede desde los máximos con la inflación de la Eurozona en el focoEl EUR/USD cotiza con pérdidas moderadas, tras un fuerte rendimiento el día anterior.
Autor  FXStreet
03 de jun de 2025
El EUR/USD cotiza con pérdidas moderadas, tras un fuerte rendimiento el día anterior.
placeholder
El precio del cobre está a punto de superar los $6 por libra: ¿Hasta dónde puede llegar en 2026?Una demanda creciente, sumada a los problemas en la cadena de suministro, están disparando al cobre por encima de los $6. ¿Hasta dónde llegará en 2026?
Autor  Edgar Martin
1 Mes 28 Día Mier
Una demanda creciente, sumada a los problemas en la cadena de suministro, están disparando al cobre por encima de los $6. ¿Hasta dónde llegará en 2026?
placeholder
El WTI cae por debajo de 62.00$ en medio de las esperanzas de un acuerdo entre EE.UU. e IránEl West Texas Intermediate (WTI), el referente del petróleo crudo en EE.UU., se cotiza alrededor de 61.80$ durante las primeras horas de negociación en Europa el lunes. El precio del WTI cae un 5.65% por la relajación de las tensiones entre EE.UU. e Irán. Los operadores seguirán de cerca los desarrollos en torno a las negociaciones entre EE.UU. e Irán
Autor  FXStreet
2 Mes 02 Día Lun
El West Texas Intermediate (WTI), el referente del petróleo crudo en EE.UU., se cotiza alrededor de 61.80$ durante las primeras horas de negociación en Europa el lunes. El precio del WTI cae un 5.65% por la relajación de las tensiones entre EE.UU. e Irán. Los operadores seguirán de cerca los desarrollos en torno a las negociaciones entre EE.UU. e Irán
placeholder
WTI cae por debajo de los 102.00$ después de que Trump dice que canceló ataques a IránWest Texas Intermediate (WTI), el referente del crudo estadounidense, cotiza alrededor de 101.85$ durante las primeras horas de negociación asiáticas del martes. El precio del WTI cae después de que el presidente de EE.UU., Donald Trump, dijera que estaba posponiendo un ataque militar a Irán planeado para el martes a petición de los estados del Golfo.
Autor  FXStreet
El dia de ayer 01: 43
West Texas Intermediate (WTI), el referente del crudo estadounidense, cotiza alrededor de 101.85$ durante las primeras horas de negociación asiáticas del martes. El precio del WTI cae después de que el presidente de EE.UU., Donald Trump, dijera que estaba posponiendo un ataque militar a Irán planeado para el martes a petición de los estados del Golfo.
placeholder
El petróleo crudo WTI recupera la prima de Ormuz que Trump intentó cancelarEl mercado del petróleo crudo pasó el martes dando una lección a los redactores de titulares
Autor  FXStreet
1 hace una hora
El mercado del petróleo crudo pasó el martes dando una lección a los redactores de titulares
goTop
quote