Las empresas de inteligencia artificial dependen de editores premium para obtener datos de capacitación, según una nueva investigación

Fuente Cryptopolitan

En la investigación, el abogado de inteligencia artificial de Ziff Davis, George Wukoson, y el director de tecnología, Joey Fortuna, afirmaron que las empresas de inteligencia artificial eligen los datos de capacitación en función de la clasificación de sitios web autorizados con altas clasificaciones en los motores de búsqueda. Se eligieron sitios web populares y de alta calidad para mejorar los modelos, ya que tienen buena reputación. Una estrategia que, según el estudio, permite a los desarrolladores de IA afinar el modelo del lenguaje.

Ziff Davis ha señalado que proveedores de contenidos de primer nivel como Axel Springer, Future PLC, Hearst, News Corp y The New York Times, entre otros, han contribuido al desarrollo de conjuntos de datos de entrenamiento. En particular, se ha dent que el 12,04% de OpenWebText2, que se utilizó para la creación de GPT-3 de OpenAI, provino de estos editores de confianza.

Mark Zuckerberg también intervino en el debate en curso sobre el uso de contenidos en la formación de IA. En una entrevista reciente con The Verge, Zuckerberg reconoció que la extracción de datos para la IA es un desafío, pero también señaló que el contenido de los creadores o editores individuales podría no tener tanto impacto. Dijo : "Creo que los creadores o editores individuales tienden a sobreestimar el valor de su contenido específico en el gran esquema de esto".

Los editores presentan demandas contra las empresas de inteligencia artificial

El secreto en torno a las fuentes de datos de capacitación ha generado preocupación tanto entre los editores como entre los consumidores. El New York Times y el Wall Street Journal presentaron recientemente demandas contra empresas de inteligencia artificial, alegando que habían violado las leyes de derechos de autor al utilizar su contenido.

Si bien OpenAI ha avanzado en sus esfuerzos para obtener licencias de contenido de organizaciones de medios como Financial Times y DotDash Meredith, varias empresas de IA todavía trabajan sin las licencias adecuadas. El informe afirma además que "los principales desarrolladores de LLM ya no divulgan sus datos de capacitación como lo hacían antes".

Si bien los valores de las empresas de IA aumentan, la brecha entre los titanes de la tecnología y las empresas de medios convencionales sigue siendo enorme. Gigantes tecnológicos como Google y Meta, que tienen un valor estimado de 2,2 billones de dólares y 1,5 billones de dólares, respectivamente, siguen a la vanguardia de la IA generativa, mientras que empresas emergentes como OpenAI y Anthropic están valoradas en 157 mil millones de dólares y 40 mil millones de dólares respectivamente.

Por otro lado, los editores todavía se enfrentan a despidos y reestructuraciones, lo que demuestra la presión financiera que supone adaptarse a un entorno cada vez más defi por la IA. Como resultado de la competencia con el contenido generado por los usuarios y basado en IA, numerosos editores enfrentan desafíos en términos de reducción de costos y personal.

Descargo de responsabilidad: Sólo con fines informativos. Rentabilidades pasadas no son indicativas de resultados futuros.
placeholder
Altcoins a vigilar esta semana: Cronos y Toncoin en riesgo de un desplome de dos dígitos a medida que surgen señales bajistasLas altcoins Cronos (CRO) y Toncoin (TON) están mostrando signos de debilidad esta semana, ya que ambos activos digitales cierran por debajo de líneas de tendencia ascendentes clave, señalando un posible cambio en la estructura del mercado.
Autor  FXStreet
17 de jun de 2025
Las altcoins Cronos (CRO) y Toncoin (TON) están mostrando signos de debilidad esta semana, ya que ambos activos digitales cierran por debajo de líneas de tendencia ascendentes clave, señalando un posible cambio en la estructura del mercado.
placeholder
El precio del cobre está a punto de superar los $6 por libra: ¿Hasta dónde puede llegar en 2026?Una demanda creciente, sumada a los problemas en la cadena de suministro, están disparando al cobre por encima de los $6. ¿Hasta dónde llegará en 2026?
Autor  Edgar Martin
1 Mes 28 Día Mier
Una demanda creciente, sumada a los problemas en la cadena de suministro, están disparando al cobre por encima de los $6. ¿Hasta dónde llegará en 2026?
placeholder
El petróleo crudo WTI se recupera (de nuevo) mientras Trump rechaza la propuesta de paz con IránLos datos de inventario de la EIA del miércoles pondrán a prueba cuán ajustado se ha vuelto el suministro de crudo de EE.UU. en medio del prolongado cierre de Ormuz.
Autor  FXStreet
5 Mes 13 Día Mier
Los datos de inventario de la EIA del miércoles pondrán a prueba cuán ajustado se ha vuelto el suministro de crudo de EE.UU. en medio del prolongado cierre de Ormuz.
placeholder
Pronóstico del Precio de Ethereum: La presión de venta al contado afecta al ETH, pero la compra en caídas podría proporcionar soporteEthereum (ETH) enfrenta una creciente presión de venta en el lado al contado tras señales de grietas en las conversaciones de paz entre Estados Unidos e Irán. Con los precios del petróleo subiendo rápidamente, la principal altcoin no ha logrado recuperar el nivel clave de 2.300$ el miércoles
Autor  FXStreet
5 Mes 14 Día Jue
Ethereum (ETH) enfrenta una creciente presión de venta en el lado al contado tras señales de grietas en las conversaciones de paz entre Estados Unidos e Irán. Con los precios del petróleo subiendo rápidamente, la principal altcoin no ha logrado recuperar el nivel clave de 2.300$ el miércoles
placeholder
Pronóstico del precio de Ethereum: la actividad de la red cae mientras los precios se mantienen estancadosEl precio de Ethereum (ETH) está intentando recuperarse por encima del nivel de 2.300$ el jueves, tras una semana de disminución en la actividad de la red.
Autor  FXStreet
5 Mes 15 Día Vie
El precio de Ethereum (ETH) está intentando recuperarse por encima del nivel de 2.300$ el jueves, tras una semana de disminución en la actividad de la red.
goTop
quote