A OpenAI terá que entregar 20 milhões de registros de conversas anonimizadas do ChatGPT em uma disputa de direitos autorais com o The New York Times ( NYT) e outros. Os registros de bate-papo são uma peça fundamental de evidência na investigação sobre se o ChatGPT está reproduzindo conteúdo jornalístico protegido por direitos autorais sem autorização, de acordo com a juíza federal Ona Wang.
A ordem judicial tem origem em um pedido de descoberta de provas apresentado no âmbito do processo em que o NYT e outras organizações de mídia alegam que o ChatGPT – e, por extensão, os grandes modelos de linguagem subjacentes da OpenAI – usaram indevidamente seu conteúdo protegido por direitos autorais em treinamentos, produzindo resultados que replicam ou resumem reportagens pagas. Os autores da ação afirmam que o acesso aos registros de bate-papo dos usuários revelará se e com que frequência o ChatGPT regenera trechos integrais ou parciais de seus artigos protegidos por direitos autorais.
A juíza Wang rejeitou as objeções da OpenAI relativas à privacidade, observando que a empresa é obrigada a remover nomes, endereços de e-mail, números de telefone e quaisquer outros dadosdentantes de entregar os registros. Ela acrescentou que, além dessadent, o tribunal já implementou “múltiplas camadas de proteção” para salvaguardar as informações do usuário.
A OpenAI foi obrigada a publicar o conteúdo sete dias após a conclusão da anonimização. A empresa já havia alertado que o cumprimento da ordem poderia criar umdentpreocupante, observando que a grande maioria das conversas não tem relação com o processo judicial.
O New York Times e outros jornais pertencentes ao MediaNews Group alegam que os registros comprovarão que a OpenAI coletou e utilizou seu conteúdo jornalístico sem permissão.
Eles alegam que o ChatGPT gerou vários parágrafos que se assemelham muito ou reproduzem suas narrativas quase que palavra por palavra. Frank Pine, editor executivo do MediaNews Group, criticou duramente a empresa de IA. Ele disse que a OpenAI estava delirando ao pensar que poderia se safar ocultando evidências de como seu modelo de negócios se baseia em roubar o trabalho de jornalistas dedicados . Os veículos de comunicação também negaram a alegação da OpenAI de que teria manipulado a IA para infringir direitos autorais.
Os registros, segundo eles, servirão como prova de que o chatbot já era capaz de criar conteúdo protegido por direitos autorais antes mesmo de qualquer intervenção do usuário. O caso não visa restringir a inovação em IA, afirmou o The New York Times, mas sim garantir remuneração e justiça ao jornalismo. A OpenAI recorreu da decisão do juiz Wang ao juiz distrital Sidney Stein, que supervisiona o caso.
A empresa argumenta que a privacidade do usuário não deve ser comprometida em juízo e que qualquer divulgação desses registros, mesmo que anonimizados, pode corroer a confiança na empresa. Dane Stuckey, diretor de segurança da informação da empresa, já havia declarado que tais exigências de diversas organizações de mídia contradizem práticas de segurança de bom senso e desconsideram proteções de privacidade de longa data.
Os críticos argumentam que a resistência da OpenAI sugere que ela tem algo a esconder. Quando os sistemas de IA dependem de conteúdo disponível publicamente, como jornalismo, para aprender e aprimorar seu conteúdo, a transparência é necessária, afirmam.
O processo por violação de direitos autorais é um entre vários movidos contra gigantes da tecnologia como a Microsoft e a Meta. Em conjunto, os casos levantam questões importantes sobre como as organizações que utilizam IA coletam, compartilham e monetizam informações, bem como a quem, em que medida e quando solicitar compensação.
Isso coloca a OpenAI em uma situação delicada, tendo que equilibrar a privacidade do usuário com acusações de violação massiva de direitos autorais. Também levanta questões mais amplas sobre como essas interfaces de usuário com IA se alinham com as leis existentes, as proteções de propriedade intelectual e a confiança social.
Se os registros indicarem que o ChatGPT estava copiando conteúdo jornalístico protegido por direitos autorais sem permissão, isso teria enormes implicações. Não apenas para a OpenAI, mas também para o futuro do treinamento de IA, a sustentabilidade da mídia e os direitos digitais.
Por ora, a decisão sinaliza que os tribunais estão dispostos a equilibrar a inovação em IA com as proteções tradicionais da propriedade intelectual — mesmo que isso complique as noções de privacidade na era digital.
Ganhe até US$ 30.050 em recompensas comerciais ao se inscrever na Bybit hoje