O cofundador da Wikipédia, Jimmy Wales, afirmou que a organização sem fins lucrativos por trás da enciclopédia online está buscando mais acordos de licenciamento com empresas de IA. Essa iniciativa surge em meio à sobrecarga causada por uma série de bots automatizados de IA na infraestrutura da Wikipédia.
Wales explicou que as empresas de IA utilizam o conhecimento disponível gratuitamente na plataforma para treinar grandes modelos de linguagem (LLMs). Ele observou que bots de IA de alto volume rastreiam todo o site, impondo encargos técnicos e financeiros significativos à plataforma.
“Os bots de IA… estão percorrendo todo o site… então precisamos de mais servidores, mais RAM e memória para armazenar isso em cache, e isso nos custa uma quantia desproporcional”, explicou ele.
Wales observou que o uso intenso por bots de IA força a Wikipédia a expandir seus servidores, aumentar a RAM e melhorar o cache, o que acarreta um custo elevado.
Embora o site seja gratuito para usuários individuais, ele observou que o acesso automatizado e em grande volume por empresas de IA com fins lucrativos é outra questão. A organização sem fins lucrativos firmou um acordo de licenciamento com o Google em 2022 e está negociando acordos semelhantes com outras empresas.
A organização sem fins lucrativos que administra a Wikipédia, a Fundação Wikimedia, depende de doações públicas relativamente pequenas e de editores voluntários para funcionar, e não foi concebida para financiar desenvolvimentos de IA em larga escala com fins lucrativos.
Wales afirmou que é injusto que colaboradores e doadores financiem os custos de empresas comerciais de IA que utilizam o conteúdo da Wikipédia.
A Wikipédia alerta para o fardo insustentável dos bots de IA. Essas demandas sobre os servidores da Wikipédia têm aumentado drasticamente nos últimos meses. Os bots automatizados aumentaram o tráfego — principalmente por meio de downloads de conteúdo multimídia — e fizeram com que a organização sem fins lucrativos precisasse investir pesadamente em infraestrutura.
Grande parte desse tráfego se origina de empresas de IA que coletam conteúdo projetado para treinar seus modelos, e não de humanos. Em 2022, a Fundação lançou um produto comercial pago, o Wikimedia Enterprise, para fornecer acesso ao seu conteúdo principal em larga escala e oferecer aos usuários da plataforma as ferramentas e os recursos necessários.
Este serviço foi concebido para aliviar a pressão sobre o site da Wikipédia, ao mesmo tempo que fornece aos desenvolvedores de IA os dados necessários para aprimorar seus modelos. Wales incentivou as empresas de IA a utilizarem essa opção paga em vez de coletarem dados do site público.
Caso as empresas não cumpram essas medidas técnicas, afirmou Wales, restrições de acesso de bots por meio de ferramentas como o AI Crawl Control poderão ser implementadas. Há um debate com as empresas sobre o papel da IA pública (ou comercial) na gestão de dados pessoais que os usuários agora detêm em uma escala que excede o direito legal à informação livre e transparente, e as necessidades dos setores público e privado.
Com uma parcela cada vez maior do processamento de IA dependendo fortemente de grandes conjuntos de dados públicos, a Wikipédia defende uma abordagem justa que compense tanto as entidades que mantêm esses dados quanto as empresas. A Wikipédia não abre mão de seu compromisso com a neutralidade.
O site Wikipedia está em funcionamento há mais de 20 anos como uma entidade sem fins lucrativos administrada pela Fundação Wikimedia. Seu modelo se baseia em um exército global de editores voluntários, que dedicam seu tempo à criação, edição e revisão de conteúdo.
As doações públicas são um ingrediente fundamental para garantir que a Wikipédia permaneça acessível a todos, em qualquer lugar, independentemente da quantia de dinheiro ou da localização geográfica. A Wikipédia, um conhecido site e enciclopédia internacional, também tem enfrentado dificuldades para se manter neutra em relação a outras fontes.
O problema torna-se ainda mais grave ao abordar em detalhe questões políticas de grande repercussão, movimentos sociais ou conflitos armados em todo o mundo. Wales afirmou que, embora a maioria dos editores da Wikipédia não sejam ativistas, as preferências pessoais podem influenciar a forma como os tópicos são abordados.
No entanto, ele acrescentou que confia na comunidade, afirmando que os editores tendem a, de alguma forma, alcançar os valores de imparcialidade e precisão da Wikipédia, mesmo sob intensa pressão. A neutralidade da plataforma é ainda maisdent em sua política da comunidade, métodos de revisão por pares e processo de resolução de disputas, entre outros aspectos.
Ao mesmo tempo, a dependência constante de voluntários e doações evidencia a fragilidade do sistema. E, à medida que a plataforma enfrenta novas pressões, incluindo o aumento do uso de seu conteúdo por empresas de IA, garantir que seus valores fundamentais (neutralidade, precisão e acesso livre) permaneçam inalterados torna-se cada vez mais importante.
Cadastre-se na Bybit agora e ganhe um bônus de US$ 50 em minutos