新研究發現,人工智能公司依賴優質出版商提供訓練數據

來源 Cryptopolitan

在研究中,Ziff Davis 的 AI 律師 George Wukoson 和首席技術官 Joey Fortuna 聲稱,AI 公司根據搜索引擎排名較高的權威網站的排名來選擇訓練數據。選擇高質量和受歡迎的網站來改進模型,因爲它們具有良好的聲譽。根據該研究,該策略使人工智能開發人員能夠微調語言模型。

Ziff Davis 指出,Axel Springer、Future PLC、Hearst、新聞集團和紐約時報等頂級內容提供商爲訓練數據集的開發做出了貢獻。特別是,已dent用於創建 OpenAI 的 GPT-3 的 OpenWebText2 的 12.04% 來自這些受信任的發佈者。

馬克·扎克伯格還對圍繞人工智能培訓內容使用正在進行的爭論發表了看法。在最近接受 The Verge 採訪時,扎克伯格承認人工智能的數據抓取具有挑戰性,但也指出個人創作者或出版商的內容可能沒有那麼有影響力。他表示,“我認爲個人創作者或出版商往往會高估其特定內容在這個宏偉計劃中的價值。”

出版商對人工智能公司提起訴訟

培訓數據源的保密引起了出版商和消費者的擔憂。 《紐約時報》和《華爾街日報》最近對人工智能公司提起訴訟,稱它們使用其內容違反了版權法。

儘管 OpenAI 已努力從《金融時報》和 DotDash Meredith 等媒體組織獲得內容許可,但仍有幾家人工智能公司在沒有適當許可的情況下開展業務。該報告進一步指出, “主要的法學碩士開發人員不再像以前那樣披露他們的培訓數據。”

儘管人工智能公司的價值不斷上升,但科技巨頭與傳統媒體公司之間的差距仍然巨大。谷歌和 Meta 等科技巨頭的估值分別爲 2.2 萬億美元和 1.5 萬億美元,仍然處於生成人工智能領域的前沿,而 OpenAI 和 Anthropic 等初創公司的估值分別爲 1570 億美元和 400 億美元。

另一方面,出版商仍在應對裁員和重組,這證明了適應人工智能日益defi的環境所面臨的財務壓力。由於與用戶生成和基於人工智能的內容的競爭,許多出版商面臨着降低成本和人員方面的挑戰。

免責聲明:僅供參考。 過去的表現並不預示未來的結果。
placeholder
日本央行4月升息機率驟減!日幣匯率再逼近160,政府干預在即?隔夜指數掉期顯示,目前市場預期日本央行在4月升息的機率不到20%,而本周初這一機率約為50%。
作者  Alison Ho
4 月 17 日 週五
隔夜指數掉期顯示,目前市場預期日本央行在4月升息的機率不到20%,而本周初這一機率約為50%。
placeholder
沃什聽證會來襲!新任聯準會主席能否成功上任? 2026能否降息?如果聽證會表現良好,沃什很可能接替鮑爾,在5月正式出任聯準會主席。
作者  Alison Ho
22 小時前
如果聽證會表現良好,沃什很可能接替鮑爾,在5月正式出任聯準會主席。
placeholder
黃金長線看漲邏輯堅實,短線警惕回檔風險目前黃金現顯示跌破4800美元整數關卡的跡象,進一步下跌關注支撐20日均線(約4770)以及4700美元關卡。
作者  Mitrade
19 小時前
目前黃金現顯示跌破4800美元整數關卡的跡象,進一步下跌關注支撐20日均線(約4770)以及4700美元關卡。
placeholder
WTI原油走勢:談判或延期?這一情況下油價將衝擊110美元伊朗或考慮到若其表現出急於談判的姿態,美國很可能會進一步施壓。因此筆者預計美伊第二輪談判或延期,甚至再度陷入有限規模衝突,這為WTI原油短期企穩85.0美元並進一步反彈提供支撐。
作者  Insights
19 小時前
伊朗或考慮到若其表現出急於談判的姿態,美國很可能會進一步施壓。因此筆者預計美伊第二輪談判或延期,甚至再度陷入有限規模衝突,這為WTI原油短期企穩85.0美元並進一步反彈提供支撐。
placeholder
特斯拉2026年Q1財報來襲! AI能否助力股價反彈?400美元關口迎挑戰!4月22日美股盤後,特斯拉(TSLA)將公佈2026年第一季財報。
作者  Alison Ho
17 小時前
4月22日美股盤後,特斯拉(TSLA)將公佈2026年第一季財報。
goTop
quote