新研究發現,人工智能公司依賴優質出版商提供訓練數據

來源 Cryptopolitan

在研究中,Ziff Davis 的 AI 律師 George Wukoson 和首席技術官 Joey Fortuna 聲稱,AI 公司根據搜索引擎排名較高的權威網站的排名來選擇訓練數據。選擇高質量和受歡迎的網站來改進模型,因爲它們具有良好的聲譽。根據該研究,該策略使人工智能開發人員能夠微調語言模型。

Ziff Davis 指出,Axel Springer、Future PLC、Hearst、新聞集團和紐約時報等頂級內容提供商爲訓練數據集的開發做出了貢獻。特別是,已dent用於創建 OpenAI 的 GPT-3 的 OpenWebText2 的 12.04% 來自這些受信任的發佈者。

馬克·扎克伯格還對圍繞人工智能培訓內容使用正在進行的爭論發表了看法。在最近接受 The Verge 採訪時,扎克伯格承認人工智能的數據抓取具有挑戰性,但也指出個人創作者或出版商的內容可能沒有那麼有影響力。他表示,“我認爲個人創作者或出版商往往會高估其特定內容在這個宏偉計劃中的價值。”

出版商對人工智能公司提起訴訟

培訓數據源的保密引起了出版商和消費者的擔憂。 《紐約時報》和《華爾街日報》最近對人工智能公司提起訴訟,稱它們使用其內容違反了版權法。

儘管 OpenAI 已努力從《金融時報》和 DotDash Meredith 等媒體組織獲得內容許可,但仍有幾家人工智能公司在沒有適當許可的情況下開展業務。該報告進一步指出, “主要的法學碩士開發人員不再像以前那樣披露他們的培訓數據。”

儘管人工智能公司的價值不斷上升,但科技巨頭與傳統媒體公司之間的差距仍然巨大。谷歌和 Meta 等科技巨頭的估值分別爲 2.2 萬億美元和 1.5 萬億美元,仍然處於生成人工智能領域的前沿,而 OpenAI 和 Anthropic 等初創公司的估值分別爲 1570 億美元和 400 億美元。

另一方面,出版商仍在應對裁員和重組,這證明了適應人工智能日益defi的環境所面臨的財務壓力。由於與用戶生成和基於人工智能的內容的競爭,許多出版商面臨着降低成本和人員方面的挑戰。

免責聲明:僅供參考。 過去的表現並不預示未來的結果。
placeholder
萊特幣(LTC)上漲還是下跌?減半倒計時14天Litecoin重回100美元大關,LTC才能出現新的上漲行情!
作者  Block Tao
2023 年 11 月 01 日
Litecoin重回100美元大關,LTC才能出現新的上漲行情!
placeholder
零擼Depin熱門項目grass,有網就能挖Grass 是一個去中心化激勵性網路抓取網絡,它允許用戶透過出售未使用的網路資源來透過網路連線獲利。
作者  區塊鏈思維
2024 年 1 月 09 日
Grass 是一個去中心化激勵性網路抓取網絡,它允許用戶透過出售未使用的網路資源來透過網路連線獲利。
placeholder
搭上AI與散熱快車!漢磊成SiC概念新龍頭,暴漲背後是機會還是風險?漢磊宣布其碳化矽(SiC)第四代MOSFET製程平台(G4)實現突破。該公司總經理劉燦文表示,該技術不僅在晶片尺寸上縮小了20%,導通電阻也降低了20%,已達到「國際大廠水準」。
作者  投資-槓把子
2025 年 9 月 08 日
漢磊宣布其碳化矽(SiC)第四代MOSFET製程平台(G4)實現突破。該公司總經理劉燦文表示,該技術不僅在晶片尺寸上縮小了20%,導通電阻也降低了20%,已達到「國際大廠水準」。
placeholder
聯發科(2454)創三個月新高,外資帶動短期多頭氣氛濃聯發科(2454)今(9)日盤中強勢大漲5.59%,股價一舉衝上1510元,創近三個月新高。主要催化劑來自三星正式宣布,將於新一代旗艦平板 Galaxy Tab S11 系列中採用聯發科最新3奈米製程的「天璣9400+」處理器,此消息再度點燃市場對AI應用題材的熱情,吸引資金積極卡位。
作者  財富進化論
2025 年 9 月 09 日
聯發科(2454)今(9)日盤中強勢大漲5.59%,股價一舉衝上1510元,創近三個月新高。主要催化劑來自三星正式宣布,將於新一代旗艦平板 Galaxy Tab S11 系列中採用聯發科最新3奈米製程的「天璣9400+」處理器,此消息再度點燃市場對AI應用題材的熱情,吸引資金積極卡位。
placeholder
黃金價格失守4000美元,是否已經到底?分析師這樣說黃金短期風險偏向下行,關注去年10月低點3885美元附近支撐位。
作者  Alison Ho
6 月 25 日 週四
黃金短期風險偏向下行,關注去年10月低點3885美元附近支撐位。
goTop
quote