AI訓練語料被「榨乾」,OpenAI等巨頭的AI大道走向何方?

最熱文章
coverImg
來源: DepositPhotos

AI發展扶搖直上,快到當前全人類的庫存知識都難以跟上。為了應對AI模型所需訓練語料的匱乏,OpenAI、谷歌和Meta等巨頭不顧侵權和違規、耍花招來改進模型。


據《紐約時報》報道,早在2021年底,GPT-4的開發者OpenAI便面臨著訓練資源緊缺的問題。在開發最新的人工智慧係統時,人工智慧實驗室已經耗盡了網路上所有可靠的英文文本資源,而他們還需要更多資源。


研究機構Epoch表示,科技巨頭們的問題很緊急,它們使用資料的速度已經超過生產資料的速度,併最快會在2026年耗盡網路上所有高質量資料。


面對這一瓶頸,科技巨頭們開始想方設法來獲得訓練資源。OpenAI研發人員創建了一款名為Whisper的語音辨識工具,將流媒體Youtube影片中的音頻轉錄成新的對話文本,以使得他們的AI模型更加「人類化」。


但有三名知情人士表示,一些OpenAI員工是在「明知故犯」,這些員工已經討論過此舉可能會違反Youtube的規則。Youtube是谷歌旗下的,按規定不允許將網路上的影片用於獨立應用。


而據悉,OpenAI團隊迄今已轉錄了超100萬個小時的Youtube影片,且該公司總裁Greg Brockman親自參與了這一過程。這些由影片轉錄生成的文本被納入GPT-4的訓練係統中,成為了最新版本ChatGPT聊天機器人的基礎,推動其成為世界上最強大的AI模型。


無獨有偶,谷歌和Meta等科技巨頭也在紛紛「走捷徑」,甚至無視公司政策、網路規則和法律法規,來最大程度地獲取訓練資源。與OpenAI做法一樣,谷歌也轉錄自家流媒體平台Youtube視頻,但這本身仍可能侵犯了相關版權,因為這些影片是屬於創作者的。


對於OpenAI「偷」自家語料的做法,谷歌的態度略顯曖昧,一邊表示並不知情,一邊似乎默認容許這種行為,因為谷歌本身也在做這件事。知情人士稱,如果谷歌在OpenAI的問題上大驚小怪,公眾可能會對自己的做法提出強烈抗議,也就是說谷歌擔心自己「引火燒身」。


有趣的是,為了應對這一挑戰,谷歌隱私團隊還編寫了新條款,以便其可以利用這些網路資源來進行AI模型搭建和產品功能升級,如谷歌翻譯、Bard和雲端AI等。


據外媒報道的一份Meta內部會議記錄,該公司工程師和產品經理層討論過收購美國出版社Simon & Schuster以獲取長文本足療的計劃,也討論過從網路收集受版權保護的內容。他們認為,「與出版商、藝術家、音樂家和新聞業談授權問題所需的時間太多了。」


Meta高層表示,OpenAI似乎正在採用收版權保護的資料,而Meta可以遵循這一「市場先例」。


去年,超過10000個貿易團體、作者、公司和其他人是向美國版權局提交了有關人工智慧模型使用他們創意作品的意見,版權局正在準備就版權法如何在AI時代適用的指導意見。


電影製作人Justine Bateman表示,人工智慧模型在未經許可或付費的情況下獲取其內容,「這是美國最大的盜竊案。」


矽谷知名創投公司Andreessen Horowitz的代表律師Sy Damle認為,讓這些AI工具存在的唯一可行方法是,它們可以接受大量資料的訓練,而無需這些資料的許可。Damle稱,「所需資料規模時如此之大,以至於即使是集體許可也難以行得通。」

閱讀更多

  • 日幣匯率三連漲破153!日本央行4月升息?未來會漲破150嗎?
  • 澳幣匯率2026年初飆漲6%!商品狂潮+升息下,未來還能漲6%?
  • 6月小非農不及預期,勞動市場再降溫,降息又邁進一步?
  • 香港比特幣現貨ETF要來了?外媒稱可能在本月推出
  • 未來一週前瞻——數據密集來襲,美聯儲會議紀要及新西蘭聯儲決議成為焦點
  • 日幣匯率逼近152!套利交易平倉,全球資產迎巨震?
  • 注:如需轉載《AI訓練語料被「榨乾」,OpenAI等巨頭的AI大道走向何方?》請保留原文連結,更多資訊請訪問投資慧眼,或瀏覽www.mitrade.com

    * 本文內容僅代表作者個人觀點,讀者不應以本文作為任何投資依據。在做出任何投資決定之前,您應該尋求獨立財務顧問的建議,以確保您了解風險。差價合約(CFD)是槓桿性產品,有可能導致您損失全部資金。這些產品並不適合所有人,請謹慎投資。查閱詳情


    goTop
    quote
    相關文章
    placeholder
    通脹降溫、非農勁爆,美股能否止跌企穩?川普將於今年4月訪問中國,在潛在的訪華行程正式成行之前,特朗普政府擱置了一系列對華關鍵科技安全措施(禁令),這些措施包括禁止中國電信在美國開展業務,以及限制向美國數據中心銷售中國設備。基本預期是,美中關係緩和將有助於緩解通脹壓力,同時全球經濟前景轉向樂觀。
    作者  Insights
    昨日 04: 25
    川普將於今年4月訪問中國,在潛在的訪華行程正式成行之前,特朗普政府擱置了一系列對華關鍵科技安全措施(禁令),這些措施包括禁止中國電信在美國開展業務,以及限制向美國數據中心銷售中國設備。基本預期是,美中關係緩和將有助於緩解通脹壓力,同時全球經濟前景轉向樂觀。
    placeholder
    【財經縱覽】:通脹降溫!1月CPI同比2.4%,黃金收復5000、美股回穩,比特幣終結四連跌週五(2月13日)美國1月份消費物價指數(CPI)按年升幅從12月的2.7%放慢至2.4%,低過預期增長2.5%。核心CPI同比為2.5%持平預期,較12月的2.6%回落,為2021年以來最低水準。消息公佈後,與聯准會相關的隔夜指數掉期(OIS)合約出現鴿派轉向,交易員預計今年合共降息約63個基點,高於週四的58個基點,相當於到今年12月,有約50%概率進行第三次降息。
    作者  Insights
    昨日 00: 34
    週五(2月13日)美國1月份消費物價指數(CPI)按年升幅從12月的2.7%放慢至2.4%,低過預期增長2.5%。核心CPI同比為2.5%持平預期,較12月的2.6%回落,為2021年以來最低水準。消息公佈後,與聯准會相關的隔夜指數掉期(OIS)合約出現鴿派轉向,交易員預計今年合共降息約63個基點,高於週四的58個基點,相當於到今年12月,有約50%概率進行第三次降息。
    placeholder
    美國1月CPI來襲!標普500、輝達、德國DAX指數、澳元/美元技術分析 週五(2月13日)美國勞工統計局將發佈美國1月消費者價格指數(CPI)。市場普遍預計服務價格漲幅放緩大將推動1月通脹有所降溫,但核心通脹率將有所上升。
    作者  Insights
    2 月 13 日 週五
    週五(2月13日)美國勞工統計局將發佈美國1月消費者價格指數(CPI)。市場普遍預計服務價格漲幅放緩大將推動1月通脹有所降溫,但核心通脹率將有所上升。
    placeholder
    AI恐慌加劇,納指大跌2%!拋售潮繼續?市場敘事出現明顯轉向:從「誰會受益於AI」,轉為「誰會被AI取代」。
    作者  Alison Ho
    2 月 13 日 週五
    市場敘事出現明顯轉向:從「誰會受益於AI」,轉為「誰會被AI取代」。
    placeholder
    非農強勁打擊降息預期,聯準會6月降息無望?接下來看CPI!市場預期CPI數據將溫和下行,若CPI數據意外走強,將引發巨震。
    作者  Alison Ho
    2 月 12 日 週四
    市場預期CPI數據將溫和下行,若CPI數據意外走強,將引發巨震。
    實時行情報價
    名稱/代碼走勢圖漲跌幅/價格
    GOOG
    GOOG
    0.00%0.00
    MSFT
    MSFT
    0.00%0.00
    META
    META
    0.00%0.00
    NAS100
    NAS100
    0.00%0.00

    美股 相關文章

    • 美國降息對股市影響有哪些?哪類股票在降息週期中更容易受惠?
    • 美股投資策略:2026應該關注哪些美股投資機會?
    • 低軌衛星概念股族群强勢爆發!有哪些?重點關注這3檔!
    • Google股票可以買嗎?2026年google估值、風險與機會分析
    • 2026伺服器概念股先看這五檔!可以投資嗎?未來還能繼續漲?
    • 2026新能源概念股如何投資?10檔台股,美股潛力股解析

    點擊看更多文章