- 【今日要聞】「恐怖數據」來襲!日幣匯率逼近155
- 日幣匯率三連漲破153!日本央行4月升息?未來會漲破150嗎?
- 澳幣匯率2026年初飆漲6%!商品狂潮+升息下,未來還能漲6%?
- 澳洲央行升息25基點,澳幣匯率狂飆!未來走勢如何?
- 【今日要聞】日幣匯率4連漲!川普又有大動作
- 【今日要聞】非農重磅來襲!日幣匯率三連漲破153

AI發展扶搖直上,快到當前全人類的庫存知識都難以跟上。為了應對AI模型所需訓練語料的匱乏,OpenAI、谷歌和Meta等巨頭不顧侵權和違規、耍花招來改進模型。
據《紐約時報》報道,早在2021年底,GPT-4的開發者OpenAI便面臨著訓練資源緊缺的問題。在開發最新的人工智慧係統時,人工智慧實驗室已經耗盡了網路上所有可靠的英文文本資源,而他們還需要更多資源。
研究機構Epoch表示,科技巨頭們的問題很緊急,它們使用資料的速度已經超過生產資料的速度,併最快會在2026年耗盡網路上所有高質量資料。
面對這一瓶頸,科技巨頭們開始想方設法來獲得訓練資源。OpenAI研發人員創建了一款名為Whisper的語音辨識工具,將流媒體Youtube影片中的音頻轉錄成新的對話文本,以使得他們的AI模型更加「人類化」。
但有三名知情人士表示,一些OpenAI員工是在「明知故犯」,這些員工已經討論過此舉可能會違反Youtube的規則。Youtube是谷歌旗下的,按規定不允許將網路上的影片用於獨立應用。
而據悉,OpenAI團隊迄今已轉錄了超100萬個小時的Youtube影片,且該公司總裁Greg Brockman親自參與了這一過程。這些由影片轉錄生成的文本被納入GPT-4的訓練係統中,成為了最新版本ChatGPT聊天機器人的基礎,推動其成為世界上最強大的AI模型。
無獨有偶,谷歌和Meta等科技巨頭也在紛紛「走捷徑」,甚至無視公司政策、網路規則和法律法規,來最大程度地獲取訓練資源。與OpenAI做法一樣,谷歌也轉錄自家流媒體平台Youtube視頻,但這本身仍可能侵犯了相關版權,因為這些影片是屬於創作者的。
對於OpenAI「偷」自家語料的做法,谷歌的態度略顯曖昧,一邊表示並不知情,一邊似乎默認容許這種行為,因為谷歌本身也在做這件事。知情人士稱,如果谷歌在OpenAI的問題上大驚小怪,公眾可能會對自己的做法提出強烈抗議,也就是說谷歌擔心自己「引火燒身」。
有趣的是,為了應對這一挑戰,谷歌隱私團隊還編寫了新條款,以便其可以利用這些網路資源來進行AI模型搭建和產品功能升級,如谷歌翻譯、Bard和雲端AI等。
據外媒報道的一份Meta內部會議記錄,該公司工程師和產品經理層討論過收購美國出版社Simon & Schuster以獲取長文本足療的計劃,也討論過從網路收集受版權保護的內容。他們認為,「與出版商、藝術家、音樂家和新聞業談授權問題所需的時間太多了。」
Meta高層表示,OpenAI似乎正在採用收版權保護的資料,而Meta可以遵循這一「市場先例」。
去年,超過10000個貿易團體、作者、公司和其他人是向美國版權局提交了有關人工智慧模型使用他們創意作品的意見,版權局正在準備就版權法如何在AI時代適用的指導意見。
電影製作人Justine Bateman表示,人工智慧模型在未經許可或付費的情況下獲取其內容,「這是美國最大的盜竊案。」
矽谷知名創投公司Andreessen Horowitz的代表律師Sy Damle認為,讓這些AI工具存在的唯一可行方法是,它們可以接受大量資料的訓練,而無需這些資料的許可。Damle稱,「所需資料規模時如此之大,以至於即使是集體許可也難以行得通。」
閱讀更多
* 本文內容僅代表作者個人觀點,讀者不應以本文作為任何投資依據。在做出任何投資決定之前,您應該尋求獨立財務顧問的建議,以確保您了解風險。差價合約(CFD)是槓桿性產品,有可能導致您損失全部資金。這些產品並不適合所有人,請謹慎投資。查閱詳情






