蘋果無視工程師關於人工智能技術缺陷的警告

來源 Cryptopolitan

據報道,蘋果公司無視工程師對其有缺陷的蘋果智能的警告,並繼續發佈了該技術,但市場評價卻平淡無奇。

這家 iPhone 製造商的 Apple Intelligence 因錯誤原因成爲頭條新聞,並受到廣泛批評,尤其是捏造虛假信息和搞砸新聞頭條。

工程師發現了包括Apple Intelligence在內的許多模型的故障

雖然大型語言模型產生幻覺是很常見的,這是人工智能行業尚未解決的挑戰(如果有的話),但蘋果的情況有點不同。工程師在發佈之前注意到該模型存在一些嚴重缺陷。然而,該公司忽視了這些警告。

分析師表示,在對其人工智能的巨大缺陷發出警告後,這家科技巨頭繼續發佈該模型是魯莽defi。這些警告來自去年十月發佈的研究

儘管尚未經過同行評審,但在測試了人工智能行業一些頂級法學碩士的matic“推理”能力後,該研究還得出結論,這些模型無法推理。

爲了測試這些模型,工程師讓他們從廣泛使用的GSM8K 數據,該數據集是行業的基準。

根據 Futurism 的說法,數據集中的一個典型問題是:“詹姆斯買了 5 包牛肉,每包 4 磅。牛肉價格爲每磅 5.50 美元。他付了多少錢?”

工程師們通過簡單地更改問題中的一些數字來暴露人工智能模型中的差距,以避免數據污染。這導致了所檢查的 20 個法學碩士存在一些小但值得注意的錯誤。

然而,當研究人員更進一步,更改名稱並添加一些“不相關的細節”時,結果卻是“災難性的”,高達 65%。

研究人員寫道:“這揭示了模型識別解決問題相關信息的能力的一個關鍵缺陷,可能是因爲它們的推理在常識術語中並不正式,並且主要基於模式匹配。”

研究人員表示,每個模型的結果都不同。 OpenAI 01-preview 下降了 17.5%,其前身 GPT-4o 下降了 32%。研究人員指出,即使是“最聰明”的模型也會面臨問題並表現出一些嚴重的缺陷。

AI 模型靠自己掙扎 

測試還證明,人工智能模型在解決問題方面可能看起來很聰明,但一旦它們不能逐字複製某人的作業,它們就會陷入困境。至於蘋果公司,據報道這家科技巨頭知道測試結果,但向市場發佈了其型號。

由於市場的強烈反對,包括英國廣播公司(BBC)對該模型泄露誤導性信息的擔憂,蘋果最終暫停了該計劃,直到能夠修復它。

蘋果的人工智能功能原本應該能夠總結新聞通知,但它有時會自己編造新聞,這讓讀者和新聞出版商非常不滿。

其中一條不準確的新聞提醒稱,拉斐爾·納達爾是同性戀,一名被指控殺害美國保險老闆的男子開槍自殺。蘋果的人工智能還錯誤地總結了 BBC 應用程序通知,聲稱盧克·利特勒 (Luke Littler) 在 PDC 世界飛鏢錦標賽開始前幾個小時就贏得了冠軍。

《紐約時報》報道的另一篇錯誤摘要似乎已於 1 月 6 日發表,與國會山騷亂四週年有關。

蘋果在給 BBC 的一份聲明中表示:“Apple Intelligence 功能尚處於測試階段,我們將在用戶反饋的幫助下不斷進行改進。” “未來幾周的軟件更新將進一步澄清顯示的文本何時是 Apple Intelligence 提供的摘要。我們鼓勵用戶在看到意外的通知摘要時報告問題。”聲明補充道。

蘋果的缺陷功能之一是去年 12 月向一些較新 iPhone 的用戶發佈的人工智能工具之一,包括 iPhone 16、15 Pro 和 15 Pro Max 手機,以及一些 iPad 和 Mac。

90 天內開啓您的 Web3 職業生涯並獲得高薪加密工作的分步系統

免責聲明:僅供參考。 過去的表現並不預示未來的結果。
placeholder
【比特日報】特朗普一句話沒提!比特幣試探7萬,超4億空頭被平倉 反彈來得快去得也快?在昨日衝擊7萬大關後,週四(2月26日)比特幣繼續在6.85萬美元附近盤整,這一波反彈能否站穩,還是會像此前多次反彈那樣很快消退,是市場分歧的核心問題。
作者  FX168
9 小時前
在昨日衝擊7萬大關後,週四(2月26日)比特幣繼續在6.85萬美元附近盤整,這一波反彈能否站穩,還是會像此前多次反彈那樣很快消退,是市場分歧的核心問題。
placeholder
【今日要聞】美伊談判開啓!原油價格下挫,黃金、白銀走勢分化美國與伊朗在瑞士進行談判,WTI原油跌超1%;黃金、白銀走勢分化,澳新銀行看好黃金前景;輝達績后上漲2%>>
作者  Alison Ho
9 小時前
美國與伊朗在瑞士進行談判,WTI原油跌超1%;黃金、白銀走勢分化,澳新銀行看好黃金前景;輝達績后上漲2%>>
placeholder
美伊談判即將開啟!黃金或處於「易跌難漲」階段新一輪美伊談判將啟動,濃縮鈾庫存與彈道導彈成核心議題;美國名義利率難下行、黃金或處於「易跌難漲」階段
作者  Insights
10 小時前
新一輪美伊談判將啟動,濃縮鈾庫存與彈道導彈成核心議題;美國名義利率難下行、黃金或處於「易跌難漲」階段
placeholder
輝達財報靚麗、美股「科技牛」重啟?這一點成關鍵!大規模資本開支無疑是當前支撐美股科技牛市最重要因素之一,但市場正同時擔憂科技行業正在過度建設,一旦需求放緩,相關影響將被放大,尤其在AI可能對某些行業構成衝擊的情況下。筆者認為關鍵或在於AI上游的資本支出能否與下游形成閉環,這或意味儘管美股市場短期風險偏好確實轉向樂觀,有助於緩解市場拋售壓力,但若要進入新一輪升浪,則似乎仍需更多積極因素配合。
作者  Insights
13 小時前
大規模資本開支無疑是當前支撐美股科技牛市最重要因素之一,但市場正同時擔憂科技行業正在過度建設,一旦需求放緩,相關影響將被放大,尤其在AI可能對某些行業構成衝擊的情況下。筆者認為關鍵或在於AI上游的資本支出能否與下游形成閉環,這或意味儘管美股市場短期風險偏好確實轉向樂觀,有助於緩解市場拋售壓力,但若要進入新一輪升浪,則似乎仍需更多積極因素配合。
placeholder
【財經縱覽】:輝達業績、指引雙雙超預期!美股兩連漲,比特幣漲近6%,以太幣漲近12%美國人工智能(AI)晶片龍頭廠商輝達Q4業績、指引雙雙超預期,盤後一度漲超3%。美國人工智能(AI)晶片龍頭廠商輝達Q4業績、指引雙雙超預期,盤後一度漲超3%。其中四季經營收入創新高錄得681.3億美元,按年急增73%,優於預期659.1億美元。2025財年全年營收增長68%,達到創紀錄的1937億美元。業績指引方面,輝達預計2027財年第一季度收入將達到780億美元,上下浮動不超過2%,大超市場預期的727.8億美元。且該預測未考慮中國數據中心收入。行政總裁黃仁勳(Jensen Huang)表示,輝達客戶競相投資AI算力,運算需求迅速增長,企業對AI代理的應用飆升。自從AI技術開發公司OpenAI旗下ChatGPT面世以來,輝達數據中心的經營收入急增近13倍。 摩根士丹利策略員認為,「AI恐慌交易」造成的過度拋售,將為投資者帶來機會,可伺機低吸增長強勁的優質股。美股三大指數連續第二日上漲,道指升0.63%;標指漲0.81%;納指彈升1.26%;費城半導體指數漲1.62%,續創歷史新高。比特幣、以太幣雙雙大漲,其中比特幣漲近6%,一度觸及7萬大關,以太幣漲超11%,收復2000關口。
作者  Insights
19 小時前
美國人工智能(AI)晶片龍頭廠商輝達Q4業績、指引雙雙超預期,盤後一度漲超3%。美國人工智能(AI)晶片龍頭廠商輝達Q4業績、指引雙雙超預期,盤後一度漲超3%。其中四季經營收入創新高錄得681.3億美元,按年急增73%,優於預期659.1億美元。2025財年全年營收增長68%,達到創紀錄的1937億美元。業績指引方面,輝達預計2027財年第一季度收入將達到780億美元,上下浮動不超過2%,大超市場預期的727.8億美元。且該預測未考慮中國數據中心收入。行政總裁黃仁勳(Jensen Huang)表示,輝達客戶競相投資AI算力,運算需求迅速增長,企業對AI代理的應用飆升。自從AI技術開發公司OpenAI旗下ChatGPT面世以來,輝達數據中心的經營收入急增近13倍。 摩根士丹利策略員認為,「AI恐慌交易」造成的過度拋售,將為投資者帶來機會,可伺機低吸增長強勁的優質股。美股三大指數連續第二日上漲,道指升0.63%;標指漲0.81%;納指彈升1.26%;費城半導體指數漲1.62%,續創歷史新高。比特幣、以太幣雙雙大漲,其中比特幣漲近6%,一度觸及7萬大關,以太幣漲超11%,收復2000關口。
goTop
quote