認識LUO FULI:DeepSeek開源模型和MLA技術背後的AI Pro

來源 Cryptopolitan

盧·富里(Luo Fuli)是一位29歲的研究人員,中國網民和同事給了“ AI Prodigy”的綽號。她以在DeepSeek-V2的發展中關鍵作用而聞名。這是中國的第一個人工智能(AI)語言模型,可以與Openai的Chatgpt進行腳趾。

根據《南中國晨報》的報道, 推出了 ,其資源比Meta的Llama少得多。

在2023年5月 採訪說,在招募人才時,該公司優先考慮能力而不是經驗。當地新聞來源建議,該初創公司的開發人員團隊主要由畢業生和大學Stu dent s組成。

他解釋說:“我們的核心技術角色大多是新鮮的畢業生或具有一兩年工作經驗的畢業生。”

該策略幫助DeepSeek建立了一支雄心勃勃的年輕研究人員,包括Gao Huazuo和Zeng Wangding。兩者在MLA體系結構中被認爲是關鍵的創新。

Lufuli:藉此機會獲得計算機科學的回報

該公司最受歡迎的開發人員之一是Lu Fuli。據說她是一位“聰明”和衷心的科技專家,具有tron語言處理(NLP)背景。據報道,富里在一個適中的環境中長大。據說她對技術的興趣可能源於她的父親,電氣工程師。

Luo在AI領域的崛起始於北京大學的計算語言學研究所。 未經證實的報告 最初不確定研究計算機科學。 Fuli在此期間甚至失敗了幾次。

但是,她最終發現了對AI的熱情,並通過開創性的研究爲自己起了名字。此外,有傳言說,羅還在上學時收到了工作請柬和要約,但她拒絕了。

2019年,她在計算語言學協會(ACL)會議上發表有關NLP的八篇論文後,引起了中國科技領域的注意。

她在NLP中的知識和意見使她收到了主要技術公司,特別是阿里巴巴的幾個報價。

在阿里巴巴的達莫學院,羅爲多語言AI模型Veco做出了貢獻。她從事該公司的開源AliceMind項目,幫助在線市場推進了AI計劃。但是,她的野心超出了企業研究。爲此,她於2022年擔任Wengfeng領導的DeepSeek AI的職務,擔任首席研究員。

Luo Fuli和DeepSeek AI的年輕開發人員團隊

一開始,Luo是實現DeepSeek-V2的團隊的一部分。這是一種具有成本效益的大語言模型,當地人以“ AI Pinduoduo”綽號,這是對中國在線電子商務巨頭以其負擔得起的定價而聞名的。 

Luo在2023年的技術會議上發表講話,揭示了該模型如何提供頂級中文功能。這甚至與Chatgpt和Qwei之類的最佳全球AI系統媲美。

Lu Fuli將DeepSeek-V2的成功歸因於創新的建築,強大的基礎架構以及公司對透明度的承諾。在公司期間,DeepSeek在Github上公開分享了其技術報告,模型權重和推理代碼。這是爲了實現其開源AI開發方法。

DeepSeek AI - 開源技術達到頂峯

DeepSeek-V2的傑出特徵之一是使用多層次注意(MLA)和專家(MOE)架構的混合物。 MLA使該模型能夠專注於不同級別的文本信息,即人類讀者如何處理書籍。根據上下文,它在句子,段落和章節之間轉移了注意力。 

同時,MOE通過將任務引向模型中選定的虛擬“專家”來優化計算效率。堆積在增長績效的同時減少了資源消耗。

羅·富里(Lu Fuli)認爲,中國需要更多的AI實驗室。她堅稱自己的國家應專注於實用和大型工程項目。

盧·富里(Lu Fuli)也一直是tron向研究優先級列出現實應用程序的研究的倡導者。新的方向應確保AI的進步轉化爲企業和消費者的切實福利。

這位29歲的技術人員在人工智能行業的影響力日益增長並沒有引起人們的注意。根據SCMP的報告

加密大都會學院:如何撰寫訪談的Web3簡歷 -免費備忘單

免責聲明:僅供參考。 過去的表現並不預示未來的結果。
placeholder
【今日市場前瞻】比特幣跌破11萬美元關口!黃金價格漲至兩週高點法國政治動盪疊加聯準會風波,全球股市下跌,黃金價格升至兩週高點;比特幣跌破11萬美元關口,20萬人爆倉>>
作者  Alison Ho
9 小時前
法國政治動盪疊加聯準會風波,全球股市下跌,黃金價格升至兩週高點;比特幣跌破11萬美元關口,20萬人爆倉>>
placeholder
等20年就為這一刻!林百里為「達明」站台激動告白:我做不到的夢,它做到了​投資慧眼Insights-達明(4585)舉辦上市前業績發表會,廣達董事長林百里親自出席,為達明機器人站台。
作者  投資指南針
10 小時前
​投資慧眼Insights-達明(4585)舉辦上市前業績發表會,廣達董事長林百里親自出席,為達明機器人站台。
placeholder
【台股短線策略】輝達預告機器人新大腦,光學廠佳能(2374)勁漲6%週二(8月26日)光學廠佳能(2374)勁漲5.99%,收報83.20元,創下波段新高。輝達週一宣佈推出被稱為「機械人大腦」、專為實體人工智慧機械人設計的最新晶片模組Jetson AGX Thor,新一代機器人運算平台帶動機器人概念股。佳能(2374)同時切入無人機與機器人商機,受益於此盤中一度大漲逾9%。外資昨日大舉買超5,085張,法人籌碼同步偏多,顯示機構對後市信心提升。
作者  Insights
10 小時前
週二(8月26日)光學廠佳能(2374)勁漲5.99%,收報83.20元,創下波段新高。輝達週一宣佈推出被稱為「機械人大腦」、專為實體人工智慧機械人設計的最新晶片模組Jetson AGX Thor,新一代機器人運算平台帶動機器人概念股。佳能(2374)同時切入無人機與機器人商機,受益於此盤中一度大漲逾9%。外資昨日大舉買超5,085張,法人籌碼同步偏多,顯示機構對後市信心提升。
placeholder
AI 風口下的「慢牛突襲」,台達電股價暴漲背後是機會還是風險?台股今年從四月的調整低谷一路反彈至八月新高,這波 V 型反轉裡,不少個股憑藉題材或業績脫穎而出,台達電的「逆襲」算得上最出人意料的劇本之一。市場上甚至流傳著一個頗有戲謔意味的說法:外資點名兩隻必買股,台達電與台積電,有人誤買了前者,最後收益反倒跑贏了「護國神山」。
作者  投資-槓把子
10 小時前
台股今年從四月的調整低谷一路反彈至八月新高,這波 V 型反轉裡,不少個股憑藉題材或業績脫穎而出,台達電的「逆襲」算得上最出人意料的劇本之一。市場上甚至流傳著一個頗有戲謔意味的說法:外資點名兩隻必買股,台達電與台積電,有人誤買了前者,最後收益反倒跑贏了「護國神山」。
placeholder
台積電、鴻海領軍!市值型ETF00922 成黑馬,成交量暴增3倍近期台股受國際因素影響,波動較大。上週三甚至大跌728點,跌幅接近3%,促使不少資金轉向市值型ETF。其中,國泰台灣領袖50(00922)成交量增長3倍,國泰臺灣加權正2(00663L)更是大增4倍,表現突出。
作者  財富進化論
10 小時前
近期台股受國際因素影響,波動較大。上週三甚至大跌728點,跌幅接近3%,促使不少資金轉向市值型ETF。其中,國泰台灣領袖50(00922)成交量增長3倍,國泰臺灣加權正2(00663L)更是大增4倍,表現突出。
goTop
quote