全球首個AI程式設計師Devin問世,拳打GPT-4,腳踢程序員飯碗!

3月12日週二,AI初創公司Cognition發佈全球首個AI軟體工程師Devin,雖然幾乎未聽聞過這個團隊,但一則推文不到48小時引發兩千餘萬人的關注。
據介紹,Devin是世界上第一位人工智慧軟體工程師,號稱能徹底改變人類構建軟體的方式。Devin在SWE-bench編碼基准測試中取得了突破性的成功,也順利通過了領先AI公司的實際工程面試,甚至在全球最大自由職業平台Upwork上完成了實際工作。
【來源:X@Cognition】
Devin是一位完全自主的AI程式設計師,通過使用自己的Shell、程式碼編輯器和Web瀏覽器來處理任務。具體而言,它能輕鬆勝任諸如從零構建網站、自主查找並修復Bug、訓練和微調自己的模型等操作任務,甚至能對成熟的程式碼做出貢獻,以及自我學習新的技術。
在SWE-bench測試中,當被要求通過AI技術來處理GitHub上的實際問題時,Devin能夠在無需人類的幫助下成功解決13.86%的問題,優於市面上幾乎所有模型在沒有幫助情況下的1.96%和有幫助的4.80%的表現。OpenAI最炙手可熱的GPT-4模型目前也只能處理1.74%的任務,且需要人類告知要處理的目標。
【來源:X@Cognition】
Cognition表示,「有了Devin,工程師可以專註於更有趣的問題,工程團隊可以為更雄心勃勃的目標而奮鬥。」
Devin的橫空出世給近兩年持續火熱的AI浪潮又推上了一個台階。Perplexity AI首席執行長Aravind Srinivas驚訝道,「Devin幾乎是任何一個智能體的第一個展示,更不用說編碼了,這似乎跨越了人類能力的門檻。」
該AI程序員背後的團隊Cognition AI雖然規模小,但人才濟濟、實力拉滿,且以華人為主。Cognition總部位於紐約和舊金山,在兩個月前才剛剛正式成立,團隊僅有10人,但手握10枚IOI金牌。團隊成員有Google Deepmind、Cursor、Scale AI、Lunchclub、Waymo、Nuro等科技公司的工作經驗。
該公司首席執行長Scott Wu年僅27歲,曾就讀於哈佛大學,曾任Lunchclub的聯合創始人兼CTO。值得註意的是,Wu曾在2012年、2013年和2014年連續三年斬獲IOI金牌。
此外,Cognition獲得了Founders Fund牽頭的2100美元A輪融資,該基金曾為Airbnb、LinkedIn、SpaceX、Palantir、Spotify等知名企業提供過資金。
* 本文內容僅代表作者個人觀點,讀者不應以本文作為任何投資依據。在做出任何投資決定之前,您應該尋求獨立財務顧問的建議,以確保您了解風險。差價合約(CFD)是槓桿性產品,有可能導致您損失全部資金。這些產品並不適合所有人,請謹慎投資。查閱詳情