Google DeepMind週二推出了一種名爲Gemini Robotics On Device的新語言模型。該公司透露,該模型可以在沒有互聯網連接的情況下在機器人上本地運行任務。
新模型建立在公司以前的Gemini機器人AI模型上,該模型在3月發佈,可以控制機器人的動作。 Google還承認,視覺語言動作模型(VLA)小巧且高效,可以直接在機器人上運行。據該公司稱,開發人員可以使用自然語言提示來控制和調整模型以適應各種需求。
我們將強大的AI直接帶到具有雙子座機器人技術的機器人上。 🤖
這是我們的第一個視覺語言動作模型,可幫助使機器人更快,高效且能夠適應新任務和環境,而無需持續的互聯網連接。 🧵pic.twitter.com /1Y21D3CF5T
- 2025年6月24日
Carolina Parada的Google Deepmind的機器人技術負責人堅持認爲,原始的Gemini Robotics模型使用了混合方法,使其可以在設備上和雲上操作。她說,使用新的僅設備模型,用戶幾乎可以訪問離線功能以及旗艦功能。
該科技公司聲稱該模型在基於雲的Gemini Robotics模型的水平上執行。 Google還表示,在一般基準測試中,它表現優於其他設備模式,儘管它沒有命名這些型號。
“雙子座機器人的混合模型仍然更加強大,但實際上,我們對這種設備模型的tron感到非常驚訝。我將其視爲啓動器模型,也可以作爲僅連接性較差的應用程序的模型。”
-Carolina Parada,Google DeepMind的機器人技術負責人。
該公司在運行本地型號的演示機器人中進行了說明,解壓縮袋子和摺疊衣服。 Google承認,雖然該模型接受了Aloha機器人的培訓,但後來它將其改編爲ApptronIK在Bi-Arm-Arm Franka FR3機器人和Apollo Hubrot機器人上工作。
這家科技公司聲稱,雙臂Franka FR3成功地解決了以前從未見過的場景和對象,例如在工業帶上進行組裝。該公司提到,開發人員可以使用Mujoco Physics Simulator上的模型向機器人展示50至100個任務的示範,以訓練他們的新任務。
Google DeepMind還提到了一個名爲Gemini Robotics SDK的軟件開發套件的發佈。該公司透露,其機器人SDK提供了使用Gemini機器人模型所需的完整生命週期工具,包括訪問檢查站,提供模型,評估機器人和SIM卡上的模型,上傳數據並進行微調。該公司透露,在Google繼續致力於最大程度地降低安全風險的同時,其在設備上的Gemini機器人技術模型及其SDK將提供給一組受信任的測試人員。
其他使用AI模型的公司也表現出對機器人技術的興趣。 Nvidia正在建立一個平臺,以創建人形生物的基礎模型。該公司的首席執行官詹森·黃(Jensen Huang)指出,爲普通類人機器人建立基礎模型是當今AI中最令人興奮的問題之一。
黃認爲,類人動物因素是目前世界上最有爭議的主題之一。他承認,這正在通過船上籌集風險投資,同時在此過程中引起了極大的懷疑。
Nvidia還通過Isaac和Jetson等倡議來倡導機器人創新。去年3月,在其年度GTC開發人員會議上,該公司加入了人形競賽。
Nvidia將新平臺稱爲人形機器人的通用基礎模型。該公司表示,Groot也將支持Nvidia的新硬件。
擁抱面孔不僅開發了用於機器人技術的開放模型和數據集,而且還在機器人上工作。該公司本月初透露了
該公司聲稱,該模型在社區共享的數據集上進行了培訓,並且在虛擬和現實環境中的機器人技術均優於更大的模型。擁抱的臉還表明,Smolvla旨在使訪問視覺行動(VLA)模型的訪問權民主化,並加速對通才機器人的研究。
去年,該公司推出了Lerobot,這是一系列以機器人技術爲中心的模型,數據集和工具。最近,Hugging Face收購了一家位於法國的機器人技術初創公司的花粉機器人技術,並揭示了包括類人類機器人的幾種廉價機器人系統供購買。
您的加密新聞值得關注 -關鍵差異使您進入250多個頂級網站