人形機(jī)器人公司Figure AI宣布完成超過10億美元的C輪融資,資金將用于擴(kuò)大機(jī)器人生產(chǎn)、構(gòu)建英偉達(dá)GPU基礎(chǔ)設(shè)施以加速訓(xùn)練和仿真,并擴(kuò)展人類工作生活數(shù)據(jù)收集。該公司目標(biāo)是在未來四年內(nèi)交付10萬臺人形機(jī)器人,其Figure 02機(jī)器人搭載Helix AI智能系統(tǒng),能夠理解未見過的物體并做出合理行動(dòng)。英特爾、英偉達(dá)、LG等公司參與投資。
隨著AI能力的爆發(fā)式增長,仿人機(jī)器人的靈活性進(jìn)化備受關(guān)注。傅里葉推出的開源設(shè)計(jì)展現(xiàn)了機(jī)器人行走、奔跑和攀坡能力。盡管目前仿人機(jī)器人僅占商業(yè)制造銷售的不足2%,但專家普遍認(rèn)為仿人機(jī)器人時(shí)代即將到來。斯坦福專家討論了零樣本設(shè)計(jì)、運(yùn)動(dòng)復(fù)雜性和安全性等挑戰(zhàn)。
中國科技企業(yè)發(fā)布了名為R1的人形機(jī)器人,直接對標(biāo)特斯拉的Optimus機(jī)器人產(chǎn)品。這款新型機(jī)器人代表了中國在人工智能和機(jī)器人技術(shù)領(lǐng)域的最新突破,展現(xiàn)出與國際巨頭競爭的實(shí)力。R1機(jī)器人的推出標(biāo)志著全球人形機(jī)器人市場競爭進(jìn)一步加劇。
加州歐文的FieldAI公司宣布獲得4.05億美元融資,用于開發(fā)"基礎(chǔ)具身AI模型"——通用機(jī)器人大腦,幫助人形機(jī)器人、四足機(jī)器人和自動(dòng)駕駛汽車適應(yīng)新環(huán)境。最新一輪融資3.14億美元由貝索斯探險(xiǎn)基金等共同領(lǐng)投。該公司構(gòu)建基于物理學(xué)的"場基礎(chǔ)模型",通過在AI模型中加入物理層,讓機(jī)器人能夠安全學(xué)習(xí)并適應(yīng)新環(huán)境,同時(shí)具備風(fēng)險(xiǎn)意識和安全決策能力。
西雅圖AI研究機(jī)構(gòu)Ai2發(fā)布MolmoAct 7B,這是首個(gè)動(dòng)作推理模型,能讓機(jī)器人在執(zhí)行任務(wù)前進(jìn)行"思考"和規(guī)劃。該模型可將自然語言指令轉(zhuǎn)化為3D空間中的運(yùn)動(dòng)軌跡,通過1800萬樣本在256個(gè)H100芯片上訓(xùn)練完成。在SimPLER基準(zhǔn)測試中達(dá)到72.1%的任務(wù)成功率,超越了谷歌、微軟等公司的同類模型。
2009年,比爾·戴利加入英偉達(dá)研究實(shí)驗(yàn)室時(shí),該實(shí)驗(yàn)室僅有約12名員工,專注于計(jì)算機(jī)圖形學(xué)中的光線追蹤技術(shù)。如今這個(gè)實(shí)驗(yàn)室已發(fā)展至400多人,幫助英偉達(dá)從90年代的游戲GPU初創(chuàng)公司轉(zhuǎn)型為價(jià)值4萬億美元的AI巨頭。目前實(shí)驗(yàn)室重點(diǎn)開發(fā)機(jī)器人和AI技術(shù),部分研究成果已應(yīng)用于產(chǎn)品中。英偉達(dá)在周一發(fā)布了面向機(jī)器人開發(fā)者的新AI模型、庫和基礎(chǔ)設(shè)施,展現(xiàn)了從物理AI到機(jī)器人領(lǐng)域的技術(shù)進(jìn)展。
英偉達(dá)在SIGGRAPH大會(huì)上發(fā)布了全新的AI世界模型、庫和機(jī)器人開發(fā)基礎(chǔ)設(shè)施。其中最引人注目的是Cosmos Reason,這是一個(gè)70億參數(shù)的"推理"視覺語言模型,專門用于物理AI應(yīng)用和機(jī)器人。新發(fā)布的還包括Cosmos Transfer-2模型,能夠從3D仿真場景加速合成數(shù)據(jù)生成,以及速度優(yōu)化版本。公司還推出了神經(jīng)重建庫、RTX Pro Blackwell服務(wù)器和DGX Cloud云平臺,旨在為機(jī)器人開發(fā)提供完整的解決方案。
隨著AI引發(fā)投資熱潮,每月都有更多初創(chuàng)企業(yè)獲得獨(dú)角獸地位。TechCrunch追蹤了今年迄今為止成為獨(dú)角獸的風(fēng)投支持初創(chuàng)企業(yè)。雖然大多數(shù)與AI相關(guān),但令人意外的是許多企業(yè)專注于其他行業(yè),如衛(wèi)星公司Loft Orbital和區(qū)塊鏈交易網(wǎng)站Kalshi。這些價(jià)值超過10億美元的初創(chuàng)企業(yè)涵蓋軟件開發(fā)、機(jī)器人技術(shù)、醫(yī)療健康等多個(gè)領(lǐng)域。
亞馬遜機(jī)器人部門宣布已部署超過一百萬臺倉儲機(jī)器人,并推出DeepFleet人工智能系統(tǒng)。該系統(tǒng)如交通控制器般協(xié)調(diào)機(jī)器人運(yùn)行,提高移動(dòng)效率并避免擁堵。從2012年開始測試至今,這些機(jī)器人已成為亞馬遜履行中心的主力,遍布300多個(gè)倉庫。DeepFleet基于AWS構(gòu)建,能實(shí)時(shí)重新規(guī)劃機(jī)器人路徑,將行進(jìn)時(shí)間縮短約10%。亞馬遜表示機(jī)器人創(chuàng)造了更多技術(shù)崗位而非取代人工。
新的數(shù)字秩序正在形成,人工智能正從工具擴(kuò)展為完整系統(tǒng)。AI驅(qū)動(dòng)的機(jī)器人技術(shù)從新奇概念轉(zhuǎn)向基礎(chǔ)設(shè)施,可編程資本從投機(jī)轉(zhuǎn)向現(xiàn)實(shí)經(jīng)濟(jì)層面。亞馬遜倉庫中機(jī)器人數(shù)量幾乎超過人類,顯示AI機(jī)器人已在改變物流業(yè)。專家預(yù)測,未來將出現(xiàn)1500美元以下的單一功能機(jī)器人,如洗衣、烹飪、割草等。穩(wěn)定幣正獲得發(fā)展勢頭,有望重塑全球金融系統(tǒng)。Meta高薪挖角OpenAI研究員,AI軍備競賽愈演愈烈。
全球物理人工智能研究實(shí)驗(yàn)室Genesis AI宣布成立并獲得1.05億美元融資,由Eclipse和Khosla Ventures共同領(lǐng)投。該公司致力于開發(fā)智能機(jī)器人AI模型,采用數(shù)據(jù)驅(qū)動(dòng)的全棧物理AI方法,構(gòu)建可擴(kuò)展的通用數(shù)據(jù)引擎進(jìn)行物理模擬和大規(guī)模機(jī)器人數(shù)據(jù)收集。Genesis旨在打造能夠?yàn)椴煌愋蜋C(jī)器人提供人類級別智能的通用機(jī)器人基礎(chǔ)模型平臺,解決當(dāng)前機(jī)器人在靈活性、認(rèn)知能力和實(shí)際推理方面的局限性。
2025年上半年見證了AI領(lǐng)域的重大突破。Meta投資143億美元成立超級智能實(shí)驗(yàn)室,微軟聲稱其AI診斷準(zhǔn)確率比醫(yī)生高4倍。四大AI力量正在重塑社會(huì):計(jì)算成本下降25倍但GPU供應(yīng)仍然緊張;合成數(shù)據(jù)市場預(yù)計(jì)2030年達(dá)37億美元;50個(gè)主要模型發(fā)布打破算法極限;特斯拉等公司準(zhǔn)備在2025年末商業(yè)化人形機(jī)器人。這些力量相互放大,為準(zhǔn)備充分的企業(yè)創(chuàng)造機(jī)遇,給未準(zhǔn)備者帶來威脅。
谷歌DeepMind發(fā)布新的離線視覺語言行動(dòng)模型,讓機(jī)器人無需云端支持即可自主運(yùn)行。該模型基于Gemini的多模態(tài)理解能力,能夠完成系鞋帶、折衣服等復(fù)雜任務(wù)。相比之前的混合云端模式,新模型準(zhǔn)確性僅略有下降,但大幅提升了響應(yīng)速度和隱私保護(hù)。開發(fā)者可通過SDK進(jìn)行定制化調(diào)優(yōu),僅需50-100次演示即可適應(yīng)新任務(wù)。
Warp成立于2021年,致力于通過技術(shù)賦能的物流網(wǎng)絡(luò)優(yōu)化企業(yè)供應(yīng)鏈。該公司現(xiàn)計(jì)劃使用機(jī)器人自動(dòng)化其倉儲網(wǎng)絡(luò),進(jìn)一步提升供應(yīng)鏈效率。公司在洛杉磯測試倉庫安裝攝像頭,利用計(jì)算機(jī)視覺技術(shù)創(chuàng)建數(shù)字孿生環(huán)境進(jìn)行實(shí)驗(yàn)。經(jīng)過測試,Warp成功部署改裝后的現(xiàn)成機(jī)器人處理貨物裝卸和存儲。公司剛完成1000萬美元A輪融資,計(jì)劃今年開始在核心網(wǎng)絡(luò)城市部署機(jī)器人技術(shù)。
亞馬遜推出具“感知”能力的 Vulcan 機(jī)器人,通過取代部分倉儲作業(yè)并培訓(xùn)機(jī)器人技術(shù)員,推動(dòng)員工技能轉(zhuǎn)型,開啟機(jī)器人與人協(xié)作的新局面。
本文討論了新材料、AI與機(jī)器學(xué)習(xí)推動(dòng)下的人形機(jī)器人技術(shù)突破傳統(tǒng)工業(yè)自動(dòng)化,邁向智能化、靈活性更強(qiáng)的未來,并預(yù)測于2025年實(shí)現(xiàn)量產(chǎn),可能重塑社會(huì)經(jīng)濟(jì)結(jié)構(gòu)。
科技巨頭和初創(chuàng)公司正在開發(fā)人形機(jī)器人,利用先進(jìn)AI模型賦能機(jī)器人可以執(zhí)行家務(wù)和物流工作,但仍面臨諸多技術(shù)和信任挑戰(zhàn)。
英偉達(dá)宣布與迪士尼研究院和谷歌 DeepMind 合作開發(fā) Newton 物理引擎,用于模擬真實(shí)環(huán)境中的機(jī)器人動(dòng)作。迪士尼將率先使用 Newton 驅(qū)動(dòng)其下一代娛樂機(jī)器人,如星球大戰(zhàn)風(fēng)格的 BDX 機(jī)器人。英偉達(dá)計(jì)劃于 2025 年晚些時(shí)候發(fā)布 Newton 的早期開源版本。這項(xiàng)合作將為迪士尼主題公園帶來更具表現(xiàn)力和精確性的機(jī)器人體驗(yàn)。
谷歌公司今天推出了兩款新型人工智能模型,Gemini Robotics和Gemini Robotics-ER,旨在為自主機(jī)器提供動(dòng)力。這些算法基于該公司Gemini 2.0系列的大型語言模型,能夠處理文本和視頻等多模態(tài)數(shù)據(jù),使得新模型能夠在決策時(shí)分析機(jī)器人攝像頭拍攝的畫面。
SXSW 2025年會(huì)在奧斯汀拉開帷幕,AI成為本屆大會(huì)的核心主題。從創(chuàng)作者經(jīng)濟(jì)到深科技,從氣候可持續(xù)發(fā)展到自動(dòng)駕駛,各領(lǐng)域的前沿技術(shù)將集中展示。TechCrunch將深入報(bào)道,捕捉科技生態(tài)系統(tǒng)的最新動(dòng)向,探討AI如何應(yīng)用于現(xiàn)實(shí)世界,并關(guān)注行業(yè)領(lǐng)袖的觀點(diǎn)。