四虎影视精品永久在线观看,中文字幕婷婷日韩欧美亚洲 ,婷婷成人综合激情在线视频播放,中文在线а√天堂,伊人久久大香线蕉成人

從黃仁勛CES全程高能演講,看英偉達(dá)龐大AI棋局:物理AI、AI PC、通用機(jī)器人

作者:周雅
2025-01-15

黃仁勛在會(huì)后接受包括至頂科技在內(nèi)的媒體采訪時(shí)所說:“英偉達(dá)只做兩類事情:要么是別人沒在做的,要么是我們能做得獨(dú)特且更好的!

NVIDIA創(chuàng)始人黃仁勛在CES 2025的全程高能演講,淺看是一場新品發(fā)布會(huì),實(shí)則是英偉達(dá)下了一步巨大的棋,這步棋關(guān)乎從云端到終端、從數(shù)據(jù)中心到普通用戶、從虛擬世界到物理世界的“全方位”AI發(fā)展路線,不過這個(gè)“全”帶了引號,因?yàn)橛ミ_(dá)試圖在每一個(gè)方向都去突破既有玩法的極限。

就像黃仁勛在會(huì)后接受包括至頂科技在內(nèi)的媒體采訪時(shí)所說:“英偉達(dá)只做兩類事情:要么是別人沒在做的,要么是我們能做得獨(dú)特且更好的。”

所以從這個(gè)角度,再回看那場發(fā)布會(huì),似乎是另外的基調(diào),所以這篇文章特此梳理黃仁勛這次演講背后的8個(gè)核心要點(diǎn)。

圖:出現(xiàn)在CES 2025舞臺上的黃仁勛,這次穿了件閃亮亮的皮衣,他開玩笑地對觀眾說道:“畢竟我在拉斯維加斯”。

要點(diǎn)一:“AI改變了游戲規(guī)則,更改變了計(jì)算的本質(zhì)”,所以用BlackWell重新定義AI計(jì)算的邊界。

黃仁勛開篇回顧了英偉達(dá)的發(fā)展歷程。

從1993年NV1開始,英偉達(dá)就立志,構(gòu)建能完成普通計(jì)算機(jī)無法完成任務(wù)的計(jì)算機(jī),當(dāng)時(shí)英偉達(dá)的編程架構(gòu)被稱為UDA(Unified Device Architecture,統(tǒng)一設(shè)備架構(gòu)),跑在UDA的第一個(gè)應(yīng)用程序,是世嘉的《虛擬戰(zhàn)士》。

六年后的1999年,NVIDIA發(fā)明了可編程GPU;又過了六年后的2006年,英偉達(dá)發(fā)明了通用并行計(jì)算架構(gòu)CUDA(Compute Unified Device Architecture);再過了六年后的2012年,隨著“師生三人組”Alex Krzyzewski、Ilya Suskevor和Jeffery Hinton利用GPU訓(xùn)練AlexNet,并贏得2012年ImageNet挑戰(zhàn)賽,震驚了計(jì)算機(jī)視覺界,AI由此進(jìn)入新階段。(這幾個(gè)6年歷程,老鐵見了都得直呼666)

黃仁勛認(rèn)為,AI發(fā)展有四個(gè)階段:

1、感知AI(Perception AI),理解圖像、文字和聲音,場景包括語音識別、推薦系統(tǒng)、醫(yī)學(xué)成像;

2、生成式AI(Generative AI),生成圖像、文本和聲音,場景包括數(shù)字營銷、內(nèi)容生成;

3、現(xiàn)階段的Agenic AI,能夠感知、推理、規(guī)劃和行動(dòng),場景包括代碼助理、客戶服務(wù)、患者護(hù)理;

4、未來的物理AI(Physical AI),場景包括自動(dòng)駕駛汽車、通用機(jī)器人。

2018年是一個(gè)關(guān)鍵的節(jié)點(diǎn),谷歌發(fā)布Transformer模型BERT,徹底改變了AI的格局。這里溫馨插入一段解釋,之所以說Transformer具有變革性,是因?yàn)樗氲淖⒁饬C(jī)制,解決了長序列數(shù)據(jù)處理的難題,且允許并行計(jì)算,打破了傳統(tǒng)RNN和LSTM的串行限制,它讓機(jī)器第一次真正學(xué)會(huì)了“看全局”。

如果說以前的AI是只能一個(gè)個(gè)字往下讀,但會(huì)看了后邊忘了前邊的兒童,而Transformer就是一目十行,心有全篇的專家。這個(gè)突破不僅讓AI更聰明,處理信息的速度也賊快。而且它厲害的地方是,不光能處理文字,連圖片、聲音這些都能應(yīng)對。所以說,Transformer就像是AI世界的“基本法”,徹底改變了AI的發(fā)展方向。

黃仁勛現(xiàn)場說:“Transformer驅(qū)動(dòng)的機(jī)器學(xué)習(xí)將從根本上改變每一個(gè)應(yīng)用程序的構(gòu)建方式、計(jì)算方式、以及超越這些的可能性。”

順著這句話,黃仁勛舉了個(gè)“AI革新傳統(tǒng)圖形渲染”的例子。傳統(tǒng)光線追蹤,要對每個(gè)像素進(jìn)行復(fù)雜計(jì)算,計(jì)算量巨大,但AI變革了這個(gè)過程——英偉達(dá)在游戲圖形領(lǐng)域完成了兩次根本性的革新:

第一次革新是引入可編程著色器和光線追蹤技術(shù),這讓顯卡能夠通過定制化的程序來處理像素,并模擬真實(shí)世界中的光線行為,從而生成極具真實(shí)感的畫面;第二次革新是DLSS(AI超分辨率技術(shù),Deep Learning Super Sampling),它的核心理念是讓AI來輔助甚至部分取代傳統(tǒng)的像素渲染,通過在英偉達(dá)超級計(jì)算機(jī)上進(jìn)行大規(guī)模訓(xùn)練,AI系統(tǒng)學(xué)會(huì)了理解和預(yù)測像素的顏色值,使得GPU上的神經(jīng)網(wǎng)絡(luò)能夠“腦補(bǔ)”出未經(jīng)實(shí)際渲染的像素內(nèi)容。

最新一代DLSS 4的突破,被黃仁勛稱之為“奇跡”,它不僅能在空間維度上補(bǔ)全像素,還能在時(shí)間維度上工作——通過預(yù)測未來畫面,為每一幀額外生成三幀畫面,就好比有3300萬像素,而實(shí)際只需計(jì)算200萬像素,并讓AI預(yù)測其余的3100萬像素,既保證了渲染質(zhì)量,又提升了渲染效率。在現(xiàn)場演示中,DLSS 4每秒247幀的速度渲染場景,比不使用AI快8倍以上,同時(shí)將延遲保持在僅34毫秒。

順著上述知識點(diǎn),黃仁勛發(fā)布了這次的第一款GPU新品——RTX Blackwell系列。

RTX Blackwell 系列擁有920億個(gè)晶體管,AI算力最高達(dá)4000 TOPS(比上一代高出三倍),美光G7內(nèi)存,帶寬可達(dá)每秒 1.8 TB(是上一代性能的2倍),F(xiàn)有的 RTX GPU 也將支持 DLSS 4。

該系列包括四種型號

  • RTX 5070——售價(jià)549 美元,提供 RTX 4090 的性能。

  • RTX 5070 Ti——售價(jià)749 美元,提供與 4090 相當(dāng)?shù)男阅埽鋫?1406 AI TOPS 和 16GB G7 內(nèi)存。

  • RTX 5080——售價(jià)999 美元,配備 1800 AI TOPS 和 16GB G7 內(nèi)存。

  • RTX 5090——售價(jià)1999 美元,配備 3404 AI TOPS 和 32GB G7 內(nèi)存。

搭載 RTX Blackwell GPU 的筆記本電腦,電池壽命延長 40%,性能提高一倍,功耗降低一半,價(jià)格從1299 美元到 2899 美元不等。其中,搭載RTX 5090、RTX 5080、RTX 5070 Ti的筆電將于3月上市,搭載RTX 5070筆電將于4月由OEM發(fā)售。

要點(diǎn)二:“Scaling Law依然奏效,正推動(dòng)AI計(jì)算需求的指數(shù)級增長”,所以用NVLink滿足全球數(shù)據(jù)中心需求。

接著講到AI發(fā)展,黃仁勛認(rèn)為Scaling Law(規(guī)模定律)還沒結(jié)束——即數(shù)據(jù)越多、模型越大、計(jì)算能力越強(qiáng)、模型就越有效。之所以還沒結(jié)束,是因?yàn)榛ヂ?lián)網(wǎng)每年產(chǎn)生的數(shù)據(jù)量都在翻倍,未來幾年人類產(chǎn)生的數(shù)據(jù)量將超過之前的總和,而且這些數(shù)據(jù)正變得多模態(tài)。

黃仁勛認(rèn)為,規(guī)模定律非但沒結(jié)束,而且還發(fā)展出三種狀態(tài):預(yù)訓(xùn)練規(guī)模定律(Pre-Training Scaling)、后訓(xùn)練規(guī)模定律(Post-Training Scaling)、測試時(shí)間規(guī)模定律(Test-Time Scaling)。

其中:

  • 「預(yù)訓(xùn)練規(guī)模定律」利用強(qiáng)化學(xué)習(xí)和人工反饋等技術(shù),AI借助人類反饋進(jìn)行學(xué)習(xí)提升,它可以針對特定領(lǐng)域微調(diào),類似學(xué)生根據(jù)老師指導(dǎo)改進(jìn)作業(yè),適合解決數(shù)學(xué)、推理問題。

  • 「后訓(xùn)練規(guī)模定律」則類似于自我練習(xí),AI通過持續(xù)自主練習(xí)提升能力,過程中雖耗費(fèi)大量算力,但能產(chǎn)生突破性模型。

  • 「測試時(shí)間規(guī)模定律」是指AI運(yùn)行時(shí),不再僅僅改進(jìn)參數(shù),而是能動(dòng)態(tài)掉配計(jì)算資源,通過“分步推理”和“深入思考”找出最優(yōu)解決方案。該定律已被證明極其有效。

黃仁勛說,“規(guī)模定律推動(dòng)了對英偉達(dá)的計(jì)算,特別是Blackwell芯片的巨大需求。”

圖:Blackwell全系產(chǎn)品圖

話音落下,黃仁勛搬出了一個(gè)由72塊Blackwell GPU組成的NVLink72巨型“盾牌”模型,還擺了個(gè)pose,被網(wǎng)友調(diào)侃“美國隊(duì)長”。

不過黃仁勛手里的“盾牌”,只是NVLink72的縮小模型,真正的NVLink72重達(dá)1.5噸,擁有60萬個(gè)零件,相當(dāng)于20輛汽車的復(fù)雜程度,系統(tǒng)內(nèi)部有個(gè)類似“脊椎”的結(jié)構(gòu),通過2英里的銅線與5000根電纜把所有的Blackwell連接在一起。

黃仁勛介紹了性能參數(shù)。一個(gè)NVLink72芯片的AI浮點(diǎn)運(yùn)算性能是1.4 ExaFLOPS,比世界上最大、最快的超級計(jì)算機(jī)還要大。其內(nèi)存帶寬達(dá)到 1.2 PB/s,相當(dāng)于全球所有互聯(lián)網(wǎng)流量的總和。這種超級計(jì)算能力,使得 AI 能夠處理更復(fù)雜的推理任務(wù),同時(shí)顯著降低成本,為更高效的計(jì)算奠定了基礎(chǔ)。

NVLink72的生產(chǎn)和部署過程十分復(fù)雜。它在全球45個(gè)工廠進(jìn)行生產(chǎn),采用液冷技術(shù)散熱,經(jīng)過嚴(yán)格測試后會(huì)被拆解成小部件,運(yùn)送到全球的數(shù)據(jù)中心,之后再重新組裝起來——這種特殊的運(yùn)輸方式是因?yàn)檎麢C(jī)太重太大。

黃仁勛解釋了“為什么要建造這塊龐然大物”,是因?yàn)镾caling Law要求越來越強(qiáng)大的計(jì)算能力。新一代Blackwell芯片與上一代相比,每瓦性能提升了4倍,每美元性能提高了3倍。這個(gè)提升帶來兩個(gè)重要影響

第一,從成本角度看,訓(xùn)練同樣規(guī)模的AI模型,成本可以降低到原來的1/3;或者用相同成本,可以訓(xùn)練規(guī)模大3倍的模型。

第二,從數(shù)據(jù)中心運(yùn)營角度看,由于數(shù)據(jù)中心受限于供電能力,新芯片的能效提升意味著,在相同供電條件下,數(shù)據(jù)中心可以進(jìn)行4倍于之前的AI運(yùn)算,這直接轉(zhuǎn)化為更高的營收能力。

黃仁勛強(qiáng)調(diào),這種提升非常重要,因?yàn)槲磥韼缀跛袘?yīng)用都會(huì)使用AI進(jìn)行文本處理(tokens)。目前大模型的token生成速度為每秒20-30個(gè),與人類閱讀速度相當(dāng)。但在未來,GPT-o1/o2/o3、Gemini Pro等新模型能夠進(jìn)行自我對話、思考、反思,因此token的生成速度將大幅提高,而這些處理都需要在數(shù)據(jù)中心進(jìn)行,他將這些數(shù)據(jù)中心比喻為“AI工廠”,而新一代芯片的能效提升,本質(zhì)上就是在提高這些“AI工廠”的生產(chǎn)效率。

要點(diǎn)三:“Agenic AI是企業(yè)最重要的變革之一”,所以英偉達(dá)軟硬兼施。

黃仁勛描繪了一個(gè)令人振奮的AI未來圖景——“Agenic AI將成為企業(yè)最重要的變革之一。”這種變革不僅是技術(shù)的進(jìn)步,更是工作方式的根本轉(zhuǎn)變。

在他的描述中,AI代理不再是簡單的問答系統(tǒng),而是一個(gè)復(fù)雜的智能網(wǎng)絡(luò),它能夠理解用戶需求,搜索信息、調(diào)用各種工具、并通過多個(gè)模型的協(xié)同工作,來幫助用戶解決問題。

為了幫助企業(yè)和合作伙伴實(shí)現(xiàn)Agenic AI的未來圖景,英偉達(dá)推出了三個(gè)重要產(chǎn)品

  • 第一個(gè)是NVIDIA NIMS,這是一套打包好的AI微服務(wù),包含CUDA DNN、Cutlass、Tensor RTLM、Triton等CUDA軟件,以及一系列模型(涵蓋語義理解、數(shù)字人、虛擬內(nèi)容生成、數(shù)字生物等領(lǐng)域,并即將上線“物理AI”模型),方便開發(fā)者集成到自身軟件中,可以在大部分云平臺上運(yùn)行。

  • 第二個(gè)是NVIDIA NEMO,這是一個(gè)“數(shù)字員工”管理系統(tǒng),負(fù)責(zé)訓(xùn)練AI智能體適應(yīng)企業(yè)特定需求、設(shè)置行為準(zhǔn)則和權(quán)限、并且通過反饋不斷改進(jìn),就像是給AI代理做“入職培訓(xùn)”。

  • 第三是一整套AI Blueprints(AI藍(lán)圖),以便生態(tài)系統(tǒng)伙伴和開發(fā)者自主構(gòu)建AI智能體,而且它完全開源。黃仁勛介紹了其中的一套模型——Llama Nemotron開源模型套件,這是一個(gè)企業(yè)級語言模型的“全家桶”,是英偉達(dá)針對Meta的Llama進(jìn)行微調(diào)而成(黃仁勛解釋說,是因?yàn)橛ミ_(dá)發(fā)現(xiàn)Llama 3.1已經(jīng)成為一個(gè)現(xiàn)象級產(chǎn)品,它被下載65萬次,衍生出了6萬個(gè)不同版本,是大部分企業(yè)研發(fā)AI的開始,而且可以它能被很好地微調(diào))。

英偉達(dá)的Llama Nemotron包括三種規(guī)格:

  • Nano:極其小巧、響應(yīng)快、最具成本效益的模型,針對PC和邊緣設(shè)備所需的低時(shí)延模型進(jìn)行了優(yōu)化;

  • Super:在單個(gè)GPU上提供卓越吞吐量的高精度模型;

  • Ultra:精度最高的模型,專為要求最高性能的數(shù)據(jù)中心規(guī)模應(yīng)用而設(shè)計(jì)。

黃仁勛預(yù)測,未來企業(yè)的IT部門將轉(zhuǎn)變成AI智能體的HR部門,它們不再僅僅是維護(hù)軟件系統(tǒng),而是要管理一支數(shù)字勞動(dòng)力隊(duì)伍。全球有3000萬程序員和10億知識工作者將受益于這場變革,AI智能體將成為他們的得力助手。

這種AI智能體帶來的變革,正在影響各行各業(yè),黃仁勛在現(xiàn)場通過一支視頻展示了5種AI代理的應(yīng)用場景:

  • AI研究助手:在研究領(lǐng)域,AI智能體可以快速處理講座、期刊、財(cái)報(bào)等復(fù)雜資料,生成易于理解的內(nèi)容;

  • 天氣預(yù)報(bào)系統(tǒng):在氣象預(yù)報(bào)中,AI智能體將預(yù)報(bào)精度從25公里提升到2公里;

  • 軟件安全AI:在軟件開發(fā)過程中,AI智能體可以自動(dòng)掃描代碼漏洞并提出修復(fù)建議;

  • 虛擬實(shí)驗(yàn)室:在制藥研究中,AI智能體可以幫助研究人員快速篩選藥物候選物,加速新藥研發(fā)過程。

英偉達(dá)選擇了一條獨(dú)特的市場路徑。他們不直接面向企業(yè)用戶,而是與生態(tài)系統(tǒng)的合作伙伴一起工作,就像當(dāng)年推廣CUDA一樣。生態(tài)系統(tǒng)中的合作伙伴有CrewAI、Daily、LangChain、LlamaIndex、Weights & Biases的工具,也有ServiceNow、SAP、西門子的工業(yè)平臺,也有甲骨文、dataloop的數(shù)據(jù)平臺等。英偉達(dá)正在將AI代理滲透到各個(gè)行業(yè)。

這個(gè)戰(zhàn)略顯示了英偉達(dá)對未來AI的深刻理解:AI代理不僅是一個(gè)技術(shù)產(chǎn)品,而是企業(yè)的“數(shù)字員工”,它們需要培訓(xùn)、管理和持續(xù)改進(jìn),就像管理人類員工一樣,這些AI代理可被訓(xùn)練為領(lǐng)域特定的任務(wù)專家。

通過這番演講,黃仁勛展現(xiàn)了一個(gè)AI代理與人類協(xié)同工作的未來。在這個(gè)未來中,企業(yè)將擁有一支由人類+AI代理組成的勞動(dòng)力隊(duì)伍,該隊(duì)伍是推動(dòng)生產(chǎn)力提升的重要力量,而英偉達(dá)正在通過完整的技術(shù)方案和生態(tài)系統(tǒng)建設(shè),來幫助企業(yè)實(shí)現(xiàn)這個(gè)未來。

要點(diǎn)四:“將Windows PC轉(zhuǎn)變?yōu)锳I超級計(jì)算機(jī)”,所以英偉達(dá)發(fā)布了WSL2。

說完了Agenic AI的愿景之后,如何才能真正落地呢?黃仁勛的答案是——本地算力

“雖然云端計(jì)算對AI 來說是完美的選擇,但AI的未來不應(yīng)該僅限于云端,而是應(yīng)該無處不在,特別是要進(jìn)入我們的個(gè)人電腦。就像Windows 95革新了個(gè)人計(jì)算時(shí)代一樣,未來的PC將開創(chuàng)新的計(jì)算范式,讓每個(gè)用戶都能夠充分利用AI的力量來提升工作效率和創(chuàng)造力。”

從這個(gè)角度來看,黃仁勛介紹了未來PC的概念:不再只是簡單地?fù)碛?D、聲音和視頻API,而是要具備各種生成式API的能力(包括3D生成、語言生成、聲音生成等),這意味著每臺電腦都將成為一個(gè)強(qiáng)大的AI助手。

英偉達(dá)提供了一個(gè)解決方案:Windows WSL2(Windows Subsystem for Linux 2),這是一個(gè)Window系統(tǒng)內(nèi)的雙操作系統(tǒng),為開發(fā)者提供直接訪問硬件的能力,并且已經(jīng)針對云原生應(yīng)用和CUDA進(jìn)行了優(yōu)化,這使得包括NVIDIA NIMS、NVIDIA NEMO在內(nèi)的所有AI工具都能在Windows PC上運(yùn)行。

通過WSL2,英偉達(dá)可以將其所有AI工具和服務(wù)帶到個(gè)人電腦上,包括各種模型。換句話說,這是一種計(jì)算范式的轉(zhuǎn)變——每臺個(gè)人電腦都將成為一個(gè)強(qiáng)大的AI工作站。

要點(diǎn)五:“我們要?jiǎng)?chuàng)造一個(gè)物理世界的AI模型”,所以英偉達(dá)發(fā)布Cosmos。

黃仁勛接下來的演講內(nèi)容,我認(rèn)為是本場最重要也是英偉達(dá)接下來最重要的戰(zhàn)略布局,我覺得可以理解為“讓AI化形”

什么意思?如果說GPT等大語言模型讓AI掌握了“說”的能力,那么英偉達(dá)希望創(chuàng)造一個(gè)能理解物理世界的AI系統(tǒng),賦予AI“做”的能力,這預(yù)示著AI即將從虛擬世界走向現(xiàn)實(shí)世界的重要一步。

接下來我們就逐步來講講。

黃仁勛首先說,當(dāng)我們使用ChatGPT這樣的語言模型時(shí),我們輸入一段提示詞,模型會(huì)分析這段文字中的每個(gè)詞語(token)之間的關(guān)系,然后一個(gè)接一個(gè)地生成回答的詞語。這個(gè)過程看似簡單,實(shí)際上模型內(nèi)部有數(shù)十億個(gè)參數(shù)在運(yùn)作,每個(gè)詞語都要和上下文中的其他詞語建立聯(lián)系,計(jì)算它們之間的相關(guān)性。

但是,我們生活的現(xiàn)實(shí)世界比文本復(fù)雜得多,AI需要理解重力、摩擦力、慣性等物理規(guī)律,還要明白空間關(guān)系和因果關(guān)系。比如,當(dāng)你把球推出去時(shí),它會(huì)如何運(yùn)動(dòng);當(dāng)你推倒一個(gè)物體時(shí),會(huì)發(fā)生什么;物體從桌子上掉下去后,并不會(huì)消失——這些在人類看來很簡單的常識,對AI來說都是巨大的挑戰(zhàn)。

為了達(dá)成這個(gè)極具挑戰(zhàn)性的“讓AI理解物理世界”目標(biāo),于是英偉達(dá)正式推出Cosmos——一個(gè)強(qiáng)大的、能理解物理世界的、全球基礎(chǔ)模型。

Cosmos是如何工作的?就像嬰兒通過觀察、觸摸、實(shí)驗(yàn)來認(rèn)識這個(gè)物理世界,Cosmos通過看大量視頻來學(xué)習(xí)物理世界的規(guī)律,就像是一個(gè)加速學(xué)習(xí)的嬰兒。黃仁勛說,Cosmos已經(jīng)學(xué)習(xí)了2000萬小時(shí)的視頻,內(nèi)容包括:自然現(xiàn)象(水會(huì)怎么流動(dòng))、物理規(guī)律(物體會(huì)如何碰撞)、人類動(dòng)作(人是如何走路和抓取物品的)等。這些都成為它理解物理世界的“經(jīng)驗(yàn)”。

但是,Cosmos的作用遠(yuǎn)不止于此。黃仁勛說,因?yàn)橛蠧osmos,我們可以因此創(chuàng)造一個(gè)物理世界的基礎(chǔ)模型,基于Autoregressive Model(自回歸模型)、Diffusion Model(擴(kuò)散模型)、Video Tokenizer(將視頻內(nèi)容編碼為緊湊的潛在token)、Video Processing and Curation Pipeline(視頻處理管道)。

比如,它可以用來生成訓(xùn)練數(shù)據(jù),幫助開發(fā)更智能的機(jī)器人,被黃仁勛比喻成“機(jī)器人的種子”;它能生成多種未來的物理場景,幫助AI做出更好的決策,“就像是一個(gè)奇異博士”;它甚至可以為視頻生成準(zhǔn)確的描述,這些描述又可以用來訓(xùn)練語言模型。

最重要的是,英偉達(dá)選擇將Cosmos開源,就像Meta開源Llama一樣。黃仁勛表示,希望Cosmos能為機(jī)器人和工業(yè)AI領(lǐng)域帶來類似Llama 3.1對企業(yè)AI的革命性影響。

現(xiàn)在關(guān)鍵來了:當(dāng)Cosmos與英偉達(dá)的虛擬現(xiàn)實(shí)仿真平臺Omniverse結(jié)合時(shí),這就像是給AI創(chuàng)造了一個(gè)“物理世界的實(shí)驗(yàn)場”,讓它能在這里學(xué)習(xí)、實(shí)驗(yàn)和成長,它就能創(chuàng)造出基于真實(shí)物理規(guī)律的虛擬世界。

這里梳理一下黃仁勛的解釋:Omniverse是一個(gè)基于物理規(guī)律運(yùn)行的模擬器,而Cosmos則可以理解為一個(gè)物理世界的AI生成系統(tǒng)。當(dāng)這兩個(gè)系統(tǒng)結(jié)合時(shí),這就像是我們在用大語言模型時(shí),通過RAG(檢索增強(qiáng)生成)系統(tǒng)來確保AI生成的內(nèi)容是基于真實(shí)信息一樣。在這里,Omniverse的物理模擬確保了Cosmos生成的內(nèi)容符合現(xiàn)實(shí)世界的物理規(guī)律。

黃仁勛用了一個(gè)很好的類比:就像我們需要讓語言模型的輸出建立在真實(shí)信息的基礎(chǔ)上一樣,我們也需要讓機(jī)器人的行為建立在真實(shí)物理規(guī)律的基礎(chǔ)上,這樣的結(jié)合創(chuàng)造出了一個(gè)“基于物理規(guī)律的多元宇宙生成器”。

在實(shí)際應(yīng)用中,這種結(jié)合特別適合機(jī)器人和工業(yè)應(yīng)用場景。正因?yàn)槿绱,黃仁勛提出了一個(gè)“三個(gè)計(jì)算機(jī)系統(tǒng)”概念

  • 第一個(gè)計(jì)算機(jī)系統(tǒng)(DGX)是用來訓(xùn)練AI的。這就像是機(jī)器人的“學(xué)校”,在這里進(jìn)行基礎(chǔ)的AI訓(xùn)練。

  • 第二個(gè)計(jì)算機(jī)系統(tǒng)(AGX)是部署在實(shí)際場景中的,比如安裝在自動(dòng)駕駛汽車?yán)、機(jī)器人身上或者體育場館中的計(jì)算機(jī)。這些是在“前線”工作的計(jì)算機(jī),負(fù)責(zé)實(shí)際的自主操作。

  • 第二個(gè)計(jì)算機(jī)系統(tǒng)正是Omniverse+Cosmos系統(tǒng),它是一個(gè)數(shù)字孿生平臺。這就像是機(jī)器人的“虛擬訓(xùn)練場”。在這里,已經(jīng)訓(xùn)練好的AI可以進(jìn)行練習(xí)、完善,通過合成數(shù)據(jù)生成和強(qiáng)化學(xué)習(xí),來提升性能。這個(gè)系統(tǒng)將前兩個(gè)系統(tǒng)連接起來,使它們能夠協(xié)同工作。

為什么需要Cosmos+Omniverse?因?yàn)榧僭O(shè)你在教一個(gè)孩子學(xué)物理,不可能讓孩子去做所有危險(xiǎn)的實(shí)驗(yàn),比如從高處跳下來感受重力,或者去碰滾燙的物體了解溫度。而Omniverse就提供了一個(gè)“虛擬實(shí)驗(yàn)場”:比如可以無限嘗試各種動(dòng)作,而不用擔(dān)心損壞真實(shí)設(shè)備;或者,快速模擬數(shù)千種不同的場景,而不用擔(dān)心時(shí)間不夠;或者測試各種極端情況,而不用承擔(dān)實(shí)際風(fēng)險(xiǎn)。

這種組合的強(qiáng)大之處還在于:一方面,就算AI出錯(cuò),也不會(huì)造成實(shí)際損失,可以立即重來。另一方面,Cosmos通過觀察視頻學(xué)習(xí)到的“經(jīng)驗(yàn)”,可以在Omniverse中得到驗(yàn)證和完善。

黃仁勛特別強(qiáng)調(diào)了Omniverse+Cosmos系統(tǒng)在工業(yè)領(lǐng)域的重要性:“全球制造業(yè)大約有50萬億美元的規(guī)模,包括數(shù)以百萬計(jì)的工廠和數(shù)十萬個(gè)倉庫,這些設(shè)施都需要向軟件定義和自動(dòng)化方向發(fā)展。無論是工廠的自動(dòng)化系統(tǒng),還是自動(dòng)駕駛汽車,都需要這樣的系統(tǒng),來保證其行為既符合AI的智能決策,又符合現(xiàn)實(shí)世界的物理規(guī)律。”

圖:英偉達(dá)Omniverse的合作伙伴生態(tài)系統(tǒng)

也因此,黃仁勛預(yù)測:工業(yè)生產(chǎn)正在向數(shù)字化、智能化方向發(fā)展,數(shù)字孿生將成為未來每一個(gè)工廠的標(biāo)配,它就像工廠的“虛擬分身”,能夠完全模擬真實(shí)工廠的運(yùn)作,通過Omniverse+Cosmos系統(tǒng),可以模擬出多種未來可能的運(yùn)營方案,然后讓AI選擇最優(yōu)方案,這些方案會(huì)成為真實(shí)工廠的運(yùn)營指導(dǎo)。

要點(diǎn)六:“三個(gè)計(jì)算機(jī)系統(tǒng)”理論構(gòu)筑自動(dòng)駕駛未來,所以英偉達(dá)帶來了Thor。

接著,黃仁勛談到了自動(dòng)駕駛革命,又秀出一張生態(tài)合作圖,展示了英偉達(dá)在自動(dòng)駕駛領(lǐng)域的廣泛合作,覆蓋Waymo、特斯拉、捷豹路虎、奔馳、豐田,還有比亞迪、理想、小鵬等眾多中國車企。

黃仁勛提供了一組數(shù)據(jù):全球每年生產(chǎn)1億輛汽車,道路上有10億輛車,每年行駛里程達(dá)到1萬億英里。他預(yù)測,“這些車輛未來都將實(shí)現(xiàn)高度自動(dòng)化或完全自動(dòng)化駕駛,這代表自動(dòng)駕駛很可能成為第一個(gè)萬億美元級別的機(jī)器人產(chǎn)業(yè)。”目前,僅僅是少量開始量產(chǎn)的自動(dòng)駕駛汽車,就已經(jīng)為英偉達(dá)帶來了40億美元收入規(guī)模,預(yù)計(jì)今年將達(dá)到50億美元。

針對于此,英偉達(dá)這次發(fā)布了新一代車載處理器Thor。

圖:英偉達(dá)Thor

這款芯片的處理能力是上一代Orin的20倍。在安全方面,DRIVE OS獲得了ASIL-D認(rèn)證,這是汽車功能安全的最高標(biāo)準(zhǔn),這背后凝聚了約15000個(gè)工程年的努力,使CUDA發(fā)展成為一個(gè)功能完備、安全可靠的自動(dòng)駕駛計(jì)算平臺。

要點(diǎn)七:“通用機(jī)器人的ChatGPT時(shí)刻來臨”,所以英偉達(dá)用ISAAC Groot重新定義機(jī)器人開發(fā)。

談到機(jī)器人變革,黃仁勛說了一句金句:“通用機(jī)器人的ChatGPT時(shí)刻來臨”,并指出了三種最有前景的機(jī)器人類型,這三種機(jī)器人的獨(dú)特之處在于,它們不需要特殊的環(huán)境改造,可以直接在我們現(xiàn)有的世界中使用:

1、通用型AI或AI代理:因?yàn)樗鼈兪切畔⒐ぷ髡,只要能適應(yīng)我們現(xiàn)有的辦公環(huán)境和電腦系統(tǒng),就可以工作。

2、自動(dòng)駕駛汽車:因?yàn)槿祟愐呀?jīng)花了一百多年建設(shè)道路和城市,這些基礎(chǔ)設(shè)施已經(jīng)完備。

3、人形機(jī)器人:可以直接適應(yīng)為人類設(shè)計(jì)的所有環(huán)境和工具。

黃仁勛認(rèn)為,如果這三種機(jī)器人技術(shù)獲得突破,將創(chuàng)造人類歷史上最大的科技產(chǎn)業(yè)。

但他也指出了當(dāng)前面臨的關(guān)鍵挑戰(zhàn),特別是在人形機(jī)器人的訓(xùn)練方面,與自動(dòng)駕駛汽車不同(我們每天都在產(chǎn)生大量的駕駛數(shù)據(jù)),收集人類動(dòng)作示范數(shù)據(jù)是非常耗時(shí)費(fèi)力的。

為了解決這個(gè)問題,英偉達(dá)提出了一個(gè)創(chuàng)新方案——ISAAC Groot平臺,這是一個(gè)面向人形機(jī)器人開發(fā)的完整解決方案。

該平臺的創(chuàng)新之處在于其獨(dú)特的數(shù)據(jù)獲取和訓(xùn)練方法:開發(fā)者可以使用Apple Vision Pro進(jìn)行遠(yuǎn)程操作來捕獲數(shù)據(jù),通過少量人類示范就能生成大規(guī)模訓(xùn)練數(shù)據(jù),并利用Omniverse+Cosmos進(jìn)行領(lǐng)域隨機(jī)化和3D真實(shí)感放大,這是一種AI訓(xùn)練方法的創(chuàng)新。

這個(gè)環(huán)節(jié)其實(shí)也揭示了機(jī)器人領(lǐng)域的重大變革:我們正在從專用機(jī)器人向通用機(jī)器人過渡,而這個(gè)轉(zhuǎn)變的關(guān)鍵在于如何高效地訓(xùn)練這些機(jī)器人,通過AI和虛擬仿真技術(shù)的結(jié)合,我們可以大大加速這個(gè)過程。

要點(diǎn)八:“每個(gè)用計(jì)算機(jī)的人,都需要AI超級計(jì)算機(jī)”,所以英偉達(dá)用“DIGITS”開啟個(gè)人AI超算的新紀(jì)元。

作為壓軸的重磅產(chǎn)品,黃仁勛介紹了公司內(nèi)部的一個(gè)項(xiàng)目“Project DIGITS”,展現(xiàn)了將企業(yè)級AI計(jì)算能力帶入個(gè)人桌面的雄心。

首先,黃仁勛解釋了項(xiàng)目名字的由來。最初項(xiàng)目叫DIGITS”(Deep Learning GPU Intelligence Training System,深度學(xué)習(xí)GPU智能訓(xùn)練系統(tǒng)),后來為了與公司其他產(chǎn)品線(如RTX、AGX等)保持一致,簡化為DGX。

DGX-1的推出是一個(gè)革命性的轉(zhuǎn)折點(diǎn)。在此之前,如果想要使用超級計(jì)算機(jī),你需要建設(shè)專門的設(shè)施和基礎(chǔ)設(shè)施,這對大多數(shù)機(jī)構(gòu)來說都是難以實(shí)現(xiàn)的。而DGX-1改變了這一切,它是一臺“開箱即用”的AI超級計(jì)算機(jī)。黃仁勛還特別提到,2016年他們將第一臺DGX-1交付給了OpenAI,當(dāng)時(shí)包括馬斯克、Ilya Sutskever在內(nèi)的團(tuán)隊(duì)都在場。

圖:英偉達(dá)DGX-1

但現(xiàn)在情況不一樣了,AI的應(yīng)用已經(jīng)不再局限于研究機(jī)構(gòu)或創(chuàng)業(yè)公司。正如黃仁勛在演講開始時(shí)提到的,AI計(jì)算正成為新的計(jì)算方式、新的軟件開發(fā)方式,每個(gè)軟件工程師、工程師、創(chuàng)意藝術(shù)家,實(shí)際上是每個(gè)用計(jì)算機(jī)的人,都需要AI超級計(jì)算機(jī)。

因此,英偉達(dá)希望能做出比DGX-1更小的設(shè)備,于是正式發(fā)布“Project DIGITS”一個(gè)小型化的AI超級計(jì)算機(jī)。

圖:英偉達(dá)“Project DIGITS”

該產(chǎn)品基于英偉達(dá)的GB110芯片(最小的Grace Blackwell芯片),通過與MediaTek合作開發(fā)CPU,并采用NVLink連接到Blackwell GPU,實(shí)現(xiàn)了前所未有的性能突破。

圖:英偉達(dá)“Project DIGITS”的內(nèi)部結(jié)構(gòu)

它的設(shè)計(jì)理念,是成為一個(gè)放在桌面上的云計(jì)算平臺,無論你的PC是什么系統(tǒng)都能連接使用,也可以作為Linux工作站使用,支持ConnectX和GPU Direct等技術(shù),是一臺袖珍版的超級計(jì)算機(jī)。預(yù)計(jì)將在2025年5月上市。

換句話說,英偉達(dá)正在將高性能計(jì)算從專業(yè)數(shù)據(jù)中心,帶入普通用戶的辦公桌面,這種小型化、便攜化的AI超級計(jì)算機(jī),可能會(huì)像個(gè)人電腦革命一樣,讓更多人使用AI技術(shù)進(jìn)行創(chuàng)新和開發(fā)。

本文章選自《AI啟示錄》雜志,閱讀更多雜志內(nèi)容,請掃描下方二維碼

《AI啟示錄》雜志