富途牛牛头条 06月11日 22:20
黃仁勳GTC大會演講全文:量子計算正迎來拐點,計劃在歐洲新建20家「人工智能工廠」
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

英偉達(NVIDIA)在巴黎GTC大會上,展示了其AI工廠的藍圖,強調AI工廠不再僅僅是數據存儲中心,而是能夠產生智能、創造價值的生產設施。該藍圖基於英偉達的Omniverse平台,利用Cadence的數字孿生技術優化設計和運營。核心是新一代Blackwell架構,其NVLink技術實現了驚人的130TB/秒內部連接帶寬,大幅提升AI處理速度。此外,英偉達還在量子計算領域發力,並加強與歐洲夥伴的合作,推動AI技術中心建設。黃仁勳強調,英偉達提供從芯片、軟件到系統的全棧平台,賦能全球開發者和企業。

💡英偉達AI工廠基於Omniverse藍圖構建,利用Cadence的數字孿生平台進行設計和優化,旨在打造更智能、更可靠的設施。

🚀Blackwell架構是AI工廠的核心,其NVLink技術提供130TB/秒的內部連接帶寬,大幅提升AI處理速度和效率。

⚛️英偉達看好量子計算,並在Grace Blackwell 200芯片上搭載CUDA-Q軟件工具包,加速量子算法,預測量子計算將更加穩健、高性能和有韌性。

🤝英偉達加強與歐洲夥伴合作,推動AI技術中心建設,轉變歐洲製造業,從模擬產品設計到人工智能驅動的運營和物流,實現端到端產品生命週期優化。

該人工智能工廠將按照英偉達Omniverse藍圖中突出顯示的框架進行建設,用於人工智能工廠的設計和運營。作爲該藍圖的一部分,Cadence的現實數字孿生平台將被用於在物理上精確的虛擬環境中模擬和優化整個人工智能工廠,使工程團隊能夠建造一個更智能、更可靠的設施。

他表示,未來的數據中心不再僅僅是存儲文件和數據的倉庫,而是能夠產生智能、創造價值的生產設施。這些AI工廠的核心任務是生產「智能通證(intelligent tokens)」,就像發電廠產生電力一樣,爲各行各業提供動力,開啓一場新的工業革命。

爲支撐AI工廠的龐大算力需求,黃仁勳詳細介紹了英偉達的新一代架構Blackwell。他將GB200系統形容爲一臺專爲思考而生的「思維機器」,其設計初衷就是爲了應對AI模型日益增長的「推理」需求。該系統通過全新的NVLink技術實現內部連接,其背板帶寬高達驚人的130TB每秒,超過了全球互聯網的峰值流量。黃仁勳指出,正是這種架構上的巨大飛躍,使得AI的思考速度和處理能力得以實現數十倍的代際性能提升。

黃仁勳還表示,量子計算正迎來拐點。英偉達將在Grace Blackwell 200芯片上搭載CUDA-Q軟件工具包。量子算法堆棧可以在Blackwell200上加速。他預測量子系統將快速變得"更加穩健、高性能和有韌性"。

量子計算機的核心優勢在於並行處理能力——傳統計算機的比特只能是0或1,必須按順序處理,而量子計算機的量子比特可以保持"疊加態",在整個計算完成前不被賦值,從而實現協同工作而非獨立運算。

值得注意的是,今年1月,這位AI教父還在潑冷水,聲稱"非常有用"的量子計算機可能還需要幾十年才能實現。而包括微軟和谷歌在內的科技巨頭已經在這個領域耕耘數十年,技術難題和高昂成本一直讓實用化系統停留在實驗階段。

作爲在歐洲的重磅活動,黃仁勳特別強調了與歐洲夥伴的深度合作。英偉達還宣佈,包括寶馬集團、瑪莎拉蒂、梅賽德斯-奔馳和舍弗勒在內的歐洲製造商正在通過運行來自ANSYS、Cadence和西門子等軟件領導者提供的英偉達加速應用,轉變其從模擬產品設計和工廠規劃到人工智能驅動的運營和物流的端到端產品生命週期。

他透露,英偉達正在七個不同的國家建立AI技術中心,以推動當地的生態系統建設和合作研發。黃仁勳總結道,一個全新的計算時代已經開啓,而英偉達正通過提供從芯片、軟件到系統和AI模型的全棧平台,賦能全球的開發者和企業抓住這次機遇。

這是英偉達在巴黎的首次GTC大會。這太令人難以置信了。感謝所有合作伙伴與我們一同出席。多年來,我們與衆多夥伴合作,雖然這是我第一次在巴黎舉辦GTC,但我有很多內容要和大家分享。

英偉達曾經想要打造一個全新的計算平台,去做普通計算機無法做到的事情。我們加速了CPU,創造了一種名爲加速計算的新計算方式,而我們最早的應用之一是分子動力學。從那時起,我們已經取得了長足的進步,開發出許多不同的庫。事實上,加速計算的特別之處在於,它不僅僅是一個新的處理器,你可以軟件將編譯到上面。你必須重新思考如何進行計算,重新設計你的算法。事實證明,讓人們將軟件和算法重新設計爲高度並行化是非常困難的。因此,我們爲每個市場、每個應用領域開發了庫,以實現加速。這些庫爲開發者開闢了新的機會,也爲我們和我們的生態系統合作伙伴帶來了新的增長機會。

計算光刻技術可能是當今半導體設計中最重要的應用之一,它在臺積電、三星等大型半導體工廠中運行。在芯片製造之前,它會通過一個逆物理算法,即計算光刻技術、直接稀疏求解器、代數多重網格求解器——我們剛剛開源了一個非常令人興奮的應用庫。這個庫加速了決策制定,優化了具有數百萬變量和數百萬約束條件的問題,例如旅行商問題。

Warp是一個用於表達幾何和物理求解器的Python框架,非常重要。cuDF、cuML用於結構化數據庫、數據框和經典機器學習算法。cuDF可以加速Spark,無需修改代碼。cuML可以加速scikit-learn,同樣無需修改代碼。還有Triton和cuDNN。cuDNN可能是英偉達有史以來最重要的庫之一,它加速了深度神經網絡的基本原語。而Triton是我們全新的庫,能夠在整個AI工廠中調度、協調和分配極其複雜的推理工作負載。

cuPy等變性和cuTensor收縮算法。等變性是用於遵循幾何定律的神經網絡,例如蛋白質、分子,這是一個非常重要的框架,能夠支持AI在6G Earth 2中運行,這是我們的天氣和氣候模型基礎模型的模擬環境,分辨率極高,達到平方公里級別。

MONAI是我們的醫學成像框架,非常受歡迎。Parabricks求解器用於基因組學分析,也非常成功。CUDA Quantum(CUDA-Q),我稍後會詳細說明,用於量子計算,以及CuPy用於加速NumPy和SciPy的數值計算。正如大家所見,這些只是部分庫的例子。我們還有400多個其他庫,每個庫都加速了一個應用領域,每個庫都帶來了新的機會。其中最令人興奮的是CUDA-Q。CUDA-Q是一套用於加速應用和算法的庫。在CUDA的基礎上,我們現在有了CUDA-Q,用於量子計算,基於GPU的經典量子計算。

我們已經研究CUDA-Q好幾年了。今天,我可以告訴大家量子計算正在迎來一個轉折點。正如大家所知,第一個物理量子比特大約在30年前被展示出來,1995年發明了一種糾錯算法,而在2023年,也就是近30年後,谷歌展示了世界上第一個邏輯量子比特。從那以後,又過了幾年,邏輯量子比特的數量開始增長,它們由許多帶有糾錯功能的物理量子比特組成,就像摩爾定律一樣。我可以完全預期,每五年邏輯量子比特的數量會增加10倍,每十年增加100倍。這些邏輯量子比特將具備更好的糾錯能力,更加穩健、性能更高、更具韌性,並且當然會繼續可擴展。

量子計算正在迎來一個轉折點。我們與世界各地的量子計算公司以多種方式合作。但在歐洲,這裏有一個龐大的社區。昨晚我見到了帕斯卡爾,還見到了巴塞羅那超級計算中心的團隊。

現在,我們已經接近能夠在未來幾年內將量子計算(量子經典計算)應用於解決一些有趣問題的領域。這是一個非常令人興奮的時刻。因此,我們與所有超級計算中心都進行了合作。

現在非常清楚的是,在未來幾年,或者至少在下一代超級計算機中,每一臺都將配備一個量子處理單元(QPU),並且QPU將與GPU相連。QPU將用於量子計算,而GPU將用於預處理、控制和糾錯,這些任務的計算強度極高。在兩種架構之間進行後處理等任務,就像我們加速了CPU一樣,現在QPU與GPU協同工作,推動下一代計算的發展。

今天,我們宣佈我們的整個量子算法棧已經在Grace Blackwell 200上加速,其加速效果令人難以置信。我們以多種方式與量子計算行業合作。其中一種方式是使用KU量子來模擬量子比特或模擬運行在這些量子計算機上的算法,本質上是用經典計算機來模擬或仿真量子計算機。在另一個極端,非常重要的是CUDA-Q。基本上是發明了一種新的CUDA,將CUDA擴展到量子經典計算中。因此,在量子計算機到來之前,開發在CUDA-Q上的應用可以以仿真方式運行,而在量子計算機到來之後,可以以協作方式運行,採用量子經典加速計算方法。今天,我們宣佈CUDA-Q已可用於Grace Blackwell。這裏的生態系統非常豐富,當然,歐洲在科學、超級計算專長以及這一領域的傳承方面都底蘊深厚。在未來幾年看到量子計算在這裏取得進展並不令人意外。我們將迎來一個非常精彩的轉折點。總之,對於過去三十年來一直致力於量子計算行業的所有人,我祝賀你們今天取得的驚人成就和里程碑。謝謝。

讓我們來談談人工智能。你可能會驚訝於我會和你們談論人工智能。我剛才提到的那些應用所使用的同一種GPU,也推動了人工智能走向世界。我們首次接觸是在2012年。就在那之前,我們與開發人員合作,研究一種名爲深度學習的新算法,並促成了2012年AlexNet引發的人工智能大爆炸。在過去大約15年裏,人工智能發展得非常迅速。

第一波人工智能是計算機的感知能力,讓計算機能夠識別信息並理解它。第二波人工智能,也就是我們過去五六年一直在談論的,是生成式人工智能。它是多模態的,意味着人工智能能夠同時學習圖像和語言。因此,你可以用語言提示它,它就能生成圖像。人工智能的多模態能力以及其翻譯和生成內容的能力推動了生成式人工智能革命。生成式人工智能生成內容的能力對我們提高生產力至關重要。

我們現在開啓了人工智能的新一波浪潮。在過去的幾年裏,我們看到了人工智能能力的巨大進步。從根本上說,智能是關於理解、感知、推理、規劃任務、解決如何解決問題,然後執行任務。感知、推理、規劃,這些是智能的基本循環。它使我們能夠應用一些以前學到的規則來解決我們從未見過的問題。這就是爲什麼聰明的人被認爲聰明,他們能夠將一個複雜的問題分解爲逐步解決的步驟,推理如何解決問題,也許去做一些研究,也許去學習一些新信息,尋求幫助,使用工具,逐步解決問題。

我剛才描述的這些能力,如今通過所謂的代理人工智能(Agentic AI)已經成爲可能。我馬上會向你們展示其物理實現,也就是代理人工智能的具象化和運動。

現在,生成能力正在生成運動。它不再是生成視頻、圖像或文本,而是生成局部運動,比如行走、伸手抓取東西、使用工具的能力。人工智能以物理形式具象化,本質上就是機器人技術。這些能力,即實現信息機器人(代理)和具象化人工智能(物理機器人)的基礎技術,如今已經到來。

這是人工智能令人激動的時代,但一切始於Ge Force,Ge Force帶來了計算機圖形學。這是我們曾經從事過的第一個加速計算應用,計算機圖形學的發展令人難以置信。Ge Force將CUDA帶給了世界,這使得機器學習和人工智能研究人員能夠推動深度學習的發展。隨後,深度學習徹底改變了計算機圖形學,使我們能夠將計算機圖形學提升到一個全新的水平。

今天我要展示給你們的一切,我要提前給大家劇透一下,但今天我要展示的全部是計算機模擬,而不是動畫,是光子模擬、物理模擬、粒子模擬。所有的一切本質上都是模擬,而不是動畫,也不是藝術。它看起來非常美,是因爲這個世界本身就是美的,數學也是美的。讓我們來看看吧。

這就是數字在發揮作用,這本質上就是模擬的本質。看着它非常令人賞心悅目。但正是由於我們現在能夠以如此大規模和高速度模擬幾乎所有事物,我們可以將一切轉化爲數字孿生。因爲一切都可以成爲數字孿生,所以它可以在進入物理世界之前,完全以可視化的方式進行設計、規劃、優化和操作。我們現在正處於這樣一個時代:我們將一切構建於軟件之中。所有物理實體都將通過數字化構建,所有宏偉的建築都將通過數字化構建,所有大規模運營的事物都將首先通過數字化構建,並且會有數字孿生進行操作。因此,今天我們將大量討論數字孿生。

我們最初從一張Ge Force顯卡起步。這裏有人知道什麼是Ge Force嗎?好的。那麼,從Ge Force起步的東西現在看起來是這樣的。這是新的Ge Force。它重達2噸到2.5噸,由120萬個部件組成,價值約300萬美元,功率爲120千瓦,由150家工廠生產,200家技術合作夥伴與我們合作,研發預算可能高達400億美元,用於打造GB200,現在正邁向GB300。它已經完全投入生產。

這臺機器被設計成一臺「思考機器」,它能夠推理,能夠規劃。它花費大量時間與自己對話,就像你們一樣。我們大多數時間都在爲自己的大腦生成文字和圖像,然後才將其付諸實踐。因此,「思考機器」在架構上正是Grace Blackwell的設計目標。它被設計成一個巨大的GPU。我將其與Ge Force進行比較是有原因的。Ge Force是一個GPU,GB200同樣是一個GPU。它是一個巨大的虛擬GPU。

現在,我們需要將其拆分成許多組件,創造許多新的網絡技術和服務器技術,開發極其低功耗、高能效的互連技術,將所有這些芯片和系統連接在一起,形成一個虛擬GPU。

這是霍珀版本。這是舉世聞名的霍珀系統。這8個GPU通過MV Link連接在一起。這裏沒有顯示的是一個帶有雙CPU和系統內存的CPU托盤,它與這些部件共同組成一個節點。這代表着一臺人工智能超級計算機的一個節點,大約價值一百萬美元。

這就是霍珀系統。正是這個系統真正讓我們在人工智能領域聲名鵲起。它曾經很長一段時間都供不應求,因爲市場發展得太快了。

但這就是著名的霍珀系統。整個系統,包括CPU,都被這個Grace Blackwell節點取代了。這就是一個計算托盤。我們將用它來取代整個系統。它是完全液冷的,CPU與GPU直接相連。你可以看到,兩個CPU與GPU相連的性能比整個系統還要強大。

但真正令人驚歎的是這一點。我們想要將許多這樣的系統連接在一起。如何將它們連接起來對我們來說曾經是一個難題。於是我們進行了解構。我們把整個主板解構成了這個,這就是具有革命性的MV Link系統。

擴展計算規模並不難,只要通過以太網連接更多的CPU即可。擴展規模並不難,難的是向上擴展。你只能建造出你能夠設計出的最大規模的計算機。將你能放入一個內存模型中的技術與電子元件數量最大化是極其困難的。因此,我們決定創造一種新的互連技術,名爲MV Link。它是一種內存語義互連,是一種計算架構,而不是網絡。它直接連接到所有這些不同MV Link系統的CPU,也就是計算節點。這是交換機。九個這樣的設備放在頂部,九個放在底部。中間是NVLink交換機,而將它們連接在一起的就是這個奇蹟。

這是NVLink主幹。這是100%的銅同軸電纜。它直接連接所有的MV Link芯片與所有的GPU,通過整個主幹直接相連,使得144個Blackwell芯片(分佈在72個不同的封裝中)能夠同時相互通信,且互不阻塞。這個主幹的帶寬大約是每秒130萬億字節。132萬億字節,我知道,稍等,等我說完。每秒130萬億字節。如果換算成比特,它比全球互聯網峰值流量還要高。是的,這就是如何將互聯網「縮小」到一個MV Link中。我們之所以這麼做,是因爲未來你對計算機的思考方式將從根本上改變。我會花更多時間來解釋這一點,但它是爲了讓Blackwell在性能上遠遠超越霍珀而設計的。

還記得摩爾定律嗎?半導體物理學只能讓你的性能每三到五年提升大約兩倍。那麼我們如何能在一代產品中實現30到40倍的性能提升呢?我們需要30到40倍的性能提升,因爲推理模型正在與自己對話。不再是單次的ChatGPT,現在的推理模型會生成大量更多的標記。當你在思考時,你會逐步分解問題,進行推理,嘗試許多不同的路徑,也許是思維鏈,也許是思維樹。它會反思自己的答案,你可能見過這些研究模型在反思自己的答案,說:「這是一個好答案嗎?你能做得更好嗎?」然後它們會說:「哦,我能做得更好。」於是它們會回去再思考。

這些推理模型實現了令人難以置信的性能,但它們需要更多的計算能力。結果呢?MV Link 72的架構使得Blackwell的性能實現了巨大的飛躍。解讀這張圖的方式是:X軸表示它思考的速度,Y軸表示工廠的輸出能力,即同時支持大量用戶的能力。因此,你希望工廠的吞吐量儘可能高,以便支持儘可能多的人,從而使工廠的收入儘可能高。你希望這個軸儘可能大,因爲這裏的人工智能比這裏更聰明。它思考得越快,它在回答你問題之前能思考得越多。這與標記的平均售價(ASP)有關,也與工廠的吞吐量有關。這兩者結合在那個角落,就是工廠的收入。基於Blackwell的工廠能夠產生更多的收入,這是由於架構的優勢。我們爲你們製作了一部電影,只是爲了讓大家感受一下構建Grace Blackwell所投入的巨大工程量,讓我們來看看吧。

Blackwell是一個工程奇蹟。它始於一片空白的硅片。經過數百次芯片處理和紫外光刻步驟,2000億個晶體管逐層構建在一個12英寸的硅片上。硅片被劃分爲單獨的Blackwell芯片,經過測試和分類,將好的芯片篩選出來。芯片在晶圓上封裝在基板上的工藝將32個Blackwell芯片和128個HBM堆疊在定製的硅中介層上。金屬互連痕跡直接蝕刻進去,將Blackwell GPU和HBM堆疊連接到每個系統和封裝單元中,將所有部件固定到位。然後,整個組件經過烘烤、模塑和固化,製造出Blackwell B200超級芯片。每個Blackwell芯片都在125攝氏度的烤箱中進行壓力測試,並在數小時內被推向極限。機器人晝夜不停地工作,將超過10000個組件放置在Grace Blackwell PCB上。與此同時,定製的液冷銅塊正在準備中,以保持芯片處於最佳溫度。

在另一個工廠,ConnectX-7超級網卡被製造出來,以實現擴展規模的通信,而BlueField-3 DPU則用於卸載和加速網絡、存儲和安全任務。所有這些部件匯聚在一起,被精心集成到GB中。

200個計算托盤的NV Link是英偉達發明的一種突破性高速鏈接,用於連接多個GPU並向上擴展成一個巨大的虛擬GPU。NV Link交換機托盤由NV Link交換芯片構建,提供每秒14.4萬億字節的全互連帶寬。MV Link主幹形成了一個定製的盲配背板,5000根銅纜將所有72個Blackwell芯片(或144個GPU芯片)連接成一個巨大的GPU,提供每秒130萬億字節的全互連帶寬,比全球互聯網的峰值流量還要高。來自世界各地的零部件被熟練的技術人員組裝成一個機架規模的人工智能超級計算機。

總計有120萬個部件、兩英里長的銅纜、130萬億個晶體管,重達近兩噸。Blackwell不僅僅是一個技術奇蹟,它是全球協作和創新力量的證明,這些力量將推動塑造我們未來的發現和解決方案。無論在哪裏,我們都致力於幫助當代的天才們完成他們一生的事業。我們迫不及待地想看到你們帶來的突破。

Grace Blackwell系統已經全面投入生產。這真是一個奇蹟。從技術角度來看,這是一個奇蹟,但將這些GB200系統組合在一起的供應鏈也是一個奇蹟。每個系統重達兩噸,我們現在每週生產1000套。此前從未有人以如此大規模量產超級計算機。每一個機架本質上都是一臺完整的超級計算機。2018年,最大的Volta系統——2018年的Sierra超級計算機的性能還不及這些機架中的任何一個,而那套系統的功耗是10兆瓦,而我們現在這套系統只有100千瓦。

因此,從2018年到現在,從一代到另一代,我們真正地將超級計算,尤其是人工智能超級計算提升到了一個全新的水平,我們現在以如此巨大的規模生產這些機器,而這只是一個開始。

事實上,你們看到的只是一個系統——Grace Blackwell。全世界都在談論這個系統,都在急切地希望它能夠部署到全球的數據中心,用於訓練、推理和生成式人工智能。

然而,並非每個人、也並非每個數據中心都能處理這些液冷系統。有些數據中心需要企業級堆棧,需要運行Linux、Red Hat、Newtonics或VMware存儲系統,這些系統來自Dell、EMC、Hitachi、NetApp、VAST、WECA等衆多不同的供應商。有如此多不同的存儲系統和IT系統,而這些系統的管理必須與傳統IT系統保持一致。

我們有如此多的新計算機需要投入生產,我很高興地告訴你們,所有這些系統現在都已經投入生產。你們可能還沒有看到它們,但它們正在從貨架上飛速下架,從生產線飛速下線。例如,DGX Spark讓你們能夠在桌面上擁有Grace Blackwell系統,無論是Spark Desktop還是DGX Station。這樣一來,你們在開發軟件或開發人工智能時,不需要坐在超級計算機前,但你們又希望架構完全相同。

從架構角度來看,這些系統是完全相同的。從軟件開發者的角度來看,它們看起來完全一樣,唯一的區別是規模和速度。而在這一側則是所有x86系統。全球的IT組織仍然更傾向於x86,並且在能夠利用最先進的AI原生系統的地方,他們也會這麼做。而在他們無法做到的地方,他們希望將這些系統整合到企業級IT系統中,我們現在爲他們提供了這種能力。其中最重要、也最耗費時間去構建的系統是因爲軟件和架構非常複雜,那就是如何將AI原生架構融入到傳統的企業級IT系統中。這是我們全新的RTX Pro服務器,這是一個令人難以置信的系統。主板經過了全新的設計。女士們、先生們,Jenny Paul。

這塊主板看起來很簡單,然而在這塊主板上,有八個Super Next交換機,它們通過一個200Gbps的最先進的網絡芯片連接八個GPU,然後將這八個GPU和這些全新的Blackwell RTX Pro 6000 GPU連接起來。八塊這樣的GPU組成一臺服務器。

那麼它有什麼特別之處呢?這台服務器是世界上唯一能夠運行人類所編寫的一切內容以及人類所開發的所有視頻內容的服務器。它運行人工智能、Omniverse RTX用於視頻遊戲,它運行Windows,運行Linux,運行Kubernetes和VMware。基本上,它能夠運行一切。如果你想從計算機將Windows桌面流式傳輸到遠程設備,沒問題。如果你想流式傳輸Omniverse,也沒問題。如果你想運行你的機器人堆棧,也沒問題。這臺機器的QA(質量評估)簡直令人驚歎。它運行的應用程序基本上是通用的。人類所開發的一切內容都應該能夠在這裏運行,包括如果你是一名視頻遊戲玩家,包括《危機》(Crysis)。如果能夠運行《危機》,就能運行任何東西。

好的,這是RTX Pro服務器,全新的企業級系統。所以,有些事情正在發生變化。我們知道人工智能是一項極其重要的技術。我們現在已經確信,人工智能是一種能夠徹底變革、轉型每一個行業的軟件。它能夠做到我們所熟知的那些令人驚歎的事情。我們也知道,處理人工智能的方式從根本上不同於我們以往處理手工編寫軟件的方式。機器學習軟件的開發方式不同,運行方式也不同。系統的架構、軟件的架構完全不同。網絡的工作方式完全不同。訪問存儲的方式也完全不同。因此,我們知道這項技術能夠做到不同的事情,令人難以置信的事情。它是智能的。我們也知道,它的開發方式從根本上不同,需要新的計算機。

真正有趣的是,這對我們所有人,對國家、公司、社會到底意味着什麼?這是我們在近十年前就做出的一個觀察,而現在每個人都開始意識到:事實上,這些人工智能數據中心根本就不是數據中心。它們並不是傳統意義上用於存儲文件、供你檢索的數據中心。這些數據中心並不是用來存儲我們的文件的。它們只有一個職責,而且只有一個職責,那就是生產智能標記,生成人工智能。

這些人工智能工廠看起來像是數據中心,因爲它們內部有許多計算機,但這就是唯一相似的地方。它們的設計方式、製造規模、設計和建造方式、使用方式、編排和配置方式、運營方式,以及你對它們的思考方式,都完全不同。

例如,沒有人會把數據中心當作一個創收設施來考慮。我說出這句話時,每個人都會點頭說:「是的,你說得對。」沒有人會把數據中心當作一個創收設施來考慮,但他們會把工廠、汽車工廠當作創收設施來考慮,並且迫不及待地想再建一個工廠,因爲每當你建了一個工廠,收入就會在不久之後增長,因爲你能夠爲更多的人生產更多的東西。

這些人工智能工廠的理念與之完全相同。它們是創收設施,它們被設計用來製造標記。這些標記可以被重新定義爲許多行業的生產力智能。因此,人工智能工廠現在已經成爲一個國家基礎設施的一部分,這也是爲什麼你們會看到我到處跑,和各國元首交談,因爲他們都希望擁有人工智能工廠。他們都希望人工智能成爲他們基礎設施的一部分。他們都希望人工智能成爲他們的增長型製造業,這是真正深刻的。

我認爲,正因爲如此,我們正在經歷一場新的工業革命,因爲每一個行業都受到影響。一個新的行業正在誕生,就像電力最初被描述爲一種技術、被展示爲一種技術時,它被理解爲一種技術。但隨後我們意識到,它也是一種大型產業。然後是信息產業,我們現在稱之爲互聯網。而這兩者,因爲它們影響了如此多的行業,都成爲了基礎設施的一部分。我們現在有了一個新的行業——人工智能行業,它已經成爲一種新的基礎設施的一部分,這種基礎設施被稱爲智能基礎設施。每個國家、每個社會、每個公司都將依賴它。

從規模上來看,這是一個被廣泛討論的話題。這就是「星際之門」(Stargate)。它看起來不像一個數據中心,而像一個工廠。這是一個1吉瓦的設施,將容納大約50萬個GPU芯片,併產生大量的智能,可供所有人使用。

歐洲現在已經意識到這些人工智能工廠的重要性,意識到人工智能基礎設施的重要性,我很高興看到這裏如此活躍。這是歐洲電信運營商正在建設人工智能基礎設施。

與英偉達合作的,是歐洲雲服務提供商,他們正在視頻中展示人工智能基礎設施的建設。這是歐洲超級計算中心正在建設下一代人工智能超級計算機和基礎設施,同樣在視頻中展示。而這只是一個開始。這只是公共雲之外的部分。這是歐洲本土公司爲歐洲市場建設的人工智能基礎設施。此外,還有20多個正在規劃中,20多個人工智能工廠,其中一些是吉瓦級的工廠。總共來說,在短短兩年內,我們將使歐洲的人工智能計算能力增加10倍。因此,研究人員、初創企業、你們的人工智能短缺、你們的GPU短缺,很快就會得到解決。它正在向你們走來。

現在,我們正在與每個國家合作,發展他們的生態系統。因此,我們在七個國家建立了人工智能技術中心。這些人工智能技術中心的目標是:第一,進行合作研究;第二,與初創企業合作;第三,建設生態系統。讓我向你們展示一個生態系統是什麼樣的。在英國,我昨天剛去過那裏。生態系統是建立在英偉達架構之上的。例如,正如你們所知,英偉達是唯一在每個雲平台上都可用的人工智能架構。它是除了x86之外唯一無處不在的計算架構。我們與每個雲服務提供商合作,加速來自全球最重要軟件開發商的應用程序,比如歐洲的西門子、Cadence、Red Hat等。

現在,我們已經重新發明了計算架構。正如你們所知,計算不僅僅是計算機,還包括計算、網絡和存儲。這三個層次、這三個架構的每一層都已經被重新發明。

與思科(Cisco)建立了偉大的合作伙伴關係,他們昨天在其會議上宣佈了一款基於英偉達的新模型。還有與戴爾(Dell)、NetApp、NVIDIA等的衆多偉大合作伙伴關係。正如我之前提到的,軟件開發方式已經從根本上發生了變化。它不再僅僅是編寫C程序、編譯C程序、交付C程序,而是現在變成了DevOps、MLOps、AI Ops。因此,整個生態系統正在被重新發明。我們到處都有生態系統合作伙伴,當然還有解決方案集成商和提供商,他們可以幫助每家公司整合這些能力。

在英國,我們與一些特殊的公司合作,這些公司非常出色,從研究人員到開發人員,再到合作伙伴,幫助我們提升當地的人才和企業,這些企業消費技術,當然還有云服務提供商。

我們在英國擁有偉大的合作伙伴。在德國,我們擁有令人難以置信的合作伙伴關係。在意大利,我們擁有偉大的合作伙伴關係。當然,在法國,我們也有令人驚歎的合作伙伴關係。

法國總統麥康(Mccon)稍後會到這裏。我們將討論一些新的公告,所以我們必須對人工智能表現出一些熱情。好的,是的,就是這樣。爲他展示一些熱情。因此,我們在法國擁有偉大的合作伙伴關係。我想特別強調其中一個,我們與施耐德(Schneider)的合作,正在建設這些人工智能工廠。我們現在以數字化方式建設它們,以數字化方式設計它們,以數字化方式運營它們,甚至最終以數字化方式優化它們,並完全在數字孿生中操作它們。這些人工智能工廠非常昂貴,未來可能會花費500億美元,甚至1000億美元。如果工廠的利用率沒有達到最高水平,對工廠所有者的成本將是巨大的。

因此,我們需要儘可能多地將它們數字化,並使用人工智能,將所有內容放入Omniverse中,以便我們能夠獲得直接且持續的遙測數據。

今天,我們宣佈與一家偉大的公司建立合作伙伴關係,這是一家年輕的公司,我非常喜歡它的首席執行官,他正在努力打造一家歐洲人工智能公司。公司的名字叫Miss Straw。今天,我們宣佈我們將在這裏共同建設一個人工智能雲,提供他們的模型,併爲其他人工智能初創企業的生態系統提供人工智能應用,以便他們可以將這些模型用作「稻草」模型或他們喜歡的任何模型。因此,Mr. All和我們,我們將合作建設一個相當規模的人工智能雲,我們將在稍後與法國總統馬克龍(Macron)進一步討論這個話題。

人工智能技術的發展速度如同光速。我在這裏展示給你們的,左邊是專有模型,以光速發展。然而,開放模型也在以光速發展,只是落後了幾個月,無論是Miss Straw、Llama、DeepSeek,還是R1、R2,都將在第一季度推出。

這些模型每一個都非常出色。因此,我們在過去幾年中致力於應用世界上最優秀的人工智能研究人員,使這些人工智能模型變得更好。我們稱之爲Nemo Tron。

基本上,我們所做的就是,我們獲取開源的模型,當然,這些模型都是基於英偉達構建的。我們獲取這些開源模型,然後進行後訓練。我們可能會進行神經架構搜索,提供更好的數據,使用強化學習技術,增強這些模型,賦予它們推理能力,擴展上下文,以便它們在與你互動之前能夠學習和閱讀更多內容。

這些模型大多具有相對較短的上下文,而我們希望擁有巨大的上下文能力,因爲我們希望在企業應用中使用它,而我們希望與之進行的對話並不在互聯網上,而是在我們自己的公司內部。因此,我們需要加載大量上下文。所有這些能力都被打包成一個可下載的Nemo Tron。你可以訪問英偉達的網站,直接下載一個API,一個最先進的AI模型,你可以將其放置在任何你喜歡的地方,我們將極大地改進它。這是Nemo Tron對Llama的改進示例。

因此,Llama 8B、70B、4O 5B通過我們的後訓練能力、推理能力的擴展以及我們提供的所有數據得到了極大的增強。我們將一代又一代地進行這種改進。因此,對於所有使用Nemo Tron的你們來說,你們會知道未來還有一系列其他模型,它們都是開放的。因此,如果你想從開放模型開始,那很好;如果你想從Nemo Tron模型開始,那也很好。Nemo Tron模型的性能非常出色。在一次又一次的基準測試中,Nemo Tron的性能一直位居榜首。因此,現在你們知道,你們可以獲取一個經過增強的開放模型,它仍然是開放的,位居排行榜首位,你們知道英偉達致力於此。我會在我的一生中一直致力於此,好嗎?

這個策略如此出色,以至於歐洲各地的區域模型製造商現在已經認識到這一策略的美妙之處,我們正在合作,以適應和增強每一個模型。

對於區域語言,你們的數據屬於你們。它是你們人民的歷史、知識和文化的體現。它屬於你們。對於許多公司來說,以英偉達爲例,我們的數據大多來自33年的積累。

今天早上我查了一下,西門子有180年的數據,其中一些是寫在紙莎草上的。Roland Bush在這裏,我想提一下他。我的好朋友。因此,你們必須將這些數據數字化,然後人工智能才能學習。因此,是的,數據屬於你們。你們應該使用這些數據,使用像Limiton這樣的開放模型以及我們提供的一整套工具,以便你們可以根據自己的需求進行增強。

我們還宣佈,我們與Perplexity建立了偉大的合作伙伴關係,這是一款推理搜索引擎。是的,我使用的三種模型是ChatGPT、Gemini Pro和Perplexity。我交替使用這三種模型。Perplexity非常出色。今天,我們宣佈Perplexity將整合這些區域模型,直接接入Perplexity,這樣你就可以用你們國家的語言、文化和敏感性來提問並獲得答案。因此,Perplexity、區域模型、代理人工智能(Agentic AI)是一個非常重要的領域。

正如你們所知,最初使用預訓練模型時,人們說:「但它會產生幻覺,它會編造東西。」你說得完全正確。它無法訪問最新的新聞和數據信息。你說得完全正確。它在解決問題時不會進行推理。就好像每一個答案都必須從過去記憶中提取。你說得完全正確。所有這些關於智能的能力,每個人都可以批評,但你說得完全正確,因爲每個人大多都理解智能是如何工作的。然而,這些技術正在世界各地被開發,並且它們正在從檢索、增強生成到網絡搜索,再到多模態理解等各個領域匯聚在一起,這樣你就可以閱讀PDF文件,訪問網站,查看圖像和文字,聆聽視頻,觀看視頻,然後將所有這些理解融入到你的上下文中。

現在,你當然也可以理解幾乎任何事物的提示。你甚至可以說:「我要問你一個問題,但從這張圖片開始。」或者說:「在你回答問題或執行我要求的任務之前,先從這段文字開始。」然後它會進行推理、規劃和自我評估。所有這些能力現在都已經被整合到一起,並且你可以在市場上到處看到它們的出現。

代理人工智能(Agentic AI)是真實存在的,它是一次巨大的飛躍,是從單次交互式人工智能(one-shot AI)發展而來的。單次交互式人工智能是必要的,它爲教導代理如何成爲代理奠定了基礎。你需要對知識和推理有一些基本的理解,才能具備可被教導的能力。因此,預訓練是爲了讓人工智能具備可教導性,而後訓練、強化學習、監督學習、人類演示、上下文提供、生成式人工智能,所有這些都在一起形成了現在的代理人工智能。

讓我們來看一個例子。讓我給你們展示一些東西。它是基於Perplexity構建的,非常酷。人工智能代理是數字助手。基於提示,它們會通過推理將問題分解爲多步驟計劃。它們會使用適當的工具,與其他代理合作,並利用記憶中的上下文來正確執行任務。在英偉達加速系統上,這一切都從一個簡單的提示開始。讓我們請Perplexity幫助我們在巴黎開一家食品卡車。首先,Perplexity代理會通過推理理解提示並制定計劃,然後調用其他代理來幫助完成每個步驟。利用許多工具,市場研究員會閱讀評論和報告,發現趨勢並分析競爭市場。基於這些研究,概念設計師會探索當地食材,並提出一份完整的菜單,包括準備時間估計,並研究調色板,生成一個品牌形象。然後,財務規劃師會使用蒙特卡洛模擬來預測盈利和增長軌跡。運營規劃師會制定一個詳細的啓動時間表,從購買設備到獲取正確的許可證,涵蓋每一個細節。營銷專家會制定一個啓動計劃,包括社交媒體活動,甚至還會編寫一個互動網站,包括地圖、菜單和在線訂購功能。每個代理的工作最終匯聚成一個完整的提案包,而這一切都始於一個簡單的提示。

像這樣的一個提示,在最初的聊天機器人中可能只會生成幾百個標記。但現在,通過一個單一的提示輸入到代理中來解決問題,它可能已經生成了超過一萬倍的標記。這就是爲什麼我們需要Grace Blackwell的原因。這就是爲什麼我們需要性能,以及爲什麼這些系統需要在每一代上都大幅提升性能。

這就是Perplexity構建他們代理的方式。每家公司都必須構建自己的代理。這非常棒。你會從OpenAI、Gemini、微軟的CoPilot、Perplexity和Miss Straw等公司聘請代理。還會有一些爲你量身定製的代理,比如幫助你規劃假期或進行一些研究等。然而,如果你想建立一家公司,你需要專門的代理,使用專門的工具和專門的技能。所以問題是,你如何構建這些代理?因此,我們爲你創建了一個平台。

我們創建了一個框架和一套工具,以及許多合作伙伴來幫助你完成這件事。它從最底層開始,具備我之前提到的推理模型能力。英偉達的Nemo Tron推理模型是世界級的。我們還有Nemo Retriever,這是一個多模態搜索引擎,一個語義搜索引擎,非常出色。我們構建了一個藍圖,一個可操作的演示,本質上是一個通用代理。我們稱它爲IQ,AIQ。在它的上面,我們有一套工具,允許你將一個通用代理引入進來,整理數據來教導它,評估它,設置防護欄,監督它,訓練它,使用強化學習一直到部署,保持它的安全性和可靠性。這一整套工具包被集成到AI Ops生態系統中。

你也可以從我們的網站上自行下載,但它主要被集成到AI Ops生態系統中。從這裏,你可以創建自己的專屬代理。許多公司正在這樣做,思科(Cisco)就是其中之一。他們昨天宣佈了這一消息。我們正在一起構建用於安全的人工智能平台。現在看看這個,人工智能代理並不是一個模型就能完成所有這些令人驚歎的事情。它是一個集合,一個系統,一個由大型語言模型組成的人工智能系統。其中一些模型針對某些特定的事情進行了優化,比如檢索,正如我提到的,使用計算機執行技能。你不想把所有這些東西都打包到一個巨大的、龐大的人工智能中,而是將它們分解成小的部分,然後隨着時間的推移逐步部署CICD。這是思科的一個例子。

現在的問題是,你如何部署這些?因爲正如我之前提到的,有公共雲,英偉達的計算能力就在那裏。還有我們稱之爲NCPs的區域雲,例如Mistral。你可能因爲安全需求和數據隱私需求而擁有一個私有云,甚至你可能決定在你的桌面上運行某些東西。所以問題是,你如何運行所有這些?有時它們會在不同的地方運行,因爲這些都是微服務。這些是可以相互交流的人工智能,它們顯然可以通過網絡進行通信。那麼,你如何部署所有這些微服務呢?現在,我們有一個很棒的系統。我很高興在這裏宣佈它。它被稱爲我們的DGX Lepton。

DGX Lepton。你在這裏看到的是許多不同的雲。這裏是Lambda雲,AWS雲,這裏是你的開發者機器。你的系統可能是DGX Station,DBS,Yoda,也可能是AWS、GCP和視頻。架構無處不在。你可以決定在哪裏運行你的模型,使用一個超級雲進行部署,所以它是一個雲的雲。一旦你讓它工作,一旦你將這些Nemo模型部署到Lepton中,它就會被託管並運行在你選擇的各種雲上。一個模型架構,一種部署方式,你可以讓它在任何地方運行。你甚至可以在這個小小的機器上運行它,你知道,這個DGX Spark。它是一個AI超級計算機。我們在2016年構建了一個AI超級計算機,它被稱爲DGX1。它是我剛才提到的所有內容的第一個版本。八個Volta GPU通過MV Link連接。

我們花了數十億美元來構建它。在我們宣佈DGX1的那一天,沒有客戶,沒有興趣,沒有掌聲,只有100%的困惑。爲什麼有人會構建這樣一臺計算機?它能運行Windows嗎?不能。但我們還是把它建成了。

感謝天,一家年輕的公司,一家位於舊金山的初創公司,一個非營利性初創公司,看到這台計算機後非常高興,他們說:「我們可以買一臺嗎?」我想:「哦,我的天哪,我們終於賣出了一臺。」但隨後我發現他們是一家非營利機構。我把DGX1放在我的車裏,然後開車去了舊金山。那家公司的名字叫OpenAI。

我不知道人生的教訓是什麼。有很多非營利機構,你知道,所以下次……但也許教訓是:如果一個開發者向你求助,需要一個GPU,答案就是「是」。所以,想象一下,你有Lepton,它在你的瀏覽器中,你有一個Helm圖表,一個你開發的人工智能代理,你希望在這裏運行它,部分在AWS運行,部分在某個區域雲運行,你使用Lepton部署你的Helm圖表,它就會神奇地出現在這裏。好的。所以如果你想在這裏運行它,直到你完成並且準備好部署它,然後將其部署到雲端。很好。但最美好的是,這個架構基於Grace Blackwell,GB10與GB200、GB2300以及所有這些不同版本,但這個架構正是Grace Blackwell。

現在這太神奇了。我們正在爲Hugging Face做這件事。英偉達已經將Lepton連接起來。因此,無論你何時在Hugging Face上訓練模型,如果你想將其部署到Lepton並直接進入Spark,完全沒有問題。只需點擊一下即可。無論是訓練還是推理,我們現在都與Hugging Face連接,Lepton將幫助你決定在哪裏部署它。讓我們來看看。

開發者需要隨時隨地輕鬆可靠地訪問能夠跟上他們工作進度的計算資源。DGX Cloud Lepton提供了按需訪問全球GPU網絡的能力,這些GPU跨越雲平台、地區以及像Yoda和Nebias這樣的合作伙伴。多雲GPU集群通過單一統一界面進行管理。配置速度非常快。開發者可以快速擴展節點數量,無需複雜設置,並立即開始使用預集成工具和訓練就緒的基礎設施進行訓練。進度可以實時監控,GPU性能、收斂情況和吞吐量盡在指尖。你可以在控制檯內直接測試和微調模型。DGX Cloud Lepton可以在多個雲或地區部署Nemo模型端點或你的模型,實現快速分佈式推理。就像拼車應用將乘客與司機連接起來一樣,DGX Cloud Lepton將開發者與GPU計算連接起來,爲虛擬全球人工智能工廠提供動力。這就是思科(Cisco)的方式。SAP也在以這種方式構建人工智能平台。

在英偉達,Sana正在構建基於英偉達的人工智能業務應用自動化。DeepL正在構建其語言框架和平台,基於英偉達人工智能。Photogram是一個視頻編輯和人工智能編輯平台,正在基於英偉達構建他們的平台。這是一個曾經被稱爲Codium的平台,一個基於英偉達構建的令人難以置信的編碼代理。這是一個名爲Iola的語音平台,基於英偉達構建。這是一個臨牀試驗平台,全球最大的臨牀試驗自動化平台,也是基於英偉達構建的。所有這些基本上都是基於同一個理念:將它們封裝在一個虛擬容器中,可以在任何地方部署。無論是Nemo Tron大型語言模型,還是其他大型語言模型,比如Miss Trawl或其他模型,我們都會整合涵蓋人工智能代理整個生命週期的庫。你對待人工智能代理的方式有點像對待數字員工。因此,你的IT部門需要將其引入、微調、訓練、評估、設置防護欄,確保它們的安全,並持續改進它們。整個框架平台被稱爲Nemo,所有這些現在正在被整合到全球的一個又一個應用框架中。這只是一個例子。

現在,我們讓你可以將它們部署在任何地方。如果你想在雲端部署,你可以選擇DGX或雲中的GB200。如果你想在本地部署,因爲你有VMware、Red Hat Linux或Nutanix,並且已經在本地虛擬機中部署,你也可以做到。如果你想將其部署爲私有云,你也可以做到。你甚至可以將其部署在你的DGX Spark或DGX Station上,完全沒有問題。Lepton將幫助你完成所有這些。

讓我們來談談工業人工智能。這是我最喜歡的時刻之一。這是Roland Bush。他剛剛提醒我,神經計算機,神經網絡計算機是在歐洲發明的。這就是整個幻燈片的內容。但我覺得這是一個非常有趣的時刻。這是突觸1號(Synapse 1),這太不可思議了,夥計們。

突觸1號,1992年。它的運行速度比當時的CPU快8000倍。這難道不令人難以置信嗎?所以這是世界上的人工智能計算機。Roland只是想讓我永遠記住這一點。永遠永遠不要忘記我說過的話,好的,我明白了,我會告訴每個人。

1992年,西門子。我們與西門子有着偉大的合作伙伴關係,西門子的首席執行官Roland Bush正在爲公司注入強大動力,以便他們能夠完全跨越上一次工業革命,並將歐洲的工業能力與人工智能融合,創造所謂的工業人工智能革命。我們在許多不同領域與西門子合作,從設計到模擬,到工廠的數字孿生,再到工廠中人工智能的運營,從端到端的整個過程。

這讓我想起歐洲的工業能力是多麼令人難以置信,以及這是一個多麼非凡的機遇。這是一個非凡的機遇,因爲人工智能與軟件不同。人工智能是一種非常智能的軟件,這種智能軟件終於能夠做一些事情,徹底改變你們所服務的行業。因此,我們製作了一段「情書」視頻。讓我們來播放它。

這一切都始於這裏,第一次工業革命,瓦特蒸汽機和機械化織布機。它們引入了自動化和工廠的誕生,一個行業就此誕生。電力時代,安培揭示了電磁學。法拉第建造了第一臺發電機,麥克斯韋奠定了現代電氣工程的基礎。西門子和惠斯通,發電機。電力的引擎。它讓機器、火車、工廠和城市煥發生機。它讓整個星球通電,點燃了現代製造業。而今天,從計算和信息時代誕生的第四次工業革命,人工智能時代,正在重新構想整個大陸的每一個工業領域。工業人工智能正在從設計到工程的各個領域扎根。你們正在開闢新的道路,朝着理解和重新發明的方向前進。你們將物理世界帶入虛擬世界,以規劃和優化全球的現代工廠。

你們正在構建下一個前沿領域,那裏的一切運動都是機器人化的,每一輛汽車都是一個智能自主代理,一個新的協作勞動力正在幫助填補全球勞動力短缺的缺口。整個大陸的開發者正在構建各種類型的機器人,在數字孿生世界和機器人環境中教導它們新技能,讓它們準備好與我們在工廠、倉庫、手術室和家中並肩工作。第四次工業革命已經到來,它就始於第一次工業革命的地方。你覺得怎麼樣?

我太喜歡這個視頻了。是你製作的,太棒了。我們正在與一家又一家公司合作,開展工業人工智能項目。這是寶馬(BMW)正在Omniverse中構建其下一代工廠。我不知道該怎麼說,有人能教我嗎?「BU Jess」聽起來不錯。沒錯,完全正確。幹得好,完全正確。

他們當然正在Omniverse中構建工廠的數字孿生。這是他們用於倉庫物流的數字孿生的關鍵部分。這是梅賽德斯-奔馳(Mercedes-Benz)及其在Omniverse中構建的工廠的數字孿生。這是舍弗勒(Schaeffler)及其在Omniverse中構建的倉庫的數字孿生。這是法國的火車站,正在Omniverse中構建火車站的數字孿生。這是豐田(Toyota)正在Omniverse中構建其倉庫的數字孿生。當你們在Omniverse中構建這些倉庫和工廠時,你們可以進行設計,可以進行規劃,可以在綠地(Greenfield)上進行設計,也可以在棕地(Brownfield)上進行改造。你們可以在實際移動物體之前,通過模擬來驗證其效率是否最優。因此,能夠在數字孿生中完成所有這些數字化工作是非常令人難以置信的。

但問題是,爲什麼數字孿生必須看起來像照片一樣逼真,爲什麼它必須遵循物理定律?原因在於,我們希望它最終成爲一個真正的數字孿生,機器人可以在其中學習如何作爲機器人操作,而機器人依賴光子作爲其感知系統。這些光子是通過Omniverse生成的。機器人需要與物理世界互動,以便知道自己是否在做正確的事情,並學會如何正確地完成任務。因此,這些數字孿生必須看起來逼真,並且行爲符合現實。這就是爲什麼Omniverse被構建的原因。這是一個聚變反應堆的數字孿生,非常複雜的儀器,正如你們所知。如果沒有人工智能,下一代聚變反應堆是不可能實現的。

今天,我們宣佈我們將在歐洲建立世界上第一個工業人工智能雲。我要指出,是的,這些工業人工智能雲是雲中的許多計算機。然而,它們的要求、性能和安全要求根本不同。因此,我將在週五告訴你們更多關於它的內容。

今天我只向你們透露了部分故事,但這個工業雲將用於設計和模擬。虛擬風洞,你可以直接走進去,將汽車移入其中,看到它的行爲。打開車門,打開車窗,改變設計。所有這些都在完全實時中完成。實時設計,在數字風洞中進行模擬,數字風洞的數字孿生也在實時中完成,在工廠中構建,數字工廠的數字孿生也在實時中完成。所有這些都將讓機器人學會成爲出色的機器人,並構建我們未來的機器人,比如自動駕駛汽車等。我們在這裏已經擁有一個龐大的生態系統。正如你們所知,我們在這裏已經很長時間了。英偉達已經33歲了。

我們第一次來到歐洲是在工作站和產品數字化、CAD革命開始的時候。我們當時正在參與CAE革命,而現在是數字孿生革命。歐洲有大約2萬億美元的生態系統,我們與之合作,並且我們有幸支持從中誕生的新革命。正如你們所知,所有運動的物體都將實現機器人化,所有運動的物體都將由人工智能驅動。汽車是最明顯的例子。

接下來,英偉達構建用於訓練模型的人工智能超級計算機,用於Omniverse數字孿生的人工智能超級計算機。我們還爲機器人本身構建人工智能超級計算機。在每一種情況下,無論是用於雲中的Omniverse還是用於汽車,我們提供了整個堆棧,計算機本身,以及運行在計算機之上的操作系統,在每一種情況下都是不同的。這台計算機必須具備高速、傳感器豐富、功能安全的特性,它在任何情況下都不能完全失敗。因此,安全要求極高。

現在,我們擁有一個令人難以置信的模型,它就運行在這個系統之上。這個模型是一個基於Transformer的推理模型。它接收傳感器輸入,你告訴它你想要它做什麼,它就會帶你到達那裏。它接收像素輸入,並生成路徑規劃輸出。因此,這是一個基於Transformer的生成式人工智能模型,非常了不起的技術。英偉達的人工智能團隊、自動駕駛團隊非常出色。據我所知,他們是唯一一個連續兩年在CVPR上贏得端到端自動駕駛汽車挑戰賽的團隊。所以,他們今年再次成爲贏家。讓我們看看這個視頻。好的,謝謝。

像任何駕駛員一樣,自動駕駛汽車運行在一個充滿不可預測和潛在安全關鍵場景的世界中。英偉達Drive基於Halo安全系統,讓開發者能夠構建安全的自動駕駛汽車,配備多樣化的軟件堆棧和傳感器以及冗餘計算機。它從訓練開始。安全的自動駕駛汽車需要大量的多樣化數據,以應對邊緣情況,但現實世界中的數據是有限的。開發者使用英偉達Omniverse和Cosmos重建現實世界,並生成逼真的合成訓練數據,爲自動駕駛汽車模型帶來多樣性。該模型可以感知和推理其環境,預測未來結果,並生成運動規劃。爲了決策多樣性,一個獨立的經典堆棧並行運行。防護欄監控安全性能,在出現異常時,調用仲裁器進行緊急制動。傳感器和計算架構中進一步融入了多樣性和冗餘性。每個傳感器都連接到冗餘計算機,因此即使傳感器或計算機出現故障,車輛仍然安全且可操作。在發生嚴重故障時,系統可以執行最小風險操作,比如靠邊停車。安全是自動駕駛的核心,英偉達Drive讓全球開發者能夠將Halo整合到他們自己的產品中,以構建下一代安全的自動駕駛汽車。

全球有10億輛汽車在道路上行駛,每年平均行駛1萬英里,總共10萬億英里。自動駕駛的未來顯然是巨大的,它將由人工智能驅動。這是下一個巨大的機會,我們正在與全球一些非常出色的大型公司合作,以實現這一目標。

在我們與自動駕駛汽車(AV)相關的所有工作中,核心是安全,我們爲我們的Halo系統感到非常自豪。它從芯片架構開始,然後是芯片設計、系統設計、操作系統、人工智能模型、開發軟件的方法論、我們測試它的方式,從我們訓練模型的方式、爲模型提供的數據,一直到我們評估模型的方式,英偉達的Halo系統以及我們的自動駕駛安全團隊和能力絕對是世界聞名的。

這台計算機是第一臺軟件定義的計算機。世界上第一臺完全100%軟件定義的、由人工智能驅動的自動駕駛汽車軟件堆棧。我們已經在這個領域耕耘了將近10年。因此,這一能力是世界聞名的,我爲此感到非常自豪。

汽車領域正在發生的事情,也在一個新的行業中發生,正如我之前提到的。如果可以從提示生成視頻,如果人工智能可以感知、推理,並且能夠生成視頻、文字和圖像,那麼它爲什麼不能像汽車中的路徑規劃和方向盤路徑一樣,生成局部運動能力和關節運動能力呢?因此,人工智能徹底變革最複雜的機器人問題之一的能力即將到來。

人形機器人將成爲現實。我們現在知道如何構建、訓練和操作這些機器人。人形機器人可能會成爲有史以來最大的行業之一,它需要那些懂得如何製造具有非凡能力產品的公司。這與歐洲國家息息相關。世界上許多行業都扎根於此。我認爲這是一個巨大的機會。假設全球有10億台機器人,那麼擁有10億台機器人的想法是非常合理的。

那麼,爲什麼它還沒有發生呢?原因很簡單。如今的機器人太難編程了。只有最大的公司才能負擔得起安裝機器人、教它們做正確的事情、確保它們足夠安全的費用。這就是爲什麼世界上最大的汽車公司都有機器人的原因。它們足夠大,工作足夠重複,行業規模也足夠大,可以在工廠中部署機器人。對於中型、小型企業或夫妻店餐廳、商店或倉庫來說,這種編程能力幾乎是不可能的,直到現在。我們將爲你提供可以「教」的機器人,它們會從你那裏學習。正如我們剛才提到的代理人工智能一樣,我們現在擁有人形人工智能,它可以通過與我提到的Nemo工具包非常一致的工具包從你的教學中學習。

英偉達也構建了一個三層堆棧。我們構建了計算機,Thor計算機開發工具包看起來有點像這樣。這是一臺機器人計算機,一個完全自包含的開發工具包,放在你的桌子上。這些是所有的傳感器,裏面是一個小型超級計算機芯片。這真的很令人難以置信。這些……是的,我可以想象像這樣插入一個。好的,謝謝,珍妮。這就是Thor處理器。在其之上是一個爲機器人設計的操作系統,而在操作系統之上則是Transformer模型,它接收傳感器輸入和指令,將其轉換爲飛行路徑或手臂、手指和腿部關節運動的電機控制信號。

然而,人形機器人面臨的巨大挑戰是,訓練它們所需的大量數據很難獲取。那麼,如何解決這個問題呢?解決這個問題的方法是回到Omniverse,一個遵循物理定律的數字孿生世界。我們正在做的這項工作令人難以置信。

好吧。這些是我們開發的機器人,我們開發計算機來模擬它們、訓練它們,以及放入它們內部的計算機。全球有許多人形機器人公司正在成立,它們都看到了徹底變革這一新設備的巨大機會。進展非常迅速。它們學習的方式是在虛擬世界中學習,而這個虛擬世界必須遵循物理定律。

最近,我們宣佈與迪士尼研究公司(Disney Research)和DeepMind建立重大合作伙伴關係,我們將共同創建世界上最複雜、最逼真的物理模擬。我正在試圖弄清楚現在如何切換到那張幻燈片。教教我,誰和我在一起?這就是隻排練一次的結果。好的,這個令人難以置信的系統是人工智能學習成爲人工智能的地方。讓我展示給你看。爲你推出來。

我們有一位特別嘉賓。

你的名字叫格雷格(Greg)。你是小加爾森(Garson)還是小比爾(Bill)?好的,他是一個小女孩。現在看看這個。格雷格在Omniverse中學會了走路,遵循物理定律。我說的「在Omniverse中」,是指我們創造了數十萬種場景。最後,當格雷格學會了在這些環境中操作、行走和操縱物體時,無論是在沙子上、碎石上、滑溜的地板上、混凝土上還是地毯上,當格雷格進入物理世界時,物理世界只是虛擬世界的第100,001個版本。因此,你在虛擬世界中學會了走路,看看你現在。你能跳嗎?哇,太棒了,太棒了,太棒了。你能跳舞嗎?

我想讓大家知道,我是主題演講者,所以我需要你。我需要你安靜幾秒鐘。我需要你表現得乖一點。困惑嗎?你能坐下嗎?嘿,你知道我們該做什麼嗎?讓我們給每個人拍張照片。砰,砰。是的,是的,是的。你想和我一起回家嗎?你想和我一起回家嗎?我有……是的,我知道,親愛的。是的,我有寵物。它們會很高興讓你成爲它們的寵物。不,你太聰明瞭。你太聰明瞭。這太不可思議了,對吧?

你是世界上最棒的機器人。總有一天,我們每個人都會有一個像你這樣的機器人,它們會在2020年圍繞着我們轉。但如果我需要一杯威士忌,你得去告訴別人幫我拿一杯威士忌,因爲你沒有胳膊。我?是的,你太可愛了。好吧,小女孩,你先待在這兒。我們來總結一下。

好吧,這很清楚。一場工業革命已經開始。人工智能的下一個階段已經開始。格雷格是現在機器人技術可能性的完美例子。教機器人操作、模擬以及當然,創造令人難以置信的機器人的技術,現在就在我們面前。我們有人形機器人,也有信息機器人,我們稱它們爲代理。因此,人工智能的下一波浪潮已經開始。它將需要推理工作負載呈爆炸式增長,基本上會呈指數級增長。使用推理的人數從800萬增加到8億,僅用了幾年時間,增長了100倍。生成的提示和標記數量,正如我之前提到的,從幾百個標記增加到數千個標記。當然,我們今天比以往任何時候都更多地使用人工智能。因此,我們需要一種專門用於思考、專門用於推理的計算機設計。而這就是Blackwell,一臺思考機器。這些Blackwell將進入一種新型數據中心,本質上是專門用於生產標記的人工智能工廠。而這些標記將成爲你的「智能積木」。

是的,我知道。讓我非常高興的是,歐洲正在全力投入人工智能。未來幾年,這裏建設的人工智能基礎設施將增加一個數量級。

我想感謝你們所有人與我們合作。祝你們在Viva Tech有一個美好的體驗。謝謝。說再見。再見。多拍幾張照片。多拍幾張照片。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

英偉達 AI工廠 Blackwell 量子計算 Omniverse
相关文章