3月22日,玩家和AI從業者們又愛又恨的老黃,帶著他的新“核彈”來了。遺憾的是,這次的新“核彈”與玩家沒有太大關系,主要是針對企業和工業市場,與玩家有關的RTX40系估計最快也要等到9月份才會有消息。
好了,廢話不多說,讓我們看看老黃這次又拿了怎樣的“大寶貝”出來。首先是A100顯卡的接任者,新一代計算卡皇H100閃亮登場,H100采用全新的Hopper架構和臺積電最新的4nm工藝,各方面的參數對比上一代的A100都有明顯的提升。
英偉達的超級服務器芯片Grace也再度曝光,對比上一次給出的數據,此次曝光的Grace芯片性能有了驚人的提升,根據發布會的描述來看,英偉達似乎也走上與蘋果相同的道路,用更多的芯片拼裝成一顆處理器。
除了硬件方面的產品曝光和發布,英偉達在軟件領域同樣帶來了不少新東西,比如主打云端協作的OmniverseCloud,讓多名用戶可以在云端直接參與同一個媒體文件的編輯和渲染等工作。
此外英偉達還展示了不少基于虛擬現實環境的工業、交通模擬案例,還有一套由AI驅動的虛擬角色系統,該系統可以通過深度學習進行動作訓練,訓練結束后不需要額外的骨骼動作設計等操作就能夠依照指令做出對應動作,這下不僅是AI從業者狂喜,電影及游戲從業者也要狂喜。
Web3設計實驗室Kondux加入英偉達初創加速計劃:金色財經報道,Web3設計實驗室Kondux宣布已加入英偉達初創加速計劃NVIDIA Inception,雙方將合作創建可互操作性的3D資產,并且構建與NVIDIA Omniverse相關軟硬件所需的應用程序接口(API)工具,所有這些技術都將作為安全的數字資產分層,提供最高級別的所有權保護。(globenewswire)[2022/9/17 7:03:07]
不得不說,老黃這次帶來的東西并不少,每一樣都能對AI等行業的發展帶來明顯的改變,下面我們就來詳細的看看英偉達到底都發布了什么吧。
H100與Grace
從去年開始,就有消息稱英偉達將會在今年發布新一代計算卡,并且將用上全新的Hopper架構。目前來看消息準確的,只不過當初大家猜測新一代計算卡將采用臺積電5nm工藝,但是如今看來英偉達選擇一步到位使用了最新的4nm工藝,雖然本質上是5nm+,但是在功耗方面則有著更好的表現,而且也可以集成更高的晶體管。
實際上,從H100的核心規格來看,也不難理解為什么英偉達最終選了4nm,高達800億的晶體管集成度,比上一代A100多了整整260億個,內核數量則是提高到了16896個,這是目前世界上內核數量最高的芯片核心,同時也是上一代100的2.5倍。
英特爾:高端獨立顯卡將在今夏面世 屆時將和英偉達、AMD全面競爭:6月15日消息,英特爾6月15日面向臺式機市場推出首款顯卡產品銳炫A380,建議零售價1030元,中國市場首發。根據命名規則,A380屬于英特爾“銳炫”系列顯卡GPU的3系列,定位入門級市場,采用臺積電N6制程工藝制造。在后續產品發布上,英特爾也提及更高端的獨立顯卡將在今年夏季面世,屆時英特爾將在GPU市場和英偉達、AMD展開全面競爭。(金十)[2022/6/15 4:28:25]
夸張的內核參數提升帶來的性能提升也極為夸張,根據英偉達官方給出的數據,H100的浮點計算和張量核心運算能力將比上一代提升至少3倍,FP32高達60萬億次/秒,而上一代的A100為19.5萬億次/秒。
H100還將是首款支持PCIe5.0和HBM3,讓內存帶寬達到驚人的3TB/s,老黃表示只需要20張H100就可以處理目前全球的網絡流量,雖然聽起來很夸張,但是確實體現出了H100夸張的性能參數。
強大性能也伴隨著夸張的功耗,英偉達給出的H100功耗高達700W,作為對比上一代A100的功耗僅400W,不過用2倍的功耗換來3倍的性能提升,整體來說也不虧。
英偉達 CEO:我們正處于區塊鏈和支持 NFT 的元宇宙的“風口浪尖”:英偉達 CEO Jensen Huang 在虛擬 Computex 會議上表示,他“相信我們正處于區塊鏈和支持 NFT”元宇宙的風口浪尖上,并熱情洋溢地談了它的潛力。(cointelegraph)[2021/6/13 23:33:09]
H100還針對AI訓練等所要用到的模型進行針對性優化,為Transformer搭載了優化引擎,讓大模型的訓練速度可以提升至原來的6倍,極大的降低了大型AI模型等訓練所需要的時間,這個特性也與下面將會談到的AI虛擬角色系統相呼應。
在英偉達給出的測試數據中,訓練一個擁有1750億參數的GPT-3模型,時間將由原來的一周降低到僅需19小時,而一個擁有3950億參數的Transforme模型也僅需21小時就可以完成訓練,效率提升近9倍。
雖然參數看起來十分美好,但是實際的性能表現如何還有待后續的實際測試結果來揭曉,至少從RTX30系和A100的經驗來看,最終的實際性能提升幅度可能在2倍-2.5倍之間,不太可能真的達到3倍,不過即使只有2倍提升也已經相當出色,至少在AI方面已經完全碾壓了AMD的計算卡。
英偉達更新驅動升級RTX 3060挖礦限制器:4月30日消息,英偉達發布了GeForce 466.27驅動,更新描述中指出此次更新升級了RTX 3060的挖礦限制器,僅適用于5月中旬以后的產品。(中關村在線)[2021/4/30 21:14:00]
而且,H100還引入了英偉達最新的NVIDIANVLink第四代互連技術,該技術能夠進一步提升多GPU串聯的效率,在英偉達給出的數據中,串聯后的I/O帶寬能夠擴展至900GB/s,比上一代提升了50%。
再來看看英偉達的新“玩具”Grace,這是英偉達為服務器業務準備的超級服務器芯片,此前就有過不少的曝光,這次則是有了更多的信息,同時還帶來了全新的系列產品。Grace芯片采用最新的ArmV9架構,英偉達以此為基準打造了兩款超級芯片——GraceHopper和GraceCPU超級芯片。
其中,GraceHopper由一個GraceCPU和一個Hopper架構的GPU的GPU組成,兩者將會形成一個完整的運算系統,只需要一顆芯片就可以搭建出一個強大的運算服務器,同時也可以將多個芯片串聯起來組成更龐大的運算陣列。
動態 | 英偉達斥資70億美元收購Mellanox 曾有報告稱其搶占75%加密市場份額:據騰訊科技消息,3月10日,一位知情人士表示,芯片制造商英偉達即將以70多億美元現金收購其同行Mellanox Technologies。此舉將提振其數據中心芯片業務,從而降低對視頻游戲行業的依賴。此前2月15日消息,盡管加密貨幣市場低迷,英偉達依靠游戲、數據中心等銷售仍保持收入,2018年財務報告顯示,其總收入增長21%。而此前加拿大皇家銀行(RBC)分析師曾發布報告稱,英偉達搶占了75%的數字貨幣市場份額,由于加密市場低迷行情,其面臨的困境比想象中嚴重。[2019/3/11]
而GraceCPU超級芯片則是由兩顆GraceCPU組成,兩顆芯片通過NVIDIANVLink-C2C技術互連,組成一個內置了144個Arm核心并且擁有1TB/s內存帶寬的巨無霸級芯片。
說實話,英偉達的這顆GraceCPU超級芯片很難不讓人聯想到蘋果在春季發布會上發布的M1Ultra,同樣是基于Arm架構,同樣是由兩顆芯片組合而成,同樣也有著夸張的內存帶寬和性能表現。
顯然,芯片互聯拼裝技術已經成為行業的趨勢之一,AMD方面也曝光有采用類似技術的CPU正在研發中,最早將在2023年與大家見面。只能說如今單顆芯片的性能發展已經接近極限,接下來想要擁有更大的提升,或許將不得不借助類似的互聯技術進行芯片堆疊了。
不過,GraceCPU超級芯片的功耗并不低,英偉達官方給出的數據是500W,已經遠遠超過了傳統的x86架構CPU,當然,考慮到GraceCPU超級芯片的夸張性能:SPECrate跑分740分,較第二名提升60%,這個功耗也不是不能接受。
顯然,在Arm服務器領域,英偉達的野心是非常大的。
英偉達的虛擬世界
除了一堆高性能的硬件,英偉達此次也展出了不少的軟件示范案例,其中就包括使用H100等硬件來模擬一個虛擬現實環境,用以進行各種測試和模擬。在英偉達的示范中,未來的企業可以通過強大的英偉達硬件構建一個擬真的虛擬測試環境,并在其中測試自動駕駛、智能工廠的運作等。
通過虛擬測試環境的使用,研究者可以更輕松的測試自動駕駛面對各種突發狀況時的反饋,并且在測試中直接定位問題,降低整體的測試成本。此外,還可以構建一個1:1的“數字化工廠”提前模擬運行,尋找提高效率和找到可能出現的問題,降低工廠正式運行后出現問題的概率。
英偉達將這一套應用稱為“數字孿生”,能夠大幅度降低自動化工廠和自動駕駛等方面的研究及測試投入。
OmniverseCloud是英偉達新推出的一款云端創作服務,用戶通過OmniverseCloud可以在任意地點訪問和編輯大型3D場景,并且無須等待大量數據的傳輸,并且還可以讓用戶能夠直接在線協作共同搭建3D模型。
在過去,3D模型和3D場景的協同構建都需要在一個服務器上進行,而在OmniverseCloud推出后,相關創作者就可以通過任意支持OmniverseCloud的終端,直接用網絡訪問協作空間并參與其中,極大的提升了創作者的響應速度和工作自由。
另外,英偉達還為創作者們準備了第二個驚喜,一套由AI驅動的虛擬角色系統,該系統可以讓AI在短時間內完成訓練,學會各種指令所對應的動作。比如一個簡單的劈砍動作,在正常的制作流程中首先需要動作架構師通過對動作骨架的一步步調整,然后再放到場景中進行測試,整個流程需要耗費大量的時間,而且每個不同的動作都需要重新進行調試。
而在這套AI虛擬角色系統的幫助下,當你想要虛擬模型做出劈砍的動作,只需要一條指令,AI就會從已學習的動作中找出關聯動作并自動運行,直接節省了大量的時間和人力,對于游戲開發者和特效制作者而言,這個系統將讓他們能夠將更多的精力放在其它地方。
英偉達的此次發布會,雖然并沒有太多的提到元宇宙,但是從硬件到軟件都是未來構建元宇宙的基礎。目前元宇宙無法成為現實的原因主要是兩點,一個是硬件性能無法滿足我們的需要,另一個就是軟件領域尚不成熟,無法提供實時的擬真環境模擬,而這兩者是點亮元宇宙科技的基礎。
在此之前,我們首先需要的就是更強大的計算硬件及更智能的AI系統。英偉達的H100,虛擬現實環境及AI虛擬角色系統的出現,將讓我們朝著真正的元宇宙再邁進一大步。
在正式開始本文內容之前,我們先對本文中主要涉及的幾個概念進行厘清:節點運營商:特指具體在區塊鏈上運行節點的運營商。他們需要使用設備來運行鏈的客戶端,保持在線,維護區塊鏈的共識.
1900/1/1 0:00:004月2日,TerraformLabs成員Ezaan于社區提出新提案,建議引入穩定幣流動性的新“黃金標準”4pool.
1900/1/1 0:00:00長期以來,以太坊L2之爭的焦點都被ZKRollup和Optimisticrollup兩者占據。因為OP的EVM兼容性和技術較為成熟等特性,更容易被項目開發者采用,因此,OP在當下更為通用和主流.
1900/1/1 0:00:00紐約時報專欄作家EzraKlein曾提出這樣一個觀點:目前的互聯網尤其缺少的是驗證“身份”、“所有權”和“真實性”。正是這些東西使創作者有可能因為他們的作品而獲得報酬.
1900/1/1 0:00:00推薦理由: “我是誰”,是任何一個有自我意識的人對于他自己的一種自覺意識,在這種自覺意識中,他成為他自己思考的對象.
1900/1/1 0:00:00DeFi數據 1.DeFi代幣總市值:1402.31億美元 DeFi總市值數據來源:coingecko2.過去24小時去中心化交易所的交易量:65.
1900/1/1 0:00:00