NVIDIA 發表 8 萬核桌面級超級電腦 - 3C

Hedda avatar
By Hedda
at 2018-03-28T13:21

Table of Contents

核彈教父勢不可擋:NVIDIA 發表 8 萬核桌面級超級電腦
https://imgur.com/JFLEyPk.jpg
在標準運算技術的時代,推動進步的是 Intel 和由它發揚光大的摩爾定律。但 2012 年
之後,當運算技術進入了名為「深度學習」的全新時代,創辦於 1993 年的 NVIDIA 卻成
為了強勢黑馬。
「NVIDIA 通過深度學習平台所取得的創新,許多都已成為世界標準。我們以 遠超摩爾定
律的速度推動運算性能飛速成長,促進健康、交通、科學探索等無數領域的突破。」在一
場演講中,創辦人兼 CEO 黃仁勳自豪地對數千名觀眾表示。
去年,站在同一個舞台,黃仁勳說他一直想要找到摩爾定律之後的路。而以神經網絡為基
礎的人工智慧,其爆發式發展到了 2018 年已經過去了五年。而在這五年裡,GPGPU(通
用圖形處理器)成為了人工智慧研發的利器,在運算密集型的深度學習任務上獨步天下。
NVIDIA 指出,和五年前的 Ferml GPU 架構相比,最新一代的 Volta GPU 架構的浮點運
算能力提升了 25 倍。
「摩爾定律 10 年 5 倍,」黃仁勳說,「這就是我們超越摩爾定律的證明。」
https://imgur.com/o0IT49o.jpg
NVIDIA 開發者社群的擴張迅速,印證了黃仁勳大膽的聲明。該公司統計,GPU 開發者在
今年將達到 82 萬人,比五年前成長了 5 倍;在 NVIDIA GPU 上開發必備的分散式運算
架構工具包 CUDA,下載數量超過了 800 萬,其中約一半是在過去一年裡下載的。不僅如
此,該公司提供的 GPU 加速技術還被世界上大量超級電腦協同採用,其 Volta GPU 為美
國的 Summit 和 Sierra 兩大超級電腦增加了大約 100 PFLOPS(百萬兆次浮點運算能力
)。

在美國時間 3 月 27 日的 NVIDIA GPU 技術大會 (GTC 2018) 上,該公司帶來了多個在
深度學習、自動駕駛和機器人領域足以掀起巨浪的新產品。其中最為重頭的,則是一年一
度的新核彈級顯卡 —— 這次,並不是 GTX 11 系列,也不是傳聞甚囂塵上的「礦卡」,
而是一台被黃仁勳稱為「桌面超級電腦」的工作站:NVIDIA DGX-2。

DGX-2 是一台專門用於人工智慧訓練和 / 或推理任務的桌面電腦:
https://imgur.com/uutFs3C.jpg
這是它的內部結構:
https://imgur.com/uwoDOQq.jpg
你可以看到,在圖中 1 和 2 的位置看起來是很多塊晶片。其實他們是 NVIDIA 的
Tesla V100 Volta 架構 GPGPU,單枚算力達到雙精度 7.8 TFLOPS(兆次浮點運算)、
單精度 15.7TFLOPS、深度學習 125TFLOPS。

而 DGX-2 單機箱安裝了 16 枚 V100,總體性能達到了驚人的 2PFLOPS—— 業界第一台
超過百萬兆次浮點運算能力的單機箱電腦 —— 稱它為超級電腦或許並不浮誇。

但 DGX-2 的算力並非靠堆疊出來,如果它們之間不能實現高頻寬的數據互通則無意義。

時間倒回兩年前,NVIDIA 有意在深度學習的設備市場上對 Intel 發起直接挑戰,推出了
Pascal 架構的 P100 GPGPU。在當時,主流伺服器 PCIe 總線接口的頻寬和時延,已經
無法滿足 NVIDIA 的需求。於是它們開發出了一個新的設備內互聯標準,叫做 NVLink,
使得頻寬達到了 300 GB/s。一個 8 枚 GPGPU 的系統裡,NVLink 大概長這樣:
https://imgur.com/W6Gld6e.jpg
然而 NVLink 的標準拓撲結構在理論上最多支援 8 枚 顯卡,仍不足以滿足 NVIDIA 對於
新系統內置更多顯卡的需要。於是在 NVLink 的基礎上,NVIDIA 開發出了一個名專門在
顯卡之間管理 NVLink 任務的協調處理器,命名為 NVSwitch。這個組建在 DGX-2 上,讓
16 枚 GPGPU 中兩兩之間實現 NVLink 互通,總頻寬超過了 14.4 TB。

這個數字創造了桌面級電腦內總線接口頻寬的新高,但實現它的目的並非跑分,而在於
DGX-2 可以 1)更快速地訓練一個高複 雜度的神經網絡,或 2)同時訓練大量不同結構
的神經網絡。
https://imgur.com/SlhdeuS.jpg
NVIDIA CEO 黃仁勳,背景是 NVSwitch 示意圖
N 卡之所以被稱為核彈有一種另類的解釋方式:它的多核心架構在這個依核心數量論高下
的時代顯得超凡脫俗 —— 動輒幾百、上千個 CUDA 核心,令人不明覺厲。而在 DGX-2
上,16 枚 V100 的 CUDA 核數達到了瘋狂的 81,920 核心。這個事實,結合 NVSwitch
技術、512GB 現存、30TB NVMe 固態硬盤、兩枚至強 Platimum CPU 和高達 1.5TB 的主
機記憶體 ——

黃仁勳用 GPU 深度學習裡里碑式的傑作 AlexNet 來舉例。研究者 Alex Krizhevsk 用了
6 天,在 NVIDIA GPU 上訓練 AlexNet,這個研究首次利用梯度下降法和卷積神經網絡
進行電腦圖像識別,顯著優於枝前的手調參數法,拿下了 ImageNet 圖像識別競賽冠軍。
AlexNet 讓 Alex 世界聞名,這 6 天可以說值了。
然而,「同樣的 8 層卷積神經網絡,我用 DGX-2 跑了一下,只用 18 分鐘就達到了同樣
的結果,」黃仁勳說,「五年,500 倍的進步。」

這說明很多東西。其中有一條:在這五年裡,NVIDIA 的技術進步節奏已經無法用摩爾定
律來描述了。

DGX-2 主要的應用場景是顯著加速高端科研和商業人工智慧產品的研發和面市。它顯然不
是一台消費級的產品 —— 高達 150 萬美元的售價 ……
https://imgur.com/1WEf6tL.jpg
開玩笑的,最終售價是 40 萬美元 ……
https://imgur.com/dXnNvo0.jpg
然而即便是 40 萬美元的未含稅價格,還是讓一些手頭緊張的工業使用者望而卻步。別擔
心,DGX-2 只是今天 NVIDIA 在人工智慧領域的幾個新產品之一,其它還有:

1.DGX 機箱裡面的 V100 GPGPU 升級版,記憶體升級到了 32 GB,那些只需要單枚或者少
量顯卡的研究者,生產力得到解放,可以訓練更複 雜的神經網絡了:
https://imgur.com/VwwvCr8.jpg
2. 面向包括電影視覺特效、建築設計等創意工業,推出的 Quadro GV100 顯卡產品。
Quadro GV100 是一塊工作站顯卡,裡面是兩枚 V100 GPU。這塊顯卡支援 NVIDIA 最新的
頂級光線追蹤 (Ray Tracing) 技術 NVIDIA RTX:
https://imgur.com/6sQkuiA.jpg
3.NVIDIA RTX:如前述,NVIDIA 開發的一種極其複 雜,且運算密集型的光效技術。簡單
來說,像在真實世界裡那樣,摻雜的多光源、複雜的環境,導致光線照到不同材質的物品
上所呈現出的散逸,以及物品對光源、對其它物品,在曲面、球面甚至不規則表面所產生
的反射效果,或者光源照射到玻璃杯產生的不規則投影 ——這些光效和陰影在過去極難
通過電腦完美呈現,但 NVIDIA 今天向著亦真亦幻往前走了一步。
https://imgur.com/KGnEf0V.gif
4.TensorRT 4,新一代的 TensorFlow 推理工具;GPU 對美國科技公司在去年推出的深度
學習兼容框架標準 ONNX 兼容;終於可以在 Kubernetes (K8S) 上管理 NVIDIA GPU 了,
支援 AWS、Google Cloud Platform、阿里雲等。

5. 新的自動駕駛車載運算架構 ORIN。

6. 駕駛虛擬模擬技術 Drive SIM & Constellation。這是一個很有趣的技術,可以讓
NVIDIA 以及其它開放平台的科技公司在 GPU 上模擬自動駕駛汽車訓練,顯著降低開放
道路真車訓練的危險性。這個技術還有一個獨特的用法:接入了該平台的汽車,在未來可
以 遠程操控,黃仁勳演示了一個司機在會場,用 VR 頭盔和手把 遠程駕駛一輛汽車躲避
障礙並成功停車。
https://imgur.com/Fe1YYTW.jpg
7. 機器人開發開放平台 ISSAC,利用了 NVIDIA 在自動駕駛上積累的一些技術,比如高
精度地圖繪制等。

8.Project CLARA,一個雲端醫療診斷的計畫。這個計畫非常有趣,簡單來說,NVIDIA 醫
院提供基於雲端的醫療圖像識別超級電腦,一個場景是上傳心臟 B 超的即時視頻流,雲
端的顯卡運行訓練好的神經網絡,可以將畫面變成 3D 的體積圖像,然後即時將器官顯示
出來,從而生成一個更容易觀看的 3D 畫面。現場演示的畫面還給出了器官功能的即時數
據,包括每次搏動的輸血量等,令人印象深刻。
https://imgur.com/dvcllam.jpg
矽谷是一個 T 恤帽衫和拖鞋統治的地方,而 NVIDIA 的創辦人黃仁勳在這裡是個相當明
顯的另類:一身皮夾克的他,工程師出身又負責過市場,演講起來絲毫沒有許多其它科技
大佬身上特有的「虛偽」氣息。

在 GTC 2018 上,可能覺得自己氣場還不夠強,他直接站在了椅子上接受記者的提問;他
明顯接受過公關訓練,但在回答提問時的誠懇仍然在科技大佬中顯得獨特,甚至直接問旁
邊的公關「你是不是想打斷我?但我已經說完了。」人稱「核彈教父」的黃仁勳,名副其
實。

他吐槽常見的 x86 架構伺服器站,一個機櫃動輒數十台伺服器,十幾台機櫃總成本成百
上千萬美元。而取得同樣的深度學習訓練效果,只需幾台或者十幾台 V100,或者一台
DGX-2,價格至多六位數。這也是為什麼他在演講時,不斷對台下的觀眾重復:多買更划
算!(The more you buy, the more you save.) 幾乎將一場 GPU 技術演講變成了電視購
物。

「Watch now ‘cause here I come.」 是黃仁勳上台前的暖場歌曲裡的一句歌詞。

至少在今天,將摩爾定律踩在腳下,黃仁勳和他的 NVIDIA 看起來勢不可擋。
https://imgur.com/ZiE6xlm.jpg


https://goo.gl/51bbL6
可以把整個PTT網站放進去嗎?
這樣上PTT會更快嗎?

--
Tags: 3C

All Comments

Kelly avatar
By Kelly
at 2018-03-30T01:00
買來幫我想晚餐到底要吃什麼
Thomas avatar
By Thomas
at 2018-04-02T00:33
8萬核:決定了 請你吃荷蛋
Margaret avatar
By Margaret
at 2018-04-03T01:07
GPGPU反而不覺得老黃會有什麼優勢 AMD還不出朝阿
Mia avatar
By Mia
at 2018-04-03T13:58
買來幫我決定決定一樓早餐要吃什麼
Susan avatar
By Susan
at 2018-04-07T13:19
五樓買十台送版友
Jake avatar
By Jake
at 2018-04-11T19:59
謝謝5樓 <3
Yedda avatar
By Yedda
at 2018-04-12T15:25
所以玩麥塊能穩60嗎
Olive avatar
By Olive
at 2018-04-16T08:34
好 謝謝五樓出錢 我先預約一台了
Olive avatar
By Olive
at 2018-04-18T10:23
礦雞…
Hardy avatar
By Hardy
at 2018-04-20T18:20
謝謝5樓
Ula avatar
By Ula
at 2018-04-21T04:39
謝五樓
Dora avatar
By Dora
at 2018-04-24T09:57
買一台多久可以回本?
Daph Bay avatar
By Daph Bay
at 2018-04-28T13:21
上PTT能穩定60偵嗎?
Genevieve avatar
By Genevieve
at 2018-05-01T16:24
超算領域AMD還不知道在哪
Ina avatar
By Ina
at 2018-05-04T21:42
五樓人真好
Andy avatar
By Andy
at 2018-05-05T11:53
真的永遠是那件欸…
Bennie avatar
By Bennie
at 2018-05-05T14:28
研究型電腦哪有在管回本的…
Edwina avatar
By Edwina
at 2018-05-08T15:46
膠水被老黃超車 幫AMD QQ
Kama avatar
By Kama
at 2018-05-11T20:51
五樓+1
Sandy avatar
By Sandy
at 2018-05-12T12:22
上PTT能144Hz嗎?目前很少電腦能達到這個需求
Regina avatar
By Regina
at 2018-05-14T09:59
黃乙己 你又在亂堆核心了!
Delia avatar
By Delia
at 2018-05-15T23:28
20年後中階桌機電腦屌打
Tom avatar
By Tom
at 2018-05-20T19:35
老黃這麼急著卡膠水位置 該不會Navi直接粘到消費級
Queena avatar
By Queena
at 2018-05-25T06:57
能挖礦嗎 不能的話毫無實用性(嫌棄臉
Adele avatar
By Adele
at 2018-05-25T12:25
Can it run CRYSIS?
Lauren avatar
By Lauren
at 2018-05-26T08:29
NV link做很久了八 現在只是再把頻寬弄得更高
Yedda avatar
By Yedda
at 2018-05-27T05:58
這看起來不太像是膠水啦 就是加強版的NVlink
Sierra Rose avatar
By Sierra Rose
at 2018-05-27T21:31
MCM的只有那6顆NVSwitch
Delia avatar
By Delia
at 2018-05-31T04:23
這台挖礦好嗎 好的話考慮買台來玩玩
Queena avatar
By Queena
at 2018-05-31T13:24
八萬核屌打AMD
Zanna avatar
By Zanna
at 2018-06-02T00:00
可以挖 但是我覺得回不了本
Emily avatar
By Emily
at 2018-06-06T17:23
可惡 想挖礦
Eartha avatar
By Eartha
at 2018-06-07T11:37
這就老黃版的膠水啊 AMD的野心比較大的感覺 要做GPU
直連
Olivia avatar
By Olivia
at 2018-06-08T00:45
NV單顆就可以純軟體完美模擬PS4了,因為效能差距達
到10倍
Agatha avatar
By Agatha
at 2018-06-12T23:41
NVLink不是膠水,比較像PCIe5.0
Agatha avatar
By Agatha
at 2018-06-17T00:56
想買信仰外套 XD
Carol avatar
By Carol
at 2018-06-18T18:08
等等 我沒看到價錢 我買不起 連賣屁股都買不起
Olga avatar
By Olga
at 2018-06-23T10:16
PCIe5.0 哈哈哈 113資管重新定義
John avatar
By John
at 2018-06-27T22:04
老黃幹話天王
Frederica avatar
By Frederica
at 2018-07-01T21:12
買這台打lol會頓嗎
Zenobia avatar
By Zenobia
at 2018-07-06T00:20
非公開規格PCIE5.0 XD 你當老黃這是多快
Robert avatar
By Robert
at 2018-07-07T08:57
399K鎂 賣屁股1000次都不知道買不買得起XDDDD
Mason avatar
By Mason
at 2018-07-08T02:22
五樓大推,謝謝五樓
Caroline avatar
By Caroline
at 2018-07-08T15:09
好個火力展示
Anthony avatar
By Anthony
at 2018-07-10T11:37
NV單顆可以模擬PS4是什麼意思?
Ophelia avatar
By Ophelia
at 2018-07-14T04:45
算力多少?
Charlotte avatar
By Charlotte
at 2018-07-19T03:47
謝謝五樓 五樓好心
Edith avatar
By Edith
at 2018-07-21T06:42
礦廠懶得跟你比 tune一下算力爽爽賣到斷貨
Hamiltion avatar
By Hamiltion
at 2018-07-23T05:35
不就一棟南部透天麻
William avatar
By William
at 2018-07-24T11:48
上PTT肯定穩
Zora avatar
By Zora
at 2018-07-26T01:27
the more you buy the more you save
Andy avatar
By Andy
at 2018-07-28T06:16
還以為一台八萬也太爽,結果是八萬core
1 core 可以只賣1元嗎?
Catherine avatar
By Catherine
at 2018-07-29T01:26
超強 耗電量應該也驚人 熱度就先不考慮了...
William avatar
By William
at 2018-08-02T03:07
5年前的今天kepler已經開賣了啊
Kama avatar
By Kama
at 2018-08-05T11:36
說錯,5年前的今天kepler都推出一年了
Emma avatar
By Emma
at 2018-08-07T23:47
8萬核 上PTT 會頓嗎
Regina avatar
By Regina
at 2018-08-09T04:27
這台不是給普通用戶使用的啦 要養這台本要夠粗才行
Joe avatar
By Joe
at 2018-08-11T20:02
請問能多開天堂嗎?
Regina avatar
By Regina
at 2018-08-12T12:32
用來上ptt一定很爽
Irma avatar
By Irma
at 2018-08-14T22:15
感謝五樓顆顆
Isla avatar
By Isla
at 2018-08-19T11:22
所以現在天網換成nVidia了嗎
Heather avatar
By Heather
at 2018-08-21T18:37
NV只是提供硬體 真要說天網的話 目前只能是Google
超過9成的使用搜尋流量 統計數據庫絕對堪稱第一
Emma avatar
By Emma
at 2018-08-23T18:51
笑死 要跟google比啥? 天網???
Tom avatar
By Tom
at 2018-08-26T22:10
就算比硬體 雲端中心 NV是要排老幾? 有沒有點概念阿
Leila avatar
By Leila
at 2018-08-29T20:56
目前歐美各國已經注意這點 開始有人訴訟打壓了
Lauren avatar
By Lauren
at 2018-08-31T02:22
以AI演算法而言 IBM 微軟都不算差 看數據庫部分就是
Ingrid avatar
By Ingrid
at 2018-09-01T07:23
應是輸Google一大截 因為使用者流量差太多了
Belly avatar
By Belly
at 2018-09-05T08:25
但實作出天網的在對岸
Erin avatar
By Erin
at 2018-09-05T21:55
對岸要不要搞個天網鏈,把礦工算力抓去分析臉孔聲音
Jack avatar
By Jack
at 2018-09-09T17:36
謝謝5樓 <3
Eden avatar
By Eden
at 2018-09-10T23:10
謝五樓
Zanna avatar
By Zanna
at 2018-09-14T16:57
這該不會是做出來挖礦的吧....
Hedy avatar
By Hedy
at 2018-09-15T02:24
可以吃雞嗎
Ina avatar
By Ina
at 2018-09-15T03:42
NVLink的頻寬=PCIe5.0宣稱達到的頻寬
Ingrid avatar
By Ingrid
at 2018-09-15T07:57
NV版的膠水還沒研發出來
Ingrid avatar
By Ingrid
at 2018-09-18T23:43
終於有能順跑PTT的電腦了
Vanessa avatar
By Vanessa
at 2018-09-23T19:42
順帶一提PCIe4.0已經完成標準化,X1單向2G,X16單向3
2G
2019商品化,NV Link頻寬80G
Steve avatar
By Steve
at 2018-09-26T00:52
PS4單精1.4T,如果用模擬器完美模擬需要14T的性能,G
V100達標了。
Ursula avatar
By Ursula
at 2018-09-26T18:38
nV和台廠供應鏈的共同成果
Olga avatar
By Olga
at 2018-09-30T05:07
基本上是晶片再放大不可能才這樣搞
Ina avatar
By Ina
at 2018-10-02T22:14
過一個switch他還是在搞膠水 控制器外接而已
Donna avatar
By Donna
at 2018-10-03T03:21
為什麼完美模擬X86和GCN需要14T性能?
George avatar
By George
at 2018-10-06T16:08
中國現在還在1984進行中拉,給個二十年看看
David avatar
By David
at 2018-10-08T02:03
五樓我要一台謝謝
Harry avatar
By Harry
at 2018-10-08T16:14
AMD表示
Frederic avatar
By Frederic
at 2018-10-09T14:53
老黃真是最帥亞洲人
Harry avatar
By Harry
at 2018-10-13T14:25
有生之前有辦法買到普及的八萬核嗎
Irma avatar
By Irma
at 2018-10-15T08:49
皮衣才是主體 老黃只是放置架
Todd Johnson avatar
By Todd Johnson
at 2018-10-17T04:16
老黃:買一張不夠就買整箱!
Rae avatar
By Rae
at 2018-10-20T03:03
Sony的規格都是特規,不走IEEE標準
Delia avatar
By Delia
at 2018-10-23T18:31
AMD只宣稱客製化,並沒有說有相容AMD64
Dinah avatar
By Dinah
at 2018-10-26T18:52
哪有特規,重新發明輪子的成本不划算
Andrew avatar
By Andrew
at 2018-10-28T01:13
PS4客製就是選PC的IP堆積木而已
Victoria avatar
By Victoria
at 2018-10-29T11:52
軟體要模擬的也只是軟體API差異
而不是要模擬硬體指令面。
Noah avatar
By Noah
at 2018-11-01T09:47
你還是沒解釋14T怎麼計算出來的
Irma avatar
By Irma
at 2018-11-01T21:44
超級電腦都是在用雙精度在算的 這台頂多128TFLOPS
是很強但還排不上top500的邊 100台ㄧ起做cluster可
能比較有看頭
George avatar
By George
at 2018-11-05T18:43
反正 ML 單精度夠用
Liam avatar
By Liam
at 2018-11-07T06:59
偽PC家還在繼續唬爛數據 真了不得
Jacob avatar
By Jacob
at 2018-11-10T04:34
謝五隆恩
Joe avatar
By Joe
at 2018-11-11T11:34
跟偽PC家討論本來就是不明智的選擇
Ula avatar
By Ula
at 2018-11-13T09:45
40萬美元其實真的不貴...2Pflops欸

虛擬實境技術再進一步輝達新突破用VR開車

Andy avatar
By Andy
at 2018-03-28T13:01
標題: 虛擬實境技術再進一步 輝達新突破用VR開車 連結: https://tw.appledaily.com/new/realtime/20180328/1323682/ 內文: https://www.youtube.com/watch?v=qpuZ05k5ewQ 今年的GPU技術大會(GTC) ...

淘寶27吋IPS 2k 144Hz螢幕使用分享

Gary avatar
By Gary
at 2018-03-28T12:41
其實我買這顆螢幕有一段時間了~ 看板上都沒有分享 就來跟大家來分享一下這顆螢幕 https://i.imgur.com/Z4vtBw1.jpg 這顆螢幕是27吋/144Hz/2k/IPS的螢幕 淘寶上售價1699(合台幣約8000) 集運部分大概花了1500台幣左右 合計大約1萬元 購入的時間大約是去年9月 ...

25k 程式開發機

Cara avatar
By Cara
at 2018-03-28T12:40
已買/未買/已付訂金(元):未買 預算/用途:25k/開發編譯系統程式 CPU (中央處理器):Intel i7-8700【6核/12緒】3.2GHz (↑4.6GHz)/12M/UHD630/65W MB (主機板):技嘉 Z370M D3H【獨家競速板】 ...

機車店 WD 2.5吋綠標SSD 240G 1799元

Audriana avatar
By Audriana
at 2018-03-28T12:29
機車店 WD 威騰 SSD 240G 2.5吋固態硬碟《綠標》 1799元 , 3年保固 , 原廠TBW:80 唯一缺點就是不知道綠標SSD會不會像硬碟那樣容易GG.... (目前自用藍標SSD都很正常) -- 處理器 Intel Core i5-6500 機 殼 ...

Ryzen7 2700/Ryzen5 2600X 真身首曝4月19

Mia avatar
By Mia
at 2018-03-28T12:02
AMD第二代Ryzen處理器定檔4月,據說19號將是開賣日 從法國雜誌CPC Hardware的搶先評測數據來看,基準方面(包括影片轉碼、數學運算、 Blender渲染等) Ryzen 7 2700X超出上代旗艦Ryzen 7 1800X大約9%,同時領先Core i7-8700K 10%左右 ; 甚至Ryz ...