nVidia新GPU架構Volta發表人工智慧強心劑 - 3C
By Emma
at 2017-05-12T01:07
at 2017-05-12T01:07
Table of Contents
nVidia 新 GPU 架構 Volta 發表,為人工智慧注入一針強心劑
http://imgur.com/8v1iww9
今年的 GTC 2017(GPU Technology Conference 2017)中,Nvidia CEO 黃仁勳帶來了全
新的 GPU 架構 Volta。1.5 倍的雙精度浮點數計算效能提升,以及採用特化架構所帶來
的 12 倍人工智慧計算效能提升,為計算市場帶來震撼的消息。
Nvidia 在 2016 年的 GTC 中,便發表了新的 GPU 架構 Pascal。其中,讓人印象最深刻
的,莫過採用 8 張 Tesla P100 的人工智慧訓練機 DGX-1。一台機器便帶來以往需要數
台伺服器才能達到的效能,為人工智慧發展帶來新氣象。
然而,短短的一年間,Nvidia 又帶來新消息──新的 GPU 架構 Volta。強悍的 R&D 團
隊,將其主要競爭對手遠遠拋在後頭。同時,也讓世人見識到,在後莫爾定律的年代,
GPU 將承接 CPU 的發展速度,推進電腦的計算效能。
新技術突破,奠定 Volta 於人工智慧的王者之姿
這次 Volta 架構帶來數個新技術。 其中,最重要的莫過 Tenser Core。其他還有細部硬
體架構調整、第 2 代 NVLink 以及新軟體支援,讓 Nvidia 在人工智慧領域扮演領導者
。
首先,從硬體架構來看,這次 GPU 架構和前一代 P100 相比,V100 將整數計算單元和浮
點數計算單元獨立出來,讓整數計算和浮點數計算可同時運行,物盡其用。此外,每個
SM(Streaming Multiprocessor)中新增 8 個 Tensor Core,讓 Volta 帶來 12 倍的
訓練提升以及 6 倍的決策加速。
http://imgur.com/IK6a0Za
究竟 Tensor Core 是如何運作的呢?首先,假設我們要求解兩個 4×4 矩陣相乘再加上
一個 4×4 矩陣,如下圖,那將會產生 4×4×4 個乘法計算需求。在採用 Tensor Core
之前,需要執行 4 次 4×4 矩陣相乘並相加,相當花時間。
在新 Tensor Core 中,由於一個 Tensor Core 是 4×4×4 的特化計算元件,讓 GPU 可
同時執行 4×4×4 個矩陣相乘並相加,如下圖所示。藉此達到更多計算加速。這就是
Nvidia 對人工智慧所發展的殺手鐧。
http://imgur.com/8p9MvcJ
新舊架構比一比,效能三級跳
那麼 Volta 和 Pascal 究竟有什麼差異呢,就讓我們攤開所有細節來比一比吧!
http://imgur.com/0wSP5Wg
https://goo.gl/1EjFPC
有種AMD不只是車尾燈看不到的感覺 還被耀眼的光芒閃的不要不要的
--
http://imgur.com/8v1iww9
今年的 GTC 2017(GPU Technology Conference 2017)中,Nvidia CEO 黃仁勳帶來了全
新的 GPU 架構 Volta。1.5 倍的雙精度浮點數計算效能提升,以及採用特化架構所帶來
的 12 倍人工智慧計算效能提升,為計算市場帶來震撼的消息。
Nvidia 在 2016 年的 GTC 中,便發表了新的 GPU 架構 Pascal。其中,讓人印象最深刻
的,莫過採用 8 張 Tesla P100 的人工智慧訓練機 DGX-1。一台機器便帶來以往需要數
台伺服器才能達到的效能,為人工智慧發展帶來新氣象。
然而,短短的一年間,Nvidia 又帶來新消息──新的 GPU 架構 Volta。強悍的 R&D 團
隊,將其主要競爭對手遠遠拋在後頭。同時,也讓世人見識到,在後莫爾定律的年代,
GPU 將承接 CPU 的發展速度,推進電腦的計算效能。
新技術突破,奠定 Volta 於人工智慧的王者之姿
這次 Volta 架構帶來數個新技術。 其中,最重要的莫過 Tenser Core。其他還有細部硬
體架構調整、第 2 代 NVLink 以及新軟體支援,讓 Nvidia 在人工智慧領域扮演領導者
。
首先,從硬體架構來看,這次 GPU 架構和前一代 P100 相比,V100 將整數計算單元和浮
點數計算單元獨立出來,讓整數計算和浮點數計算可同時運行,物盡其用。此外,每個
SM(Streaming Multiprocessor)中新增 8 個 Tensor Core,讓 Volta 帶來 12 倍的
訓練提升以及 6 倍的決策加速。
http://imgur.com/IK6a0Za
究竟 Tensor Core 是如何運作的呢?首先,假設我們要求解兩個 4×4 矩陣相乘再加上
一個 4×4 矩陣,如下圖,那將會產生 4×4×4 個乘法計算需求。在採用 Tensor Core
之前,需要執行 4 次 4×4 矩陣相乘並相加,相當花時間。
在新 Tensor Core 中,由於一個 Tensor Core 是 4×4×4 的特化計算元件,讓 GPU 可
同時執行 4×4×4 個矩陣相乘並相加,如下圖所示。藉此達到更多計算加速。這就是
Nvidia 對人工智慧所發展的殺手鐧。
http://imgur.com/8p9MvcJ
新舊架構比一比,效能三級跳
那麼 Volta 和 Pascal 究竟有什麼差異呢,就讓我們攤開所有細節來比一比吧!
http://imgur.com/0wSP5Wg
https://goo.gl/1EjFPC
有種AMD不只是車尾燈看不到的感覺 還被耀眼的光芒閃的不要不要的
--
Tags:
3C
All Comments
By Andrew
at 2017-05-16T07:44
at 2017-05-16T07:44
By Kelly
at 2017-05-19T02:01
at 2017-05-19T02:01
By Skylar Davis
at 2017-05-22T23:53
at 2017-05-22T23:53
By Faithe
at 2017-05-26T12:26
at 2017-05-26T12:26
By Jessica
at 2017-05-30T11:37
at 2017-05-30T11:37
By Rae
at 2017-06-02T08:37
at 2017-06-02T08:37
By Linda
at 2017-06-04T14:34
at 2017-06-04T14:34
By Suhail Hany
at 2017-06-06T20:32
at 2017-06-06T20:32
By Linda
at 2017-06-10T23:59
at 2017-06-10T23:59
By Belly
at 2017-06-14T02:52
at 2017-06-14T02:52
By Agnes
at 2017-06-18T07:59
at 2017-06-18T07:59
By Belly
at 2017-06-20T13:25
at 2017-06-20T13:25
By Annie
at 2017-06-24T03:16
at 2017-06-24T03:16
By Ula
at 2017-06-28T23:01
at 2017-06-28T23:01
By Linda
at 2017-06-30T18:28
at 2017-06-30T18:28
By William
at 2017-07-05T11:17
at 2017-07-05T11:17
By William
at 2017-07-10T08:37
at 2017-07-10T08:37
By Heather
at 2017-07-11T14:56
at 2017-07-11T14:56
By Noah
at 2017-07-11T19:14
at 2017-07-11T19:14
By Emma
at 2017-07-11T22:32
at 2017-07-11T22:32
By Emma
at 2017-07-15T04:04
at 2017-07-15T04:04
By Charlie
at 2017-07-15T14:40
at 2017-07-15T14:40
By Hedwig
at 2017-07-19T14:00
at 2017-07-19T14:00
By Joseph
at 2017-07-22T14:45
at 2017-07-22T14:45
By Rebecca
at 2017-07-27T01:41
at 2017-07-27T01:41
By Dorothy
at 2017-07-29T09:52
at 2017-07-29T09:52
By Yuri
at 2017-08-01T04:51
at 2017-08-01T04:51
By Heather
at 2017-08-02T02:41
at 2017-08-02T02:41
By Annie
at 2017-08-07T02:01
at 2017-08-07T02:01
By Jacky
at 2017-08-09T13:56
at 2017-08-09T13:56
By Charlotte
at 2017-08-10T22:18
at 2017-08-10T22:18
Related Posts
UPS APC BR1000G-TW 購買前的問題
By Elizabeth
at 2017-05-12T01:00
at 2017-05-12T01:00
R5 重返榮耀 B350 M-ATX該選哪張呢
By Franklin
at 2017-05-12T00:26
at 2017-05-12T00:26
多款ASUS路由器存在嚴重安全性漏洞
By Mason
at 2017-05-11T23:57
at 2017-05-11T23:57
17K含螢幕影音機
By Necoo
at 2017-05-11T23:32
at 2017-05-11T23:32
喬思伯 Jonsbo C2 上5顆3.5吋
By Joseph
at 2017-05-11T23:29
at 2017-05-11T23:29