NVIDIA顯卡爆發式飛躍揭秘:悄然上平鋪式 - 3C

Todd Johnson avatar
By Todd Johnson
at 2016-08-02T09:57

Table of Contents

http://news.mydrivers.com/1/493/493738.htm

NVIDIA顯卡近些年的性能飛躍是有目共睹的,架構也在不斷演進:特斯拉、費米、開普勒
、麥克斯韋、帕斯卡……那麼,除了架構設計改進、工藝頻率提升、加入新功能之類的,
NVIDIA還有什麼秘密嗎?

顯然是的,畢竟誰都不會把自己的所有家底都亮出來,比如說麥克斯韋架構,我們知道它
SM體系大幅調整從而提高利用效率、互連功耗損失降低、二級緩存容量顯著增大、晶體管
底層做大量優化,但是NVIDIA仍然隱藏了一項重要信息。

很長時間以來,一直有人懷疑,NVIDIA在麥克斯韋架構內使用了一些來自移動端的能效管
理技術,畢竟它是NVIDIA第一個以移動端為優先的GPU架構。

Real World Tech的技術大牛David Kanter經過一番挖掘之後,主要是研究了一些處理器
三角形光柵化的DirectX代碼,終於發現了其中的秘密。

原來,NVIDIA在麥克斯韋架構中悄然加入了平鋪式渲染(Tile Based Render),從而改變
了三角形處理方式。

PC端顯卡一直以來都在使用即時模式渲染(Immediate Mode Render),對整個畫面統一進
行光柵化處理,性能突出,但需要消耗大量內存和電力。

平鋪式渲染也並不是新鮮事物,不過長期用於移動GPU,Imagination PowerVR、ARM Mali
都在用。它會將一副畫面分割成不同區塊,然後一塊一塊地進行光柵化處理,而且基本靠
GPU就能完成,很省內存很省電。

顯然,NVIDIA找到了在PC GPU中使用平鋪式渲染的方法,而且克服了它的負面影響以及兼
容性問題,但具體細節必然是商業機密,就無從知曉了。

麥克斯韋架構的GTX 700/900系列顯卡能效提升巨大,平鋪式渲染顯然功不可沒。

原文出處:http://www.realworldtech.com/tile-based-rasterization-nvidia-gpus/

--

開放下面推文「快推!不然別人以為我看不懂」

--
Tags: 3C

All Comments

Thomas avatar
By Thomas
at 2016-08-05T03:42
靠北 真的完全看不懂
Callum avatar
By Callum
at 2016-08-06T06:59
快推!不然別人以為我看得懂
Skylar Davis avatar
By Skylar Davis
at 2016-08-10T15:13
我從來沒看懂過 也不怕別人笑
Margaret avatar
By Margaret
at 2016-08-12T17:49
聽起來好厲害,樓下買100片送版友
Olive avatar
By Olive
at 2016-08-16T15:22
看成boom卡揭秘。。。 抱歉…
Ophelia avatar
By Ophelia
at 2016-08-19T12:49
難怪同樣的VRAM頻寬下 ROP效率能提高那麼多
Genevieve avatar
By Genevieve
at 2016-08-21T05:11
Boomsound讚
Jake avatar
By Jake
at 2016-08-21T16:04
簡單來說 把顯卡渲染方式改成平鋪式之後 效益提升?
Ursula avatar
By Ursula
at 2016-08-23T00:07
這聽起來就是在偷料 三小...
Xanthe avatar
By Xanthe
at 2016-08-23T18:39
快推!雖然推完我還是看不懂
不是偷料吧...是聽起來很像過程偷工吧
Lucy avatar
By Lucy
at 2016-08-27T12:58
不過 或許用了這些渲染技術 在跑一些古老的DX7、8
Elvira avatar
By Elvira
at 2016-08-31T06:03
老遊戲時 畫面有些是會出錯 反而用老顯卡跑沒問題
Cara avatar
By Cara
at 2016-09-02T16:40
樓樓上排骨酥湯?
Olive avatar
By Olive
at 2016-09-06T19:10
我只是想表現我有多聽不懂而已 那就是味增湯阿
Genevieve avatar
By Genevieve
at 2016-09-09T08:49
快要歪樓了嗎?XD
Victoria avatar
By Victoria
at 2016-09-10T04:09
優化就是偷工阿,不然哪來那麼多AA
Ida avatar
By Ida
at 2016-09-10T13:13
就是綁定遊戲優化
Elma avatar
By Elma
at 2016-09-13T01:26
大家都用OGSSAA都算好算滿,然後開1080p 16xAA
等於算8k算好算滿...
Tom avatar
By Tom
at 2016-09-17T19:34
說偷料的就太外行惹 XD
Annie avatar
By Annie
at 2016-09-18T15:15
原來是這樣子啊
Joe avatar
By Joe
at 2016-09-21T14:05
先推以免人家覺得看不懂
Charlie avatar
By Charlie
at 2016-09-26T03:28
論偷料,G心絕對榜上有名
Zanna avatar
By Zanna
at 2016-09-28T16:14
這樣子啊…(筆記ing)
Frederic avatar
By Frederic
at 2016-10-01T14:38
本魯不懂,有請教主解說
Yuri avatar
By Yuri
at 2016-10-04T22:15
教主不是做硬體的嗎?這個比較偏向軟體吧?
Elizabeth avatar
By Elizabeth
at 2016-10-08T23:24
...看沒有 求解說
Jacob avatar
By Jacob
at 2016-10-10T01:25
不明覺厲,先推就對啦!
Candice avatar
By Candice
at 2016-10-10T08:06
就一次處理整個畫面跟把畫面切成n小份處理
Kyle avatar
By Kyle
at 2016-10-10T16:12
我相信教主會懂了 樓下教主
Tracy avatar
By Tracy
at 2016-10-13T23:23
Tile base是on chip的小buffer完成運算後,
才將pixel寫外部主記憶體。所以省頻寬.
其實是20年前就有的技術,只是當年軟體
無法有效解決相容性問題。
Brianna avatar
By Brianna
at 2016-10-17T18:41
傳統直接模式需要比較大頻寬,Tile比較小。
Gilbert avatar
By Gilbert
at 2016-10-21T07:21
但由於PC頻寬不斷暴增,導致Tile省頻寬優勢
一直難以在PC被重視。
Yuri avatar
By Yuri
at 2016-10-24T07:35
就像要處理n位數計算 簡單的一次全部處理誰都會寫
但遇到天文數字就爆炸了 拆成數份 一次只計算其中
幾位數最後再組合成結果
Bennie avatar
By Bennie
at 2016-10-27T19:18
以前PowerVR Kyro就是SEGA DC的PC版
能打敗市面上當時所有平價64bit顯卡
Hedwig avatar
By Hedwig
at 2016-10-30T16:01
但PC對手很簡單就提升到128bit,192bit...
Queena avatar
By Queena
at 2016-11-01T04:28
現在又有HBM2在後....
Delia avatar
By Delia
at 2016-11-03T05:51
NV會回頭搞這,也許跟地瓜123&K1在
移動市場發展不利有關,移動SOC太小
無法像PC搞暴力頻寬,對手都是Tile
Lucy avatar
By Lucy
at 2016-11-03T20:11
然後在PC端順便打爆AMD了QQ
Kristin avatar
By Kristin
at 2016-11-06T14:54
已經在PC被幹掉十多年的powerVR...
反而靠Tile base成為手持新興領域霸主
Iris avatar
By Iris
at 2016-11-08T21:25
NV未來想要用與PC同樣架構跨足這一塊。
Kristin avatar
By Kristin
at 2016-11-10T16:53
移動端GPU霸主不是高通的Adreno嗎?
Ursula avatar
By Ursula
at 2016-11-12T12:49
就得改變傳統直接繪圖做法。
Frederica avatar
By Frederica
at 2016-11-13T00:57
不是高通,是powerVR,因為apple全用它
Annie avatar
By Annie
at 2016-11-14T02:26
蘋果愛瘋優勢之一是CPU單核性能海放其他ARM處理器
Rachel avatar
By Rachel
at 2016-11-15T00:56
Adreno用的則是Ati的Tile架構,
衍生自Xbox360的c1顯核。
Christine avatar
By Christine
at 2016-11-16T16:35
不愧是平鋪式
Olga avatar
By Olga
at 2016-11-20T08:05
更正360顯核是xenos
Rosalind avatar
By Rosalind
at 2016-11-23T20:02
Intel也用行動版技術的Core系列讓AMD吃土
Hamiltion avatar
By Hamiltion
at 2016-11-25T23:36
當年的PowerVR還買了一張來玩電腦戰機..XD"
Sarah avatar
By Sarah
at 2016-11-26T19:16
Adreno 530帳面數據和跑分比iphone 6s PowerVR 好看
Quintina avatar
By Quintina
at 2016-11-29T04:15
大部分跑分也是贏過PowerVR
Michael avatar
By Michael
at 2016-12-03T15:33
Apple其實也沒用上PVR最強核心。
他追求不是最高效能,而是均衡。
Mason avatar
By Mason
at 2016-12-06T02:10
PowerVR類似ARM採授權機制,要多強
是看客戶自己產品需求。
Regina avatar
By Regina
at 2016-12-06T20:43
說錯了!移動端GPU霸主是老黃搭pascal的的地瓜XD
Carol avatar
By Carol
at 2016-12-09T03:03
所以MTK也用過PVR...但最低階...性能也...
Yuri avatar
By Yuri
at 2016-12-10T16:05
目前最強的PVR GT7900其實比地瓜X1還強
但還沒有客戶買其授權來做產品。
Anonymous avatar
By Anonymous
at 2016-12-12T15:17
所以都叫Tile架構,其實彼此差異很大。
Kyle avatar
By Kyle
at 2016-12-15T10:33
PVR那是最特殊的Deferred Tile架構
Quanna avatar
By Quanna
at 2016-12-19T20:38
被遮蔽的像素可以完全不用畫。
其他的直接模式Tile....還是會有浪費效能
Valerie avatar
By Valerie
at 2016-12-22T22:48
PowerVR GT7900 宣稱是贏過 GT730M
Dinah avatar
By Dinah
at 2016-12-27T01:56
但PVR很怕AlphaTest效果,會效率降低。
所以IOS都建議用AlphaBlend取代Alphatest
Lydia avatar
By Lydia
at 2016-12-27T08:28
不過這只是架構特性差異,跟性能爆發
應該沒有直接關係,不管直接繪圖或Tile
你還是要有足夠RawPower, 尤其PC
Lily avatar
By Lily
at 2016-12-31T07:23
當年PowerVR就是效率有餘,蠻力不足。
Kristin avatar
By Kristin
at 2017-01-02T15:31
所以從PC敗退。
Candice avatar
By Candice
at 2017-01-05T20:26
看不懂
Quanna avatar
By Quanna
at 2017-01-09T14:23
麥克斯韋?
Isla avatar
By Isla
at 2017-01-13T13:15
boom boom pow ?
Madame avatar
By Madame
at 2017-01-17T08:53
這個報導相對原文有點失真
Linda avatar
By Linda
at 2017-01-20T14:25
偷料啊,程式計算沒依照規範做
Andrew avatar
By Andrew
at 2017-01-25T05:33
樓上講錯了這是 tbir 目的就是省記憶體頻寬
Cara avatar
By Cara
at 2017-01-27T08:15
東西都還在cache內就用到 ,TBIR技術amd.intel.arm
都有實作
Doris avatar
By Doris
at 2017-01-30T02:52
intel目前應該還是直接繪圖,當初它在
Atom有用Tile,但也是跟PowerVR買授權
Caroline avatar
By Caroline
at 2017-02-04T01:27
更早以前i有研發大量迷你x86做GPU
的larabee不過已腰斬,沒有真正完成與生產
Sarah avatar
By Sarah
at 2017-02-04T04:28
強力software render的使用彈性雖好。
但效能打不贏大量fixed function管線的GPU
Oscar avatar
By Oscar
at 2017-02-05T19:18
麥克斯韋
是啥?
Mary avatar
By Mary
at 2017-02-09T00:51
用英文就好 沒事就是要翻譯一下 變得好像比較厲害
Edward Lewis avatar
By Edward Lewis
at 2017-02-11T08:31
因為這篇是26文章
Kelly avatar
By Kelly
at 2017-02-15T12:46
tegra x1 不是強過GT740m嗎GT7900還是沒贏吧...
Elvira avatar
By Elvira
at 2017-02-18T09:08
X1的強是用FP16半精度來講,但7900
也有半精度,且是X1的1.6倍。
Dora avatar
By Dora
at 2017-02-19T00:04
用業界標準單精度FP32,X1/7900都只剩一半
Margaret avatar
By Margaret
at 2017-02-23T12:45
其實740M跑正常FP32還是比X1快很多
Aaliyah avatar
By Aaliyah
at 2017-02-24T18:06
但PVR 7900很有機會超過740M
Skylar DavisLinda avatar
By Skylar DavisLinda
at 2017-02-27T20:40
地瓜X1是比較接近730M.
Noah avatar
By Noah
at 2017-03-02T14:03
7900GT?
Ina avatar
By Ina
at 2017-03-07T00:29
PowerVR 7XT的頂級版叫GT7900...
Tom avatar
By Tom
at 2017-03-08T16:42
不過Apple的A9X只用到其降級版。
Necoo avatar
By Necoo
at 2017-03-11T19:34
A9X光記憶體頻寬51.2GB/s就嚇尿其他廠嚕
Lucy avatar
By Lucy
at 2017-03-15T17:30
不在PVR的Roadmap中,應該是蘋果訂製
Donna avatar
By Donna
at 2017-03-19T11:20
從16cluster降為12cluster的運算量。
即使這樣以手持來說也夠驚人了。
Hedy avatar
By Hedy
at 2017-03-19T21:34
GT7900市面上沒有產品的樣子
Necoo avatar
By Necoo
at 2017-03-21T11:38
iPad pro那顆比較像GT7600大改
Caitlin avatar
By Caitlin
at 2017-03-23T13:45
7600/7900一樣架構,DefferedTile容易堆疊
Frederica avatar
By Frederica
at 2017-03-26T20:57
快推 不然別人以為我看得懂

撼訊公版270刷270x vbios問題

Emma avatar
By Emma
at 2016-08-02T04:10
長卡雙6p根本就是270X 直接刷公版270Xbios 電壓都沒鎖 可以隨便加 以下參數給想刷和超頻的參考 http://gpuz.techpowerup.com/16/08/01/pz6.png http://i.imgur.com/oHgEV7o.jpg http://i.imgur.com/Z2 ...

銀欣GD08機殼這樣是正常的嗎?

Jake avatar
By Jake
at 2016-08-02T01:50
最近在原價屋買了銀欣GD08黑色款機殼 今天收到後準備裝機 裝機前檢查外面發現表面有一顆一顆凸起 像小粉刺一樣 感覺烤漆不是很好的樣子 有人有銀欣機殼黑色款有一樣的情形嗎? 附圖右下角那裡很明顯 實際上整面都是... http://i.imgur.com/FEPe774.jpg 這是上蓋 側邊 ...

買兩個禮拜的1070風扇裂開

Zora avatar
By Zora
at 2016-08-02T01:45
後續的發展來拉: 因為禮拜六半夜壞掉,禮拜天服務中心都沒開,只好等到禮拜一,結果趕在下班最後 一個抽號碼牌,結果現場都是修筆電的,原來玩DIY電腦零件的,才是邊緣人啊? 一問之下,他說這個風扇現場沒有料可以換,要送原廠維修,整個傻眼,客服人員說, 他們顯卡全台都沒有現場維修的服務,只是風扇裂開,居然要等一 ...

請問記憶體最大支援

Barb Cronin avatar
By Barb Cronin
at 2016-08-02T01:43
請問一下,公司有台套裝電腦,我想幫它升級但我不確定能支援的最大記憶體規格 這是SPECCY的截圖,能幫我看一下嗎? http ://ppt.cc/bWyPw http ://ppt.cc/nqa0s http ://ppt.cc/MmMzj 我想換上 8G的記憶體 *4 條,有辦法嗎?atat 還 ...

18k 影片剪輯用

Candice avatar
By Candice
at 2016-08-02T00:50
已買/未買/已付訂金(元):未買 預算/用途: 18k 作電影後製剪輯 CPU (中央處理器):Intel I3-6100 $3490 MB (主機板):華擎 Z170M Pro4 $3290 RAM (記憶體):美光 8G DDR4-2400 ...