NVIDIA顯卡爆發式飛躍揭秘:悄然上平鋪式 - 3C

Table of Contents

http://news.mydrivers.com/1/493/493738.htm

NVIDIA顯卡近些年的性能飛躍是有目共睹的,架構也在不斷演進:特斯拉、費米、開普勒
、麥克斯韋、帕斯卡……那麼,除了架構設計改進、工藝頻率提升、加入新功能之類的,
NVIDIA還有什麼秘密嗎?

顯然是的,畢竟誰都不會把自己的所有家底都亮出來,比如說麥克斯韋架構,我們知道它
SM體系大幅調整從而提高利用效率、互連功耗損失降低、二級緩存容量顯著增大、晶體管
底層做大量優化,但是NVIDIA仍然隱藏了一項重要信息。

很長時間以來,一直有人懷疑,NVIDIA在麥克斯韋架構內使用了一些來自移動端的能效管
理技術,畢竟它是NVIDIA第一個以移動端為優先的GPU架構。

Real World Tech的技術大牛David Kanter經過一番挖掘之後,主要是研究了一些處理器
三角形光柵化的DirectX代碼,終於發現了其中的秘密。

原來,NVIDIA在麥克斯韋架構中悄然加入了平鋪式渲染(Tile Based Render),從而改變
了三角形處理方式。

PC端顯卡一直以來都在使用即時模式渲染(Immediate Mode Render),對整個畫面統一進
行光柵化處理,性能突出,但需要消耗大量內存和電力。

平鋪式渲染也並不是新鮮事物,不過長期用於移動GPU,Imagination PowerVR、ARM Mali
都在用。它會將一副畫面分割成不同區塊,然後一塊一塊地進行光柵化處理,而且基本靠
GPU就能完成,很省內存很省電。

顯然,NVIDIA找到了在PC GPU中使用平鋪式渲染的方法,而且克服了它的負面影響以及兼
容性問題,但具體細節必然是商業機密,就無從知曉了。

麥克斯韋架構的GTX 700/900系列顯卡能效提升巨大,平鋪式渲染顯然功不可沒。

原文出處:http://www.realworldtech.com/tile-based-rasterization-nvidia-gpus/

--

開放下面推文「快推!不然別人以為我看不懂」

--

All Comments

Thomas avatarThomas2016-08-05
靠北 真的完全看不懂
Callum avatarCallum2016-08-06
快推!不然別人以為我看得懂
Skylar Davis avatarSkylar Davis2016-08-10
我從來沒看懂過 也不怕別人笑
Margaret avatarMargaret2016-08-12
聽起來好厲害,樓下買100片送版友
Olive avatarOlive2016-08-16
看成boom卡揭秘。。。 抱歉…
Ophelia avatarOphelia2016-08-19
難怪同樣的VRAM頻寬下 ROP效率能提高那麼多
Genevieve avatarGenevieve2016-08-21
Boomsound讚
Jake avatarJake2016-08-21
簡單來說 把顯卡渲染方式改成平鋪式之後 效益提升?
Ursula avatarUrsula2016-08-23
這聽起來就是在偷料 三小...
Xanthe avatarXanthe2016-08-23
快推!雖然推完我還是看不懂
不是偷料吧...是聽起來很像過程偷工吧
Lucy avatarLucy2016-08-27
不過 或許用了這些渲染技術 在跑一些古老的DX7、8
Elvira avatarElvira2016-08-31
老遊戲時 畫面有些是會出錯 反而用老顯卡跑沒問題
Cara avatarCara2016-09-02
樓樓上排骨酥湯?
Olive avatarOlive2016-09-06
我只是想表現我有多聽不懂而已 那就是味增湯阿
Genevieve avatarGenevieve2016-09-09
快要歪樓了嗎?XD
Victoria avatarVictoria2016-09-10
優化就是偷工阿,不然哪來那麼多AA
Ida avatarIda2016-09-10
就是綁定遊戲優化
Elma avatarElma2016-09-13
大家都用OGSSAA都算好算滿,然後開1080p 16xAA
等於算8k算好算滿...
Tom avatarTom2016-09-17
說偷料的就太外行惹 XD
Annie avatarAnnie2016-09-18
原來是這樣子啊
Joe avatarJoe2016-09-21
先推以免人家覺得看不懂
Charlie avatarCharlie2016-09-26
論偷料,G心絕對榜上有名
Zanna avatarZanna2016-09-28
這樣子啊…(筆記ing)
Frederic avatarFrederic2016-10-01
本魯不懂,有請教主解說
Yuri avatarYuri2016-10-04
教主不是做硬體的嗎?這個比較偏向軟體吧?
Elizabeth avatarElizabeth2016-10-08
...看沒有 求解說
Jacob avatarJacob2016-10-10
不明覺厲,先推就對啦!
Candice avatarCandice2016-10-10
就一次處理整個畫面跟把畫面切成n小份處理
Kyle avatarKyle2016-10-10
我相信教主會懂了 樓下教主
Tracy avatarTracy2016-10-13
Tile base是on chip的小buffer完成運算後,
才將pixel寫外部主記憶體。所以省頻寬.
其實是20年前就有的技術,只是當年軟體
無法有效解決相容性問題。
Brianna avatarBrianna2016-10-17
傳統直接模式需要比較大頻寬,Tile比較小。
Gilbert avatarGilbert2016-10-21
但由於PC頻寬不斷暴增,導致Tile省頻寬優勢
一直難以在PC被重視。
Yuri avatarYuri2016-10-24
就像要處理n位數計算 簡單的一次全部處理誰都會寫
但遇到天文數字就爆炸了 拆成數份 一次只計算其中
幾位數最後再組合成結果
Bennie avatarBennie2016-10-27
以前PowerVR Kyro就是SEGA DC的PC版
能打敗市面上當時所有平價64bit顯卡
Hedwig avatarHedwig2016-10-30
但PC對手很簡單就提升到128bit,192bit...
Queena avatarQueena2016-11-01
現在又有HBM2在後....
Delia avatarDelia2016-11-03
NV會回頭搞這,也許跟地瓜123&K1在
移動市場發展不利有關,移動SOC太小
無法像PC搞暴力頻寬,對手都是Tile
Lucy avatarLucy2016-11-03
然後在PC端順便打爆AMD了QQ
Kristin avatarKristin2016-11-06
已經在PC被幹掉十多年的powerVR...
反而靠Tile base成為手持新興領域霸主
Iris avatarIris2016-11-08
NV未來想要用與PC同樣架構跨足這一塊。
Kristin avatarKristin2016-11-10
移動端GPU霸主不是高通的Adreno嗎?
Ursula avatarUrsula2016-11-12
就得改變傳統直接繪圖做法。
Frederica avatarFrederica2016-11-13
不是高通,是powerVR,因為apple全用它
Annie avatarAnnie2016-11-14
蘋果愛瘋優勢之一是CPU單核性能海放其他ARM處理器
Rachel avatarRachel2016-11-15
Adreno用的則是Ati的Tile架構,
衍生自Xbox360的c1顯核。
Christine avatarChristine2016-11-16
不愧是平鋪式
Olga avatarOlga2016-11-20
更正360顯核是xenos
Rosalind avatarRosalind2016-11-23
Intel也用行動版技術的Core系列讓AMD吃土
Hamiltion avatarHamiltion2016-11-25
當年的PowerVR還買了一張來玩電腦戰機..XD"
Sarah avatarSarah2016-11-26
Adreno 530帳面數據和跑分比iphone 6s PowerVR 好看
Quintina avatarQuintina2016-11-29
大部分跑分也是贏過PowerVR
Michael avatarMichael2016-12-03
Apple其實也沒用上PVR最強核心。
他追求不是最高效能,而是均衡。
Mason avatarMason2016-12-06
PowerVR類似ARM採授權機制,要多強
是看客戶自己產品需求。
Regina avatarRegina2016-12-06
說錯了!移動端GPU霸主是老黃搭pascal的的地瓜XD
Carol avatarCarol2016-12-09
所以MTK也用過PVR...但最低階...性能也...
Yuri avatarYuri2016-12-10
目前最強的PVR GT7900其實比地瓜X1還強
但還沒有客戶買其授權來做產品。
Anonymous avatarAnonymous2016-12-12
所以都叫Tile架構,其實彼此差異很大。
Kyle avatarKyle2016-12-15
PVR那是最特殊的Deferred Tile架構
Quanna avatarQuanna2016-12-19
被遮蔽的像素可以完全不用畫。
其他的直接模式Tile....還是會有浪費效能
Valerie avatarValerie2016-12-22
PowerVR GT7900 宣稱是贏過 GT730M
Dinah avatarDinah2016-12-27
但PVR很怕AlphaTest效果,會效率降低。
所以IOS都建議用AlphaBlend取代Alphatest
Lydia avatarLydia2016-12-27
不過這只是架構特性差異,跟性能爆發
應該沒有直接關係,不管直接繪圖或Tile
你還是要有足夠RawPower, 尤其PC
Lily avatarLily2016-12-31
當年PowerVR就是效率有餘,蠻力不足。
Kristin avatarKristin2017-01-02
所以從PC敗退。
Candice avatarCandice2017-01-05
看不懂
Quanna avatarQuanna2017-01-09
麥克斯韋?
Isla avatarIsla2017-01-13
boom boom pow ?
Madame avatarMadame2017-01-17
這個報導相對原文有點失真
Linda avatarLinda2017-01-20
偷料啊,程式計算沒依照規範做
Andrew avatarAndrew2017-01-25
樓上講錯了這是 tbir 目的就是省記憶體頻寬
Cara avatarCara2017-01-27
東西都還在cache內就用到 ,TBIR技術amd.intel.arm
都有實作
Doris avatarDoris2017-01-30
intel目前應該還是直接繪圖,當初它在
Atom有用Tile,但也是跟PowerVR買授權
Caroline avatarCaroline2017-02-04
更早以前i有研發大量迷你x86做GPU
的larabee不過已腰斬,沒有真正完成與生產
Sarah avatarSarah2017-02-04
強力software render的使用彈性雖好。
但效能打不贏大量fixed function管線的GPU
Oscar avatarOscar2017-02-05
麥克斯韋
是啥?
Mary avatarMary2017-02-09
用英文就好 沒事就是要翻譯一下 變得好像比較厲害
Edward Lewis avatarEdward Lewis2017-02-11
因為這篇是26文章
Kelly avatarKelly2017-02-15
tegra x1 不是強過GT740m嗎GT7900還是沒贏吧...
Elvira avatarElvira2017-02-18
X1的強是用FP16半精度來講,但7900
也有半精度,且是X1的1.6倍。
Dora avatarDora2017-02-19
用業界標準單精度FP32,X1/7900都只剩一半
Margaret avatarMargaret2017-02-23
其實740M跑正常FP32還是比X1快很多
Aaliyah avatarAaliyah2017-02-24
但PVR 7900很有機會超過740M
Skylar DavisLinda avatarSkylar DavisLinda2017-02-27
地瓜X1是比較接近730M.
Noah avatarNoah2017-03-02
7900GT?
Ina avatarIna2017-03-07
PowerVR 7XT的頂級版叫GT7900...
Tom avatarTom2017-03-08
不過Apple的A9X只用到其降級版。
Necoo avatarNecoo2017-03-11
A9X光記憶體頻寬51.2GB/s就嚇尿其他廠嚕
Lucy avatarLucy2017-03-15
不在PVR的Roadmap中,應該是蘋果訂製
Donna avatarDonna2017-03-19
從16cluster降為12cluster的運算量。
即使這樣以手持來說也夠驚人了。
Hedy avatarHedy2017-03-19
GT7900市面上沒有產品的樣子
Necoo avatarNecoo2017-03-21
iPad pro那顆比較像GT7600大改
Caitlin avatarCaitlin2017-03-23
7600/7900一樣架構,DefferedTile容易堆疊
Frederica avatarFrederica2017-03-26
快推 不然別人以為我看得懂