i皇6代以上內顯開CUDA加速 最高buff 52% - 3C

By Candice
at 2021-02-28T23:01
at 2021-02-28T23:01
Table of Contents
https://www.xfastest.com/thread-248583-1-1.html
本來想轉xf的 但我真的看不懂他真的在寫三小(抑或是說源頭cnbeta真的不知道寫什麼)
英文原文:
https://hothardware.com/news/cuda-on-intel-gpus-zluda
原作者Github:
https://github.com/vosen/ZLUDA
https://i.imgur.com/7QJsd9o.jpg
開發者開發出一款新的ZLUDA工具 可以拿來替換CUDA並跟i皇6代以上的內顯直接配合
目前支援Linux以及windows
根據開發者說法 效能目前可以達到近原生但部分功能有所限制
目前只有GeekBench能真正用這工具跑起來 開發者也警告不要把這工具當作日常使用
https://i.imgur.com/r1YRdXu.png
Windows上使用比較簡單 下載後打指令:
先cd到程式的位置 如:
C:\Program Files (x86)\Geekbench 5\
然後ps執行:
zluda_with -- geekbench5 --compute CUDA
根據原網站的測試 目前在Tiger Lake aka 11代筆電的Windows上會直接報錯說CUDA程式庫
錯誤
開發者在i7-8700k(UHD 630)的測試上 跑GB5的跑分 CUDA總分為6333 以內顯跑原生OPENCL
則是6482 低了2%左右
那標題寫的buff 52%在唬爛喔??
當然不是
https://i.imgur.com/VumwKal.png
是在細相的跑分上 最高有52% buff
原作者有在github解釋跑分結果:
為什麼部分跑分比較高?
原作者:大概是以下幾點結合的關係:
1.ZULDA用Level 0的API 比起OpenCL更低階更快的API
2.但是根據第一點 目前尚未支援異步執行 給我們了大優勢
GeekBench跑分僅用到CUDA同步api
3.NV跟i皇的GPU都有一組GPU指令 但OpenCL不會調用
開發者將Nvidia GPU最佳化的程式碼和OpenCL程式碼比較後 發現一個幸運的巧合:
那個最佳化的程式碼在i皇GPU上也可以執行的很好 歸功於底層的Intel Graphics Compiler
那為什麼部分跑分則是OpenCL比較高傲?
1.CUDA跑分會調用CUDA中的兩個功能:
atomicInc / atomicDec
這兩個功能在老黃的卡都是硬體支援的 但i皇的卡並不支援
因此要以軟體模擬功能 所以損失效能
那剩下跑比較差的原因?
原作者:
https://i.imgur.com/KRh3oGD.jpg
最有可能是因為某些測試我們用的是NVIDIA次優的GPU程式碼編譯 而其他測試ZLUDA則發出I
ntel次優的GPU代碼
目前還是很前期的版本 現在release只有2個版本
這是一個蠻有趣的project 希望看以後i皇Xe跟老黃能不能結合出更大的火花 更好的效能
--
https://i.imgur.com/IQtIYmx.jpg
--
本來想轉xf的 但我真的看不懂他真的在寫三小(抑或是說源頭cnbeta真的不知道寫什麼)
英文原文:
https://hothardware.com/news/cuda-on-intel-gpus-zluda
原作者Github:
https://github.com/vosen/ZLUDA
https://i.imgur.com/7QJsd9o.jpg
開發者開發出一款新的ZLUDA工具 可以拿來替換CUDA並跟i皇6代以上的內顯直接配合
目前支援Linux以及windows
根據開發者說法 效能目前可以達到近原生但部分功能有所限制
目前只有GeekBench能真正用這工具跑起來 開發者也警告不要把這工具當作日常使用
https://i.imgur.com/r1YRdXu.png
Windows上使用比較簡單 下載後打指令:
先cd到程式的位置 如:
C:\Program Files (x86)\Geekbench 5\
然後ps執行:
zluda_with -- geekbench5 --compute CUDA
根據原網站的測試 目前在Tiger Lake aka 11代筆電的Windows上會直接報錯說CUDA程式庫
錯誤
開發者在i7-8700k(UHD 630)的測試上 跑GB5的跑分 CUDA總分為6333 以內顯跑原生OPENCL
則是6482 低了2%左右
那標題寫的buff 52%在唬爛喔??
當然不是
https://i.imgur.com/VumwKal.png
是在細相的跑分上 最高有52% buff
原作者有在github解釋跑分結果:
為什麼部分跑分比較高?
原作者:大概是以下幾點結合的關係:
1.ZULDA用Level 0的API 比起OpenCL更低階更快的API
2.但是根據第一點 目前尚未支援異步執行 給我們了大優勢
GeekBench跑分僅用到CUDA同步api
3.NV跟i皇的GPU都有一組GPU指令 但OpenCL不會調用
開發者將Nvidia GPU最佳化的程式碼和OpenCL程式碼比較後 發現一個幸運的巧合:
那個最佳化的程式碼在i皇GPU上也可以執行的很好 歸功於底層的Intel Graphics Compiler
那為什麼部分跑分則是OpenCL比較高傲?
1.CUDA跑分會調用CUDA中的兩個功能:
atomicInc / atomicDec
這兩個功能在老黃的卡都是硬體支援的 但i皇的卡並不支援
因此要以軟體模擬功能 所以損失效能
那剩下跑比較差的原因?
原作者:
https://i.imgur.com/KRh3oGD.jpg
最有可能是因為某些測試我們用的是NVIDIA次優的GPU程式碼編譯 而其他測試ZLUDA則發出I
ntel次優的GPU代碼
目前還是很前期的版本 現在release只有2個版本
這是一個蠻有趣的project 希望看以後i皇Xe跟老黃能不能結合出更大的火花 更好的效能
--
https://i.imgur.com/IQtIYmx.jpg
--
Tags:
3C
All Comments

By Cara
at 2021-03-04T19:28
at 2021-03-04T19:28

By Regina
at 2021-03-07T18:25
at 2021-03-07T18:25

By Donna
at 2021-03-12T01:14
at 2021-03-12T01:14

By Irma
at 2021-03-13T05:51
at 2021-03-13T05:51

By Olive
at 2021-03-14T11:06
at 2021-03-14T11:06

By Rae
at 2021-03-17T20:40
at 2021-03-17T20:40

By Annie
at 2021-03-19T17:33
at 2021-03-19T17:33

By Anthony
at 2021-03-23T08:16
at 2021-03-23T08:16
Related Posts
共碩RX 6700 XT TUF/DUAL曝光:皆6+8pin

By Valerie
at 2021-02-28T22:01
at 2021-02-28T22:01
舊機升級建議(m-ATX)

By Cara
at 2021-02-28T21:56
at 2021-02-28T21:56
10代I7魔獸機

By Enid
at 2021-02-28T19:27
at 2021-02-28T19:27
特價機殼沒好貨?

By Charlotte
at 2021-02-28T17:42
at 2021-02-28T17:42
i皇11700k正式版偷跑 r20/r23輸5800x

By Audriana
at 2021-02-28T17:04
at 2021-02-28T17:04