i皇6代以上內顯開CUDA加速最高buff 52% - 3C

By Candice
at 2021-02-28T23:01

Table of Contents

https://www.xfastest.com/thread-248583-1-1.html
本來想轉xf的但我真的看不懂他真的在寫三小（抑或是說源頭cnbeta真的不知道寫什麼）

英文原文：
https://hothardware.com/news/cuda-on-intel-gpus-zluda

原作者Github:
https://github.com/vosen/ZLUDA

https://i.imgur.com/7QJsd9o.jpg

開發者開發出一款新的ZLUDA工具可以拿來替換CUDA並跟i皇6代以上的內顯直接配合
目前支援Linux以及windows

根據開發者說法效能目前可以達到近原生但部分功能有所限制
目前只有GeekBench能真正用這工具跑起來開發者也警告不要把這工具當作日常使用

https://i.imgur.com/r1YRdXu.png

Windows上使用比較簡單下載後打指令：
先cd到程式的位置如：
C:\Program Files (x86)\Geekbench 5\
然後ps執行：
zluda_with -- geekbench5 --compute CUDA
根據原網站的測試目前在Tiger Lake aka 11代筆電的Windows上會直接報錯說CUDA程式庫
錯誤

開發者在i7-8700k（UHD 630)的測試上跑GB5的跑分 CUDA總分為6333 以內顯跑原生OPENCL
則是6482 低了2%左右
那標題寫的buff 52%在唬爛喔？？
當然不是

https://i.imgur.com/VumwKal.png

是在細相的跑分上最高有52% buff
原作者有在github解釋跑分結果：

為什麼部分跑分比較高？
原作者：大概是以下幾點結合的關係：
1.ZULDA用Level 0的API 比起OpenCL更低階更快的API
2.但是根據第一點目前尚未支援異步執行給我們了大優勢
GeekBench跑分僅用到CUDA同步api
3.NV跟i皇的GPU都有一組GPU指令但OpenCL不會調用
開發者將Nvidia GPU最佳化的程式碼和OpenCL程式碼比較後發現一個幸運的巧合：
那個最佳化的程式碼在i皇GPU上也可以執行的很好歸功於底層的Intel Graphics Compiler

那為什麼部分跑分則是OpenCL比較高傲？
1.CUDA跑分會調用CUDA中的兩個功能：
atomicInc / atomicDec
這兩個功能在老黃的卡都是硬體支援的但i皇的卡並不支援
因此要以軟體模擬功能所以損失效能

那剩下跑比較差的原因？
原作者：
https://i.imgur.com/KRh3oGD.jpg

最有可能是因為某些測試我們用的是NVIDIA次優的GPU程式碼編譯而其他測試ZLUDA則發出I
ntel次優的GPU代碼

目前還是很前期的版本現在release只有2個版本
這是一個蠻有趣的project 希望看以後i皇Xe跟老黃能不能結合出更大的火花更好的效能

--
https://i.imgur.com/IQtIYmx.jpg

Tags: 3C