4張「新Titan X」能否取代1張Tesla? - 顯卡

Table of Contents

各位大大好,我目前正打算用CUDA做平行運算,關於顯卡的部分想請教:

1.目前Nvidia算最快的卡應該就是 Tesla P100,它有3584個CUDA核心,與其它Nvidia顯
卡相較,並沒有多特別多,為什麼可以一秒鐘算將近6兆次?

2.在下因經費考量,沒辦法用Tesla,但又很想有Tesla的運算速度,請問可否用4張「新
Titan X」或者4張「GTX 1080」,達到1張Tesla的運算速度 (當然,不敢妄想與P100速度
相同,但希望至少能與K40並駕齊驅)?我的平行運算很簡單,只是加減乘除,並不包含函
數、微積分、……這些,懇請各位大大不吝解答,謝謝。

註:我的CPU是Intel E5-2699 V4雙路

--

All Comments

Agatha avatarAgatha2017-01-16
因為砍了雙精度(FP64)
Poppy avatarPoppy2017-01-20
你Data切割要時間 收回來也要額外時間 這些也是Cost
Hedwig avatarHedwig2017-01-21
你的問題太高階了,這裡大概問不出答案。
Olga avatarOlga2017-01-22
不行 這是NV對遊戲卡閹的地方
不過就算達不到 CUDA運算方案最方便的方式就是
Olivia avatarOlivia2017-01-26
4張1080在玩 很多人都是如此
Liam avatarLiam2017-01-27
要看你要單精準還是雙精準 基本上單精準不必用到P100 如
果雙精準的話 你用8張1080或titan都不夠 新的game card
的double都被閹掉了 除非你拿kepler時代的titan才有機會
Bethany avatarBethany2017-01-31
遊戲卡的半精度與雙精度被大閹的關係。
Isabella avatarIsabella2017-02-01
要看你平行運算是要算啥,精度需要多少
這樣問起來太含糊了。
Edwina avatarEdwina2017-02-04
回個舊文,回第一個問題。六兆次什麼?1080也有8兆次的
單精度浮點運算的能力呀,跟P100也沒差多少。重點在P10
0的雙精度運算比遊戲卡好很多,所以你用不用得到雙精度
才是重點