Apple M1 Max 測試 - 3C

John avatar
By John
at 2021-11-23T09:53

Table of Contents

原文: https://tlkh.dev/benchmarking-the-apple-m1-max
HN 討論:https://news.ycombinator.com/item?id=29310509

這篇文章挑了一些測試項目,
推測 M1 Max 在 100W 功耗有如此表現的原因。

他的結論是贏在記憶體頻寬夠大, 有10核心,
以及各種 co-processor (AMX, ANE, ...)幫忙 offload。

CPU<->MEM 100GB/s (單 thread), 200GB/s (多 thread), 對比 5600x 約 40GB/s

GPU<->MEM 大約 200~300GB/s,最高 330GB/s

CPU+GPU<->MEM 因為兩個共用記憶體,競爭後總和最高 360GB/s

Zero-Copy: 理論上因為共用記憶體,GPU, CPU 分享資料應該很快
但是 TensorFlow Zero-copy Memory Access
卻和需要走 PCIE 的 5600X+3090 在同一數量級,可能M1在這部分沒做到硬體加速。

M1 Max 5600X+3090

CPU->GPU 48 30

GPU->CPU 19 19

因此可以看出在 memory-bound 工作+硬體加速有支援時,M1 Max 速度就很驚人
例如 NumPy 用上 GEMM 的工作就贏 5600x 一票
但是 SVD, VecMul, eigendecomp 這些就只是不相上下

5600x 在 HTTP server 這種無法加速的也領先

另外 M1 Max 靠著核心多的優勢,在 Pandas 某些項目領先。

TensorFlow GPU 的話效能只有 3090x 1/8,不過耗電也差不多 1/8
所以每瓦效能差不多。但是 M1 max 等於是有巨大記憶體的顯示卡:

https://news.ycombinator.com/item?id=29311522

因此在需要算大量資料時還是有他的優勢 (例如 4k/8k 影片轉檔?)

以及一些 TensorFlow 工作也可以交給 ANE 去算
ANE只耗費 2-4w, 但可以做到 GPU 60% 左右的效能

--

--
Tags: 3C

All Comments

Rae avatar
By Rae
at 2021-11-21T04:02
他這個結果..還真的挺怪的
Blanche avatar
By Blanche
at 2021-11-25T01:39
我也覺得怪,他沒解釋為什麼沒加速
Elma avatar
By Elma
at 2021-11-21T04:02
還是可以和5600x不相上下另外與其說是M1 Max 贏,不如說他
William avatar
By William
at 2021-11-25T01:39
刻意挑贏很多的 case,再分析為何贏
Daph Bay avatar
By Daph Bay
at 2021-11-21T04:02
他上面Numpy的比較我還滿感興趣的但不太清楚他 5600x 沒有用MKL的是什麼環境
Tom avatar
By Tom
at 2021-11-25T01:39
Special Function 那邊 MKL 還特慢
Dorothy avatar
By Dorothy
at 2021-11-21T04:02
算每瓦效能蠻怪的,如果m1 max給同樣瓦數有可能跟3090一樣嗎?
Franklin avatar
By Franklin
at 2021-11-25T01:39
那個每瓦效能一樣的部分...我們只能讚嘆NV了XDD
Odelette avatar
By Odelette
at 2021-11-21T04:02
Performance at different power levels 那段有說曲線比較像log成長
Yuri avatar
By Yuri
at 2021-11-25T01:39
然後 M1 Max SVD/EigenDecomp 是真
Ethan avatar
By Ethan
at 2021-11-21T04:02
的假的算的這麼慢啊?
Caitlin avatar
By Caitlin
at 2021-11-25T01:39
就算瓦數無限制開,效能不是正比
Charlotte avatar
By Charlotte
at 2021-11-21T04:02
給3090瓦數 效能不能一樣吧瓦數和效能不是成正比不然以前用ARM去堆不就每個屌打X86
Ursula avatar
By Ursula
at 2021-11-25T01:39
挺怪的
Odelette avatar
By Odelette
at 2021-11-21T04:02
就有用到神經網路引擎的工具,才會快很多
Lydia avatar
By Lydia
at 2021-11-25T01:39
特化功能 x86就什麼都能打但是不精就沒辦法同天秤比較
Charlotte avatar
By Charlotte
at 2021-11-21T04:02
老黃能夠駕馭三星製成 高通不行 慘
Faithe avatar
By Faithe
at 2021-11-25T01:39
為什麼體積不用比?
Wallis avatar
By Wallis
at 2021-11-21T04:02
沒事,問就是信仰,讓我們看M1腳踢5600、拳打3060,信仰讓人偉大

30K 含螢幕修圖機

Rebecca avatar
By Rebecca
at 2021-11-23T00:30
已買/未買/已付訂金(元): 未買 預算/用途: 30k上下,長輩修圖機,僅修圖+瀏覽網頁 CPU (中央處理器):i5-11400 MB (主機板):B560M PRO-VDH WIFI RAM (記憶體):金士頓 Fury Beast DDR4 3200-16G(8G*2) ...

美亞 5900X US$484 免運至台灣

Hardy avatar
By Hardy
at 2021-11-23T00:26
借用這篇主文,分享一下 Amazon.sg 有特價Ryzen 7 5800X 510新幣 換算起來大概10500有找 東南亞的鄉民可以衝一下 肥宅我自己趁著3600還有行情,賣掉升級5800X (之前特價S$221 時入手,現在還能賣到200 XD) 順便問一下,5800X有沒有推薦的風扇 因為用的是M ...

索泰電競 ZOTAC GAMING 打造Dark極黑系列

Eden avatar
By Eden
at 2021-11-23T00:03
https://i.imgur.com/wIrdRRq.png ZOTAC Technology旗下電競品牌ZOTAC GAMING今天宣布推出黑色星期五優惠活動,邀請您 一同征服極黑力量 歡度佳節!任何人只要在活動期間內挑戰指定遊戲,並登記參加「極黑物質」抽獎活動 將有機會獲得世界上最黑的遊戲電腦或顯示卡 ...

技嘉 AORUS 成為新竹街口攻城獅合作伙伴

Steve avatar
By Steve
at 2021-11-23T00:02
4G編譯 https://www.4gamers.com.tw/news/detail/50914/gigabyte-aorus-new-event 技嘉科技旗下頂級電競品牌 AORUS,正式成為新竹街口攻城獅職業籃球隊新賽季的合作夥 伴 一同為台灣打造更好的籃球環境。 以「Team Up. Figh ...

華碩(商用)ASUS PD500TC創作者PC新上市

Ophelia avatar
By Ophelia
at 2021-11-23T00:02
PChome上市 搭載 3070 https://i.imgur.com/esfNQQp.png https://i.imgur.com/8zNY207.png 商用ASUS PD500TC(i7-11700/32G/1TB SSD/RTX3070/W11P) 商用ASUS PD500TC(i9-1190 ...