學習DeepLearning的初學者心得 - 3C

By Leila
at 2017-08-17T02:33

Table of Contents

※如果DL的全貌是馬里安納海溝，
※那我大概正在游泳池游泳。

我用的是python3+tensorflow+keras，
先寫個簡單的建置歷程證明不是鍵盤大師。

如果你是個只會用windows的人，
(修改一下)注意底下:
Windows用python3.6，
tensorflow安裝會有問題，
我移掉3.6再裝3.5.2還是會掛，
要重灌windows再裝3.5.2才正常import。
※(如果你是個不用花一個禮拜以上時間，
※就可以獨自在windows上跑gpu加速的人，
※那我想拜你為師)

如果你會用Vim寫程式，
那這篇請當作笑話略過。

如果你不知道指令cd,ls在幹嘛？
那請先了解Linux的檔案架構跟windows的差異。

如果不會用nano寫個python的開圖程式，
那請先看看vim怎麼操作，然後你會對nano很有親切感。
還有把tensorflow裝好後用matplotlib秀張圖出來。

如果不知道該怎麼開始DL的學習，
那請在github上找個簡單的CNN模型下來跑跑看，先看看別人是怎麼做的。

上面寫了我目前建置過程中的大部分keywords，事後有想到再補充。

~~~
有人說deep learning用cpu跑是開玩笑，
就我個人一個多月以來學習經驗，
這一半是開玩笑沒錯，但另一半不是。

直接講用cpu跟gpu的比較好了，

GPU優點:
快，就是快，2,3小時的train幾十分鐘就完成。

只用CPU優點:
簡單，建置快速。

初學者我強烈建議先在VM中安裝Ubuntu，
裝在VM中就不能用GPU加速了，
可初學者就不要妄想用什麼GPU了。
CPU都沒搞定還想用GPU?

※如果你真的很想用GPU加速某個model，那這篇也不是你需要看的。

用VM的好處:
裝完環境之後你可以直接匯出虛擬機當作備份，
避免新手的強力技能:[把環境崩潰掉]後，
要重新安裝系統的麻煩事。
而且可以安裝一次，創建好幾台虛擬機，
而不用準備一堆實體電腦，
去測試各種環境變數，套件的相容性，跟一堆雜七雜八的問題。

高手會用virtualenv創建不同的虛擬環境，
避免不小心搞掛系統這件事。
不過，連virtualBox都不會用的話，
我是不覺得會用virtualenv。

~~~
安裝tensrflow-cpu
就把官網的指令複製貼上，大概4個步驟，含下載15分鐘完成。

安裝tensorflow-gpu
需要CUDA® Toolkit 8.0
需要cuDNN v5.1.
以上兩個就是安裝gpu版最累人的地方，第一次我至少花了兩天時間，
NVIDIA的安裝說明我一直沒有去看懂，
試著在k600上安裝時，被煩倒在設定環境變數的部份，就不想搞了。
安裝完上面兩個後，就跟安裝cpu版是幾乎一樣的指令了。

~~~
就目前為止，用gpu的好處，
我只想到加快train,跟使用的速度，
DL的學習重點跟順序，
著重於: linux操作〉python 〉
tensorflow跟keras 〉深度學習理論，
而且深度學習的理論非常非常非常重要！！！
除此之外，
我是不覺得gpu加速能幫助多少一個人學習DL的速度加快。

要學DL就該學DL的理論，
DL的理論不只要人聰明，還要大量時間，
寫好model後，就丟給底下的人去測試，
學DL不要把時間花在建環境上。
學DL不要把時間花在建環境上。
學DL不要把時間花在建環境上。

除非你像我一樣這麼苦命，
整個系上沒人會python,懂linux操作。

(修改)純CPU不適合:
用DL工作的人，
有人處理演算法，自己只負責測試的人，
用CPU處理的時間超過可接受的時間的人
(我的話，train的上限大概是10~14天，因為要做報告)

~~~
我推薦的DL學習最低建議:
I3,I5
(I7有點~不是那麼必要。)

32GB以上記憶體
(我目前試過約8個model,有兩個會用超過14GB記憶體，因為是在虛擬機內所以是14G不是16G

SSD
(這個看個人，因為我的數據經常要自己挑出來需要的，1萬多張300KB圖片用arc100都要好幾分鐘才能讀完縮圖)

顯卡:看看口袋多深買多貴，我只有朋友送的兩張K600。

~~~
對了，用CPU還有個好處，
可以跟Boss說東西還在跑，
進度報告先跳過我。
(deadline快到的人不適用)

~~~(新增:有錯請指教)
在windows上裝anaconda
建置GPU加速環境應該是最簡便的，
但我還沒試。

新手在Ubuntu 搞NV-GPU加速是在自虐，
不過有不少Library在windows上會很難搞。

--

Tags: 3C

All Comments

By Damian
at 2017-08-21T11:03

還在gradient descent

By Zenobia
at 2017-08-25T20:40

除了tf以外還有一些tool是用cpu的

By Daniel
at 2017-08-27T10:30

學DL+GPU蠻辛苦的，系統崩潰好幾次，而且GPU版本不

By Olivia
at 2017-08-30T06:45

同，安裝方式也有些微差距，而且不同的NN，差距有點
大QQ，背後一堆理論

By Belly
at 2017-09-01T00:48

ㄧ樓高手

By Oliver
at 2017-09-01T15:32

3樓我們一起QQ，理論真的看得好辛苦(痛苦)

By Joe
at 2017-09-02T15:17

DL的理論其實就是古早NN的理論吧？
印象中DL理論面現在就算在學界也沒啥人想碰
他的電蝦點應該是最後面的建議配備吧XD

By Harry
at 2017-09-06T13:14

這電蝦點在哪
另，windows搞不定是你功力太弱，spyder 3+tensorfl
ow+cuda半小時不用就可以搞定了，根本不用重灌

By Edwina
at 2017-09-07T10:04

我並不負責我們研究題目的演算法，
我只負責測試到能動

By Selena
at 2017-09-09T13:04

當初幫lab學長趕畢業救急，拿1070幫他跑spyder3寫好
的code，速度穩定i7-6700十倍，半小時就setup開始tr
ain了好嗎

By Genevieve
at 2017-09-11T18:14

我之前作DL的project 其實也是在Windows下面跑
現在大部分人用DL是在應用層面

By Hedwig
at 2017-09-14T08:25

nVidia家的東西初次架設拿linux，尤其是ubuntu根本
就是自虐

By James
at 2017-09-16T12:14

spyder3我是第一次聽到,
要是早知道我也不用這麼累了QQ

By Dinah
at 2017-09-20T00:23

Spyder 只是 IDE 對你們應該沒太大影響吧？

By Odelette
at 2017-09-20T02:34

雖然我是覺得沒有IDE寫code很痛苦就是

By Puput
at 2017-09-20T07:46

我的第一目標是把別人寫的測到能動，

By Tracy
at 2017-09-21T10:17

而且我還不是搞DL的，我做blockchain，那時候隔壁la
b學長來求救，剛好我lab有一台電動機放1070，一個
中午吃飯的時間剛好train完dataset，省的他熬夜住la
b

By Isabella
at 2017-09-25T00:44

小弟還沒能力知道整個Machine learnimg的世界長怎樣

By Blanche
at 2017-09-27T20:31

vscode 站出來

By Sierra Rose
at 2017-09-29T21:06

dl的東西做testing算最簡單吧，丟下去跑，去買個雞
排，回來才收data

By Iris
at 2017-10-01T15:28

要了解ML的世界容易啊去找些網路課程上就可以了
只要線性代數和機率部分沒卡關 ML概念算是好懂

By Candice
at 2017-10-05T04:06

拿Ubuntu是自虐嗎？
聽到前輩這樣說，我更想QQ了

By Franklin
at 2017-10-09T21:41

紅明顯，順便警告，千萬不要用ubuntu跑cuda相關的東
西，第一次會搞驅動會到你很想死

By Margaret
at 2017-10-12T11:57

去玩個kaggle爬分自虐之類的

By Iris
at 2017-10-17T02:38

光“搞對正確的driver版本”，而且還不是最新版，是
其中'某一版'才會動

By Andrew
at 2017-10-19T16:26

還好第一次痛第二次爽

By Gary
at 2017-10-20T20:36

然後每一次賭錯就是recovery mode+cli砍掉驅動重來

By Jake
at 2017-10-23T07:50

搞到我現在一顆cz80專門是弄好的ubuntu cuda 測試
環境

By Jake
at 2017-10-26T11:33

我記得裝好cuda自己帶的驅動就不要動了不然開機沒
畫面還得暴pirge一波

By Sierra Rose
at 2017-10-30T21:37

而且每次ubuntu還會很“好心”的幫你啟用內建的open
source driver

By Leila
at 2017-11-01T05:09

光是CNN就很痛苦了，要幾層，每層要多大？480*640？
雖然現在有VGG跟resnet，不過完全不懂裡面在幹啥，
不懂res一百多層怎麼來的

By Victoria
at 2017-11-06T00:43

了解ML的世界，我指的不是概念，而是像「現在走的路
是遠路還是近路？」這種

By Cara
at 2017-11-07T16:06

不懂裏面在幹嘛？不懂的不是只有你啊XD

By Olive
at 2017-11-12T12:26

DL performnace部分的理論現在是空的
就算是 CVPR 裡面的paper也沒人給數學理論證明的

By Elvira
at 2017-11-13T00:09

我懶，直接nv預設的模組丟下去train，跑出來東西都
蠻漂亮的，雖然不比手動tune過的東西好

By Belly
at 2017-11-14T16:08

還有什麼rnn、dnn，好難懂啊啊啊

By Necoo
at 2017-11-18T10:26

沒錯!之前我有改顯卡驅動，結果就不給我登入了，登
入了也進不去桌面...

By Caitlin
at 2017-11-18T22:41

不過比大部分寫的爛的好就夠了(攤)程式寫的太爛的
辦法

By Linda
at 2017-11-20T23:06

還好做cnn不就人家vgg我也vgg(?)

By Bennie
at 2017-11-23T00:05

他們證明自己效果好的方式就是拿些公共的data出來跑

By Leila
at 2017-11-25T23:55

就有人硬要踩雷，要不是有手機發文沒p幣我早就開一
篇文了(懶

By Kama
at 2017-11-27T18:54

所以大家目前都不管理論？用套件，單純看結果嗎？
很好奇google那些怎麼設計nn的

By Gilbert
at 2017-11-28T15:42

他們tune架構和參數一定有理由但多半來自經驗
但不會是數學證明因為這個目前大家都做不到

By Connor
at 2017-12-02T15:23

是說我略懂vim，可是我覺得這篇不好笑啊

By Kyle
at 2017-12-07T14:50

設計新架構比較難把現有架構拿來解決舊問題比較簡
單

By Joe
at 2017-12-10T12:52

對啊，cnn目前就vgg、google、res，所以大家都用一
樣的？

By Oliver
at 2017-12-11T07:53

應該不用覺得好笑啦，這只是某個弄掉半夜終於完成一
部份進度的研究生想寫下的

By Frederic
at 2017-12-13T09:53

當然不是不管理論，你要知道理論才能大概估一下哪幾
組比較好用
不然自己寫的要死要活，結果不如大公司寫好的套下去
你不會哭死？

By Anonymous
at 2017-12-14T23:55

就我了解 DL的理論就只有：只要你的資料和節點夠多
你的NN可以模仿一個連續函數到任何精準度

By Puput
at 2017-12-18T02:06

是說所以原po要拜我為師了嗎，我一個小時內可以搞定
欸(x)
(開玩笑的) 不過win上真的沒那麼差啦XD

By Puput
at 2017-12-20T19:47

大家會去調整vgg的架構嗎？看看有沒有可能變好？

By Robert
at 2017-12-23T03:26

我也覺得win上面沒有很差

By Adele
at 2017-12-28T02:23

還是說，著重在應用方面？架構就直接用套件即可？

By Edward Lewis
at 2017-12-28T08:17

時間夠(沒壓力)的話，可以稍微tune看看參數，不過da
taset不夠大的話小心over-fitting

By Hardy
at 2017-12-30T13:48

現在在比較的多半是妳怎麼想到一個不錯的應用

By Regina
at 2018-01-01T21:36

我真的想拜師了呢~~

By Carolina Franco
at 2018-01-06T17:04

進實驗室一段時間了，但現在才要碩士班，之前弄Ardu
ino,PLC,網路設備，現在BOSS想要ML,就要去做ML~

By Hedwig
at 2018-01-09T11:14

不過dl有個比較隱形的麻煩點就是權重的設定有可能會
導致model有bias

By Delia
at 2018-01-11T22:18

這個我現在一直想想不到有什麼比較好的辦法解決OTZ

By Eden
at 2018-01-13T03:45

cnn又不是只能classify

By Una
at 2018-01-13T09:05

Decker is your savor

By Hedwig
at 2018-01-14T16:03

QQ 目前大多用jetson tx2弄不過arm架構有些不是
很好裝

By Hedwig
at 2018-01-19T13:06

推

By Daniel
at 2018-01-23T01:42

docker才是正解

By Michael
at 2018-01-26T13:11

windows anaconda 安裝tensorflow 幾分鐘就搞定了..
..

By Faithe
at 2018-01-28T09:34

羊還是釣客?
QQ 噓錯篇慢點補推

By Edward Lewis
at 2018-01-31T17:16

我也用anaconda，幾乎超級懶人包就弄好
1070比i7-6700快超多的有夠爽

By Hamiltion
at 2018-02-01T13:13

補推

By Carolina Franco
at 2018-02-03T17:01

但我花了一週才知道我的tesla c2050 cc 2.0不能用

By Oscar
at 2018-02-08T12:10

GPU版 windows簡單多了~

By Frederic
at 2018-02-12T21:41

要用GPU的話，裝 nvidia-docker 用docker跑digits就
完成環境建製了

By Charlie
at 2018-02-14T09:12

https://github.com/NVIDIA/nvidia-docker
https://github.com/nvidia/digits 是在linux 下

By Brianna
at 2018-02-15T10:32

大家討論好熱烈，學到不少，之前在mac上灌caffe也搞

By Isabella
at 2018-02-19T23:47

好久，某個套件版本不對，就要整段重來。

By Isla
at 2018-02-22T05:02

如果連 Windows 裝起來都有問題，用 Ubuntu 會裝到
不是普通的想死...這還不是裝好就沒事了

By Candice
at 2018-02-25T18:00

windows跑TF跟CUDA比linux簡單多了灌驅動有夠機歪

By Ula
at 2018-03-01T14:59

windows麻煩的是python的library很多都只有linux版

By Quintina
at 2018-03-06T10:20

CPU 唯一優點只有好裝，但是後面負擔的訓練時間多到

By Oliver
at 2018-03-10T12:27

你可以裝個幾十次 GPU 版 (從你剛進碩班算到畢業)

By Hedy
at 2018-03-11T23:05

GPU 加速絕對不是適合 "研究題目就是加速的人"
而是本身就在搞 Deep Learning 的研究生！

By Rebecca
at 2018-03-12T13:38

因為你的研究生涯沒上百次也至少會跑個幾十次實驗！

By Robert
at 2018-03-12T23:07

另外，virtualenv 也比 VirtualBox 簡單非常多...
有在寫 Python 的使用 virtualenv 非常基本吧...

By Lauren
at 2018-03-14T02:34

最後，你的 CPU 的好處...在你快要口試的時候會顆顆

By Frederica
at 2018-03-16T18:17

尤其跑一些更 GY 的 model 好比 RNN 或 GAN 之類的

By Kristin
at 2018-03-20T12:04

你用 CPU 等你跑完別人都畢業了喔

By Harry
at 2018-03-23T03:49

我用Windows啊...雖然專長是train出大便

By Hedy
at 2018-03-24T22:10

Ubuntu 960m 的驅動我炸了三次弄了一整天才把issue
fix 好

By Jacob
at 2018-03-26T09:14

連safe mode 我都進不去

By Rae
at 2018-03-29T13:32

再噓一次跑GAN真的很幹

By Hardy
at 2018-04-01T20:09

> 就算是 CVPR 裡面的paper也沒人給數學理論證明的
證明什麼？如果是模型的有效性應該蠻多篇的吧
CVPR 數學蠻多的啊，確實應用更多沒錯啦

By Jacob
at 2018-04-06T12:19

我想了一下，用數學證明模型有效性在 ICML 比較多

By Agnes
at 2018-04-09T15:01

不過其實時間短的話用免費的雲計算就好了 GCP Azure

By Enid
at 2018-04-11T21:03

AWS都有一些免費的額度可以玩

By Daph Bay
at 2018-04-16T03:26

我沒有使用任何機器學習的模組自己寫函式自己用
高級優化算法從頭到尾自幹

By Charlotte
at 2018-04-21T03:05

然後做出來後幹 octave有夠慢我要轉戰tensorflo
w惹還有 Linux系用nvidia是找死吧你忘記Linux
的誰還直接對nvidia罵 fuck you惹碼

By Faithe
at 2018-04-23T02:08

現在訓練神經網路怕樣本太少或參數太多導致high-bia
s的話還有隨機抽離隱藏層的算法這海超大的

By Daniel
at 2018-04-24T22:12

Linus XDDDDD 原來是這樣 (?

By Hazel
at 2018-04-29T00:15

隨機抽離隱藏層是啥？是指 Dropout?

By Skylar Davis
at 2018-05-02T14:21

對是dropout 我不知道是不是這樣翻XDD 阿話說我剛
打錯那是overfitting 想說奇怪為啥神經元太多會hig
h bias XD

By Sarah
at 2018-05-03T12:11

我有個同學自幹一個類Siri的AI系統可是我沒了解太
多開學的時候去問問細節

By Kumar
at 2018-05-05T17:40

high variance才是 overfit high bias underfit

By Elvira
at 2018-05-10T07:36

用atom啦比vim好用多

By Oscar
at 2018-05-13T03:26

現在大家都在用atom嗎？

By Carol
at 2018-05-17T06:31

vs code啦

By Oscar
at 2018-05-20T08:49

high bias不是參數太少嗎？ high variance和overfit
ting則是參數太多？

By Andy
at 2018-05-22T13:18

剛學已經搞混惹 QQ 看來要複習惹

By Irma
at 2018-05-23T02:15

推 nvidia-docker 網路神人很多～讓他們debug就好

By Freda
at 2018-05-23T19:10

等等真的有人能看得懂理論?那已經準教授等級了吧

By Brianna
at 2018-05-25T05:37

X! 這不是PTT電蝦版嗎?講中文不行嗎? (無誤

By Blanche
at 2018-05-26T23:08

西洽有一篇用GAN生成二次元頭像很科普很中文 ....

By Jacky
at 2018-05-31T08:02

有專門的版，這裡是買PC的吧？

By Isabella
at 2018-05-31T22:27

還有，DeepLearing不是為了Gpu加速用的，妳那個要去

By Kumar
at 2018-06-02T19:44

研究平行運算

By Charlotte
at 2018-06-06T10:11

學DL就好好把DL學好，儘量跳脫「資料庫」還有把你
的「去過適」做好就成功了

By Todd Johnson
at 2018-06-10T03:43

專版在哪??

By Barb Cronin
at 2018-06-11T08:51

不過深度學習本身就是一種過適的過程，怎麼跳脫，你
要好好研究

By David
at 2018-06-14T05:43

我哪知道，python版？

By Queena
at 2018-06-18T02:11

你說有專門的板阿又說你哪知道??

By Connor
at 2018-06-21T02:55

python就除錯版哪有在討論這個

By Oscar
at 2018-06-26T00:07

那這個版就有討論這個的阿？

By Jack
at 2018-06-29T17:54

算了，不吵架，樓主分享的東西是好，但是在這裡分
享就怪怪的而已

By Christine
at 2018-07-03T12:23

都被m文了你還說怪怪的????版主都認可了 ok嗎?

By Ursula
at 2018-07-04T23:56

好文推一個，目前也是新手，推薦可以anaconda配spy
der，驅動cuda & tf & keras非常好安裝，大家一起
加油QQ

By Delia
at 2018-07-07T23:25

以需求來討論選擇硬體的話，類似討論都是可以的。
即使大部分方向都著重在軟體面的話。

By Sarah
at 2018-07-10T20:57

幹最近也開始要碰這個了

By Rosalind
at 2018-07-15T01:33

我又沒說不可以.... 我只是說怪怪的，別引戰

By Annie
at 2018-07-18T10:20

不過樓樓上說得倒是有道理，這裡是我理虧抱歉

By Sierra Rose
at 2018-07-22T14:29

畢竟板上以win採購硬體是大宗，要討論其他os也可

By Ingrid
at 2018-07-24T05:54

使用之間的討論可以減少一些採購問題。那當然是最好

By Andy
at 2018-07-28T17:59

tensorflow官網滿清楚的吧………

By Tristan Cohan
at 2018-08-01T20:47

(GPU) 官網的照做會踩到坑啦，但用 Linux 踩到的坑

By Una
at 2018-08-05T21:57

比 Windows 難太多了

By Rosalind
at 2018-08-08T06:15

哈哈我也是照官網採到不少坑

By Eden
at 2018-08-11T16:13

Linus 照官網會爆炸主要是nv那邊的driver

By Bethany
at 2018-08-13T01:45

抓到了 google都用mac

By Vanessa
at 2018-08-17T13:18

推

By Edwina
at 2018-08-19T07:42

docker

By John
at 2018-08-23T18:19

我用python3一堆套件有問題只好用2.7

By James
at 2018-08-26T15:17

我用Anaconda跟keras 一天就能建好環境了

By Zanna
at 2018-08-30T14:00

完全不需要，本機直接裝ubuntu 跑 caffe 輕鬆
GPU 加速只是一個參數開不開的問題

By Valerie
at 2018-09-02T03:45

跑 learning 還是完全丟掉 windows 比較快

By Isla
at 2018-09-03T09:32

windows anaconda 明明超好裝

By Suhail Hany
at 2018-09-07T10:00

今天試了一下，windows上anaconda的tensorflow的確
超好裝......... 1小時內就裝好了(又是個藍藍瘦，香
菇的心情)

By Robert
at 2018-09-09T00:33

有點久了，專門來這篇推Jerry大，想當初用ubuntu裝t

By Odelette
at 2018-09-13T06:03

ensorflow裝到快哭出來了，深有同感，會遇到各種奇
形怪狀的bug，網路上的解法通常又會連到另一個bug

學習DeepLearning的初學者心得 - 3C

All Comments

Related Posts

舊電腦升級 GTA5/H1Z1/Gigantic

VEGA 和 Fury 同頻性能比較

AMD B350M M-ATX選擇

ROG規格功能擴充到位STRIX X370F GAMING

品牌文書機二選一