純文字環境下的分析網頁取得網址? - Linux

Dora avatar
By Dora
at 2010-07-20T19:44

Table of Contents

請問版友,在linux 文字模式下

用curl取得網頁的原始碼後,有較方便快速的方式可以取得網址嗎?

在windows下,有用過dom的方式將特定的tag分析,大概幾行程式碼就可以

將所需要的超連結網址或是圖片網址給取出

目前在linux Command-line interface 打算的做法是

用curl抓原始碼後,再用shell script處理文字檔,以取得所需要的資訊

因為curl抓下的原始碼挺亂的,用shell script處理可能會有loss

想請問版友是否有更好的建議嗎? 感謝 ^_^



不好意思~再請問一下 有人可以解釋下面這段的意思嘛~
sed -n 's/.*\(href\)\=\"\([^[:space:]]*\)\".*/\2/p'



--
★正妹 你相信奇蹟嗎?
To 正妹: 原本不信,但現在我信。

--
Tags: Linux

All Comments

Irma avatar
By Irma
at 2010-07-24T08:42
sed
Skylar Davis avatar
By Skylar Davis
at 2010-07-26T00:59
perl regulaer expression
William avatar
By William
at 2010-07-28T18:39
想請教一下sed + regulaer expression的問題
用sed -n 's/.*\(href\)\=\"\([^[:space:]]*\)\".*/\2/p'
John avatar
By John
at 2010-07-31T04:41
得到 ./viewtopic.php?f=57&t=38233&sid=f713efa0f4
Hamiltion avatar
By Hamiltion
at 2010-08-04T18:50
該怎麼修改才能得到 ./viewtopic.php?f=57&t=38233 呢?
Queena avatar
By Queena
at 2010-08-07T04:49
去問regexp版會比較快,或是自己學一下regulaer expression
問的時候請附上範例

雷擊過後……

Rachel avatar
By Rachel
at 2010-07-20T14:13
大家都知道前幾天高雄打過幾次大雷、也發生過大規模斷電 問題在於之後檢查了電腦(OS為debian),發現卡在使用者登入畫面這裡, 不管是輸入何種帳號密碼都會顯示錯誤而無法登入(包括root) 目前比較明顯的錯誤訊息有在開機過程顯示的 mounting local filesystems:failed ...

C編譯的問題(pgplot繪圖)

Eden avatar
By Eden
at 2010-07-20T13:14
是這樣的 我剛學linux不到一個月 因為我的繪圖軟體pgplot 他是屬於fortran的編譯軟體 但是要寫下程式碼時 主要他是接受fortran的編碼 但是老師希望我用C語言來試試看,我查過確實pgplot也可以用C寫 只是要再經過另一種編譯法來變成可執行檔 我在自己家目錄下的自己的資料夾 ...

適合ubuntu的專業剪輯軟體

Lydia avatar
By Lydia
at 2010-07-19T23:46
不知道有沒有人使用ubuntu同時也有在使用專業的剪輯軟體? 因為接下來電腦會換成ubuntu, 想先確定可以安裝哪一套在電腦裡。 現在電腦還在windows xp系統,使用的是adobe premiere pro 2.0 但很擔心會不相容,所以想問問版上大家的意見,謝謝 - ...

Eeepc 1001HA安裝問題

Charlie avatar
By Charlie
at 2010-07-19T23:26
我的Eeepc 1001HA原本是windows xp, 後來安裝ubuntu, eeebuntu都不行, 都會出現x server找不到的訊息 請問要如何修正? 謝謝 以下是電腦安裝時的錯誤訊息: x window system version 7.1.1 release date: 12 m ...

kde4 虛擬桌面

Carol avatar
By Carol
at 2010-07-19T18:14
請問 kde4 的 虛擬桌面有辦法設定哪個程式要放在哪個桌面嗎? 也就是每次一開啟,就會自動放到指定的桌面。 我有在設定裡面找過,但沒發現這個功能。 - ...