: 學語文時,有時會利用google搜尋來查詢不同片語的使用頻率,來了解哪種最常被使用,
: 可是今天發現一個小問題:
: 如果我查詢
: "what i'm surprised about is" -- 第一頁搜尋結果顯示 2980
: "what i'm surprised at is" -- 第一頁搜尋結果顯示 7210
: 可是如果不斷地往後點選結果,一直到最後一個,會發現筆數變了:
: "what i'm surprised about is" -- 467
: "what i'm surprised at is" -- 262
google是同時把query送到很多個server,
才有可能250ms內搜尋幾億筆的資料, 回傳的數量只是個大概值,
一直按下一頁後, 實際的筆數就可能會不一樣
想知道那個最常被使用, 只需要相對數值, 不需要絕對數值
另外, 還有很多的網頁, 沒有被crawl到, 或是被crawl到,
但是品質太低而沒有被索引, 所以不用太在意那個絕對數值的
: (而且這樣又有另外一個問題,就是當搜尋結果筆數過多時,似乎只能點到第91頁,
是的 (我印象中是100頁?), 可以直接改url的參數試試看
: 就無法再繼續往後點了...)
你可以找個會寫程式的, 用google api去拿到所有你想知道的片語
在google搜尋的個數
--
如果在世界上的頹廢,
可以換來對自己的負責,
那我寧願對自己負責....
--
: 可是今天發現一個小問題:
: 如果我查詢
: "what i'm surprised about is" -- 第一頁搜尋結果顯示 2980
: "what i'm surprised at is" -- 第一頁搜尋結果顯示 7210
: 可是如果不斷地往後點選結果,一直到最後一個,會發現筆數變了:
: "what i'm surprised about is" -- 467
: "what i'm surprised at is" -- 262
google是同時把query送到很多個server,
才有可能250ms內搜尋幾億筆的資料, 回傳的數量只是個大概值,
一直按下一頁後, 實際的筆數就可能會不一樣
想知道那個最常被使用, 只需要相對數值, 不需要絕對數值
另外, 還有很多的網頁, 沒有被crawl到, 或是被crawl到,
但是品質太低而沒有被索引, 所以不用太在意那個絕對數值的
: (而且這樣又有另外一個問題,就是當搜尋結果筆數過多時,似乎只能點到第91頁,
是的 (我印象中是100頁?), 可以直接改url的參數試試看
: 就無法再繼續往後點了...)
你可以找個會寫程式的, 用google api去拿到所有你想知道的片語
在google搜尋的個數
--
如果在世界上的頹廢,
可以換來對自己的負責,
那我寧願對自己負責....
--
All Comments