最近要作「網頁」與「關鍵字」的相關性分析,
問題如下,
機器人爬回來的網頁資料,會存放在資料庫裡。
不會爬回全世界的網頁,但也會有不少的資料,
Q1.請問該準備多少容量的硬碟,才會比較夠呢?
Q2.一部電腦可以接多少台硬碟呢?
若硬碟裝滿了,是不是可以增加硬碟,
讓一台電腦,去接很多很多塊硬碟?
或是每增加一些硬碟,就一定要增加一台電腦?
補充如下,這是內部人員要使用的實驗環境,所以電腦數約2~3台,
平時沒用都會關機,有用才會打開,目前要作的實驗是,
輸入某個「關鍵字」,例如「ptt」,計算相關的網頁數有多少筆,
查詢時間會控制在10秒內
Q3. 請問硬碟與硬碟間的資料可以互通嗎?
例如查詢硬碟A的資料查不到(或查到部份結果),再到硬碟B去查,
查到了,再顯示出來
--
問題如下,
機器人爬回來的網頁資料,會存放在資料庫裡。
不會爬回全世界的網頁,但也會有不少的資料,
Q1.請問該準備多少容量的硬碟,才會比較夠呢?
Q2.一部電腦可以接多少台硬碟呢?
若硬碟裝滿了,是不是可以增加硬碟,
讓一台電腦,去接很多很多塊硬碟?
或是每增加一些硬碟,就一定要增加一台電腦?
補充如下,這是內部人員要使用的實驗環境,所以電腦數約2~3台,
平時沒用都會關機,有用才會打開,目前要作的實驗是,
輸入某個「關鍵字」,例如「ptt」,計算相關的網頁數有多少筆,
查詢時間會控制在10秒內
Q3. 請問硬碟與硬碟間的資料可以互通嗎?
例如查詢硬碟A的資料查不到(或查到部份結果),再到硬碟B去查,
查到了,再顯示出來
--
All Comments