這個問題我 google 了幾天了都找不到解決方案
所以決定到版上來問問看
因為要做研究的關係我蒐集很多 .html 的網頁資料 (大概600筆左右)
全部都是 big5 中文碼
我想用 grep 抓關鍵字分析資料 沒想到 grep 居然抓不到 big5 的中文字
(utf-8 的中文和日文都抓得到)
詭異的地方在於 我之前用的系統
(Ubuntu 10.04 Lucid Lynx, i386; GNOME)
grep 抓得到 big5 中文字
換了電腦又升級系統之後
(Ubuntu 10.10 Maverick Meerkat, amd64; GNOME 2.32.0)
grep 就不認識 big5 中文字了
我不太知道這種問題要從什麼地方下手解決
google 的時候也是抱著亂槍打鳥的心情在找
希望版上有大大也遇到類似的狀況
指引小女子解決問題的一盞明燈 <(_ _)>
感謝!!
--
所以決定到版上來問問看
因為要做研究的關係我蒐集很多 .html 的網頁資料 (大概600筆左右)
全部都是 big5 中文碼
我想用 grep 抓關鍵字分析資料 沒想到 grep 居然抓不到 big5 的中文字
(utf-8 的中文和日文都抓得到)
詭異的地方在於 我之前用的系統
(Ubuntu 10.04 Lucid Lynx, i386; GNOME)
grep 抓得到 big5 中文字
換了電腦又升級系統之後
(Ubuntu 10.10 Maverick Meerkat, amd64; GNOME 2.32.0)
grep 就不認識 big5 中文字了
我不太知道這種問題要從什麼地方下手解決
google 的時候也是抱著亂槍打鳥的心情在找
希望版上有大大也遇到類似的狀況
指引小女子解決問題的一盞明燈 <(_ _)>
感謝!!
--
All Comments