大家好, 最近在做一些文書上的處理
想使用grep把文件內的中文字串抓出來比對
可是當我使用
$ grep -w "一" filename
這樣會把 單一 周一 這種以"一"結尾的word也一併抓出...@_@"
如果使用
$ grep -w "^一" filename
會抓到 一‧零零五 這種"一"後面帶著特殊符號的word
如果用
$ grep -w "^一$" filename
就甚麼東西都找不到了 =.=
我的資料格式是
[word] 空白 [count] 空白 [prob]
所以我也試過"^一\s"
不過也是甚麼東西都抓不到...
之前是用C寫, 配合BinarySearch來找.
但感覺速度比grep還要慢=.=
請問有人有比較好的解決法嗎?
--
想使用grep把文件內的中文字串抓出來比對
可是當我使用
$ grep -w "一" filename
這樣會把 單一 周一 這種以"一"結尾的word也一併抓出...@_@"
如果使用
$ grep -w "^一" filename
會抓到 一‧零零五 這種"一"後面帶著特殊符號的word
如果用
$ grep -w "^一$" filename
就甚麼東西都找不到了 =.=
我的資料格式是
[word] 空白 [count] 空白 [prob]
所以我也試過"^一\s"
不過也是甚麼東西都抓不到...
之前是用C寫, 配合BinarySearch來找.
但感覺速度比grep還要慢=.=
請問有人有比較好的解決法嗎?
--
All Comments