grep抓取中文字串時... - Linux

Irma avatar
By Irma
at 2010-09-29T12:09

Table of Contents

大家好, 最近在做一些文書上的處理
想使用grep把文件內的中文字串抓出來比對

可是當我使用
$ grep -w "一" filename

這樣會把 單一 周一 這種以"一"結尾的word也一併抓出...@_@"

如果使用
$ grep -w "^一" filename

會抓到 一‧零零五 這種"一"後面帶著特殊符號的word

如果用
$ grep -w "^一$" filename

就甚麼東西都找不到了 =.=

我的資料格式是
[word] 空白 [count] 空白 [prob]

所以我也試過"^一\s"
不過也是甚麼東西都抓不到...

之前是用C寫, 配合BinarySearch來找.
但感覺速度比grep還要慢=.=

請問有人有比較好的解決法嗎?

--
Tags: Linux

All Comments

Tracy avatar
By Tracy
at 2010-10-03T01:07
你想要抓出的是只有 一 這樣的東西嗎?
Ida avatar
By Ida
at 2010-10-04T20:19
覺得好像應該改用egrep
Sarah avatar
By Sarah
at 2010-10-08T03:50
回一樓, 沒錯~~
Sarah avatar
By Sarah
at 2010-10-11T14:25
回2F, 我試過了...Q_Q 不知道跟Big5有沒有關係
Hamiltion avatar
By Hamiltion
at 2010-10-15T18:45
grep -w " 一 " filename 這樣不知道行不行 XDDD
前後各留個空白這樣 不過行首行尾要另外處理
Emily avatar
By Emily
at 2010-10-18T08:38
linux預設編碼是utf-8,要不要先用iconv轉檔看看?
Donna avatar
By Donna
at 2010-10-21T08:26
那分兩次呢 先找 ^一 再找 一$
Irma avatar
By Irma
at 2010-10-26T00:58
" 一 " 可以吧..英文的可以

Linux 重灌XP找不到硬蝶

Candice avatar
By Candice
at 2010-09-29T10:40
※ [本文轉錄自 hardware 看板 #1CegRuhP ] 作者: NAMESTANLY (唉~) 站內: hardware 標題: [除錯] Linux 重灌XP找不到硬蝶 時間: Wed Sep 29 10:39:50 2010 ﹝硬體規格﹞CPU:AMD 635 MB ...

用PieTTY免輸入密碼登入ssh伺服器

Victoria avatar
By Victoria
at 2010-09-29T01:44
你好 想請問一下我照著法二做 確實能夠不輸入密碼進入 但是想另外請問的是, 有沒有可能做到連使用者 id 都不需要輸入直接進入? 這樣可能會更方便一些? 謝謝 ※ 引述《Holocaust123 (奔跑的蝸牛)》之銘言: : ※ [本文轉錄自 EZsoft 看板 #1CcBlzmW ] : 法 ...

調整解析度後 螢幕抓不到訊號

Hedwig avatar
By Hedwig
at 2010-09-29T01:01
好急 電腦為 Linux Red Had 且是醫療用的套裝系統 所以 etc/X11/ 裡 沒有xorg.conf該檔案 只有在 /var/log 裡找到 XFree86.0.log ------------------------------------- 出問題前 使用上完全正常 預設解析度為 ...

ftp的selinux設定

Kyle avatar
By Kyle
at 2010-09-28T22:00
※ 引述《Adama (So Say We All.)》之銘言: : ※ 引述《ckkt (!at#$)》之銘言: : : 請問架ftp selinux該怎麼設定 : : 我把selinux關掉就可以連進去 : : 如果把selinux打開就無法連進去 : : 是改本文嗎 : : 還是布林值也要改 : man ...

ssh到工作站 再telnet PTT,版面會亂掉

Ophelia avatar
By Ophelia
at 2010-09-28T18:41
※ 引述《chang0206 (Eric Chang)》之銘言: : 最近租了一個VPS的空間,我想拿來當作連線PTT的跳板。 : 因為不想直接在公司電腦用telnet 出去... : 現在用pietty 透過SSH 連線到VPS已經是OK的。 : 但是在VPS上,不管是ssh bbsatptt.cc 或者是 ...