大家好,我知道在tty顯示中文很麻煩,所以我想知道在亂碼背後的顯示模式
問題是這樣的:
我有50萬個檔案要處理,格式大概是 501025_ID.txt
因為一開始沒限制作業ID只能用英文,所以有幾個中文ID混入
LINUX顯示如下
502222_123.txt
503312_??+??.txt (為中文所顯示的亂碼)
507832_cher.txt
503878_-?{D.txt (為中文所顯示的亂碼)
要把中文的ID換成英數比較好處理
所以我用 find . -regextype egrep -regex ".*_[^[:alnum:]].*"
或是改用 -------------------------------".*_\?\?\+\?\?.*"
都沒辦法抓出任何一條Orz
想請問的是,怎麼樣可以知道linux實際上對那字元的認知是什麼?
或是,有認何方式可以直接把這些中文亂碼換成可見的英數文字嗎?
例如: 我 \u{num}
謝謝
Dan
--
不過是人
http://www.facebook.com/twaiting
--
All Comments