看不懂十六進制的charset內容 - Linux

David avatar
By David
at 2016-07-01T17:24

Table of Contents

後來看懂了,說明放在最下面。
_____________________________________________________
想寫一個小program,可以檢測某個ttf或otf檔(字型)

有沒有完整支援一段utf8編碼的字串

但我現在在看「fc-query xxx.ttf」出來的內容

在charset的部份,看起來是十六進位,但我沒辦法跟unicode編碼的十六進位

連結起來,以下是fc-query出來的部份片段
﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍

charset:
0000: ffffffff ffffffff ffffffff 7fffffff 00000000 ffffffff ffffffff ffffffff
0001: 0c0f000f 00000f00 000cf198 00003f00 00040000 00018003 1fffe000 03000000
0002: 00000000 00000000 00020000 00000002 00000000 00000000 02000e80 00000000
0003: 00000000 00000000 00000000 00000000 fffe0000 fffe03fb 000003fb 00000000
0004: ffff0002 ffffffff 0002ffff 00000000 00000000 00000000 00000000 00000000


然後我找到一篇文章,底下的解答有如何看是否有對應charset

﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍
It shows the supported character ranges, although it doesn't which block it

belongs to (you have to know which range belongs to which block).

For example, the fourth column of 0000, which corresponds to U+0060 - U+007F,

has a hex value of 7fffffff. This has a bit value of

0111 1111 1111 1111 1111 1111 1111 1111

, where the right most bit is U+0060, and the left most is U+007F.

This means that U+007F is not supported in this font.

﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍

但我還是不懂,他如何看出0000那行的第四欄是介於unicode編碼的U+0060 ~U+007F

那其他行跟其他欄是要如何跟unicode編碼對應?
﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍

說明:

utf8最廣泛的是1到3 byte,所以以3 byte來說,範例中的每一row(0000,0001,0002....)

的開頭(冒號左邊)代表3 byte中的前2 byte開頭,冒號右邊的八組column

代表剩下1 byte的16*16個尾數(ex. 0000 row 是從000000到0000ff)

所以每個column負責32個尾數,而如果把每個column decode 到二進位

就有32個二進位值,例如row 0000的第四欄7fffffff的二進位就是

0111-1111-1111-1111-1111-1111-1111-1111,這是從000060 ~ 00007f

代表000060到00007e都有這個字型,但最左邊的0(from 0111)代表00007f沒支援

沒錯,是從右邊數來,到左邊最大值,最右邊是000060,最左是00007f
--
Tags: Linux

All Comments

Ursula avatar
By Ursula
at 2016-07-02T17:14
那the right most bit's column of 1111~0110 之間是否也
Joe avatar
By Joe
at 2016-07-07T16:28
屬於 U+0060 呢?
John avatar
By John
at 2016-07-11T22:43
安裝 fonttools/TTX dump 出 cmap table 然後去分析
Linda avatar
By Linda
at 2016-07-15T05:23
或自行寫個 python 小程式去判斷(用 fonttools)。
Dinah avatar
By Dinah
at 2016-07-18T14:37
或有安裝 fontforge 的話,寫個 fontforge script。
Yedda avatar
By Yedda
at 2016-07-19T11:48
疑=.=?等等,冒號左邊 : 冒號右邊...你冒號是不是沒標!
Candice avatar
By Candice
at 2016-07-19T17:22
痾~~看懂了ex. FFFF(前2byte):32個ff 是這樣吧,唉~~~~
Odelette avatar
By Odelette
at 2016-07-23T06:49
fc-query 對 charset 的判斷並不可靠。
Michael avatar
By Michael
at 2016-07-23T11:41
對,後來我實際使用了幾個中文字檢查了幾個檔案
Margaret avatar
By Margaret
at 2016-07-28T09:17
發現charset提供的資訊有一定機率的失誤
後來就使用freetype library來解決這問題了
Jake avatar
By Jake
at 2016-07-28T19:27
要用 c 寫的話,一些地方要自己刻。FT2 對字型操作
相當陽春。

LibreOffice 簡報者畫面

Steve avatar
By Steve
at 2016-06-30T13:09
想請問大家的 Libreoffice 接投影機簡報時,若啟用簡報者畫面, 切換投影片時會不會很慢?這在顯示投影片筆記後特別明顯 如果該頁的筆記很長(兩三百個中英文字),可能要花上10-20秒才會換頁. 我在網路上找到唯一有點類似的是這個 report https://bugs.documentfounda ...

Linux 虛擬 windows

Frederica avatar
By Frederica
at 2016-06-29T22:33
各位版上大大好 之前曾經看到一篇文章 (已經忘記哪裡看到了) 就是一位神人設定linux 虛擬機開windows 結果效能幾近原生windows 因為mac os有pd可以開windows 玩遊戲幾乎正常atat 因為linux某些軟體在VM上不能跑 所以才想到要不要以這樣子的方式取代 想說各位 ...

hello.c Makefile

Susan avatar
By Susan
at 2016-06-26T15:41
我是初學者想請問一下 練習一下linux device drives上的範例 http://codepad.org/cC4upqT6 發現用/lib/modules執行的時候會發生error 用/usr/src底下的才可以 是因為什麼原因? 謝謝 - ...

fedora 24 beta

Connor avatar
By Connor
at 2016-06-26T12:11
※ 引述《OrzOGC (洞八達人.拖哨天王)》之銘言: : beta有段時間了,我一直以來都是在beta就升下一版 : 從fc6開始身為死忠腦殘f粉不裝就說不過去 : fedup,晚上11點睡前執行,醒來時就裝好了,看log完成時間大概是早上5點左右 : 一般使用和fedora23一樣,改一點點介面,藍牙還 ...

大家可以遠端連上win10嗎?

Una avatar
By Una
at 2016-06-26T11:09
小弟目前的OS版本是 ubuntu14.04 原本 遠端遙控win7都沒有任何問題 但是升級成win10之後就連不上去了 不知各位家裡的電腦有沒有這種情況 - ...