跳至內容

希字碼

出自希顶维基
於 2025年10月28日 (二) 23:09 由 雨音浅夏留言 | 貢獻 所做的修訂

希字碼,或 XCC( Charater Code),是希頂社區設計的,用於表示希頂語字音的一套二進制編碼系統。系統從實際的明文字音里抽象出不同元素的邏輯順序,可以用於表示原希希雅標希等希頂方言的字音。

在此之外,除了二進制形式,我們另設計了對應的字符化形式(SXCC,Stringified  Charater Code)與十進制形式(或稱電碼形式,分為標希用與希雅用)。

系統說明

編碼格式

為保持與ASCII的兼容性,每字節的首位(高位)不包含編碼信息,僅填入1。

碼段分配
b0 5位,聲母 2位,介母 b0 4位,韻母 3位,編碼後綴

如此安排,兩個字節可表示一個希頂音節。上文中聲、介、韻採用希頂拼寫中的形式,不轉化至底層形式。特別地,- 記為 ü-,因其拼寫僅為字面上的簡寫。

聲母
0 4 8 C
80+
90+
A0+
B0+
C0+
D0+
E0+
F0+
介母
+0
+1
+2
+3 ü
韻母
1 9 11 19
80+
A0+ 
C0+
E0+

對於部首的編碼。即只取聲、介、韻之一,其餘部分填充為空。所以用於排序時部首字母的順序韻母最前、介母稍後、聲母最後。

編碼後綴
編碼 含義 SXCC形式
-1 字音終止
±0 平凡狀態
+1 常態且字音終止 Z!
+2 常態 Z
+3 轉置且字音終止 X!
+4 轉置 X
+5 聲旁、音節連接 -

容易發現,一個空音節(聲、介、韻皆空)也可添加編碼後綴,這是實用的:有時我們需要同時添加多個編碼後綴,這時較為後者就應添加在序列隨後的空音節上。值得注意的是,編碼後綴獨立出來和合併在前面的音節上是等價的,但儲存時通常需正規化(計算NXCC時尤其需要注意),儘可能合併到一個音節上。(註:在多樹希頂方言中,部首或許也與常態編碼後綴等價。)

對應字音關係

……

SXCC

……

NXCC

……

希雅語

↪ 請查看頁面:希雅語

示例

……

相關 demo 與解析庫

……