希字碼

希字碼，或 XCC（ Charater Code），是希頂社區設計的，用於表示希頂語的字音的一套二進制編碼系統。系統從實際的明文字音里抽象出不同元素的邏輯順序，可以用於表示原希和希雅和標希等希頂方言的字音。

在此之外，除了二進制形式，我們另設計了對應的字符化形式（SXCC，Stringified  Charater Code）與十進制形式（或稱電碼形式，分為標希用與希雅用）。

系統說明

編碼格式

為保持與ASCII的兼容性，每字節的首位（高位）不包含編碼信息，僅填入1。

碼段分配
b0	5位，聲母	2位，介母	b0	4位，韻母	3位，編碼後綴

如此安排，兩個字節可表示一個希頂音節。上文中聲、介、韻採用希頂拼寫中的形式，不轉化至底層形式。特別地，- 記為 ü-，因其拼寫僅為字面上的簡寫。

聲母
	0	4	8	C
80+	∅			
90+				
A0+				
B0+				
C0+				
D0+				
E0+				
F0+			空	空

介母
+0	∅
+1	
+2	
+3	ü

韻母
	1	9	11	19
80+	∅			
A0+				
C0+				
E0+				

對於部首的編碼。即只取聲、介、韻之一，其餘部分填充為空。所以用於排序時部首字母的順序韻母最前、介母稍後、聲母最後。

編碼後綴
編碼	含義	SXCC形式
-1	字音終止	！
±0	平凡狀態
+1	常態且字音終止	Z!
+2	常態	Z
+3	轉置且字音終止	X!
+4	轉置	X
+5	聲旁、音節連接	-

容易發現，一個空音節（聲、介、韻皆空）也可添加編碼後綴，這是實用的：有時我們需要同時添加多個編碼後綴，這時較為後者就應添加在序列隨後的空音節上。值得注意的是，編碼後綴獨立出來和合併在前面的音節上是等價的，但儲存時通常需正規化（計算NXCC時尤其需要注意），儘可能合併到一個音節上。（註：在多樹希頂方言中，部首或許也與常態編碼後綴等價。）

對應字音關係

……

SXCC

……

NXCC

……

希雅語

↪ 請查看頁面：希雅語

示例

……

系統說明

編碼格式

對應字音關係

SXCC

NXCC

希雅語

示例

相關 demo 與解析庫