跳转到内容
主菜单
主菜单
移至侧栏
隐藏
导航
首页
最近更改
随机页面
社群首页
帮助
希顶相关网站
希顶社区官网
希服维基
Nyoeghau翻译器
〇改希顶转写器
语圈山海经
搜索
搜索
外观
创建账号
登录
个人工具
创建账号
登录
查看“︁希字码”︁的源代码
页面
讨论
不转换
不转换
简体
繁體
新加坡简体
阅读
查看源代码
查看历史
工具
工具
移至侧栏
隐藏
操作
阅读
查看源代码
查看历史
常规
链入页面
相关更改
特殊页面
页面信息
外观
移至侧栏
隐藏
←
希字码
因为以下原因,您没有权限编辑该页面:
您请求的操作仅限属于这些用户组的用户执行:
用户
、storagereadable
您必须确认您的电子邮件地址才能编辑页面。请通过
参数设置
设置并确认您的电子邮件地址。
您可以查看和复制此页面的源代码。
'''希字码''',或 '''XCC'''( Charater Code),是[[希顶社区]]设计的,用于表示[[希顶语]]的[[字音]]的一套二进制编码系统。系统从实际的明文字音里抽象出不同[[正字法|元素]]的逻辑顺序,可以用于表示[[原希]]和[[希雅]]、[[新标希|标希]]、[[〇改]]等希顶方言的字音。 在此之外,除了二进制形式,我们另设计了对应的字符化形式('''SXCC''',Stringified Charater Code)与十进制形式(或称电码形式,分为''标希用''与''希雅用'')。 == 系统说明 == === 编码格式 === 为保持与ASCII的兼容性,编码中每一字节的首位(高位)不包含编码信息,仅填入1。 {| class="wikitable" |+码段分配 |- !b0 |5位,声母||2位,介母 !b0 |4位,韵母||3位,编码后缀 |} 如此安排,两个字节可表示一个希顶音节,即一个token。音节中对应的声、介、韵采用希顶拼写中的表层形式,不转化至音系上的底层形式。特别地,{{x|4u-}}、{{x|hu-}} 记为 {{x|4ü-}}、{{x|hü-}},因其拼写仅为[[希顶语拼读规则|字面]]上的简写: {| class="wikitable" |+声母 |- ! !!0!!4!!8!!C |- |80+||∅||{{x|b}}||{{x|p}}||{{x|f}} |- |90+||{{x|w}}||{{x|m}}||{{x|d}}||{{x|t}} |- |A0+||{{x|l}}||{{x|F}}||{{x|7}}||{{x|v}} |- |B0+||{{x|z}}||{{x|D}}||{{x|s}}||{{x|r}} |- |C0+||{{x|H}}||{{x|j}}||{{x|q}}||{{x|x}} |- |D0+||{{x|y}}||{{x|n}}||{{x|g}}||{{x|k}} |- |E0+||{{x|h}}||{{x|4}}||{{x|N}}||{{x|B}} |- |F0+||{{x|c}}||{{x|5}}||空||空 |} 包含[[原希]]的29个声母与一个空声母,其中不包含扩充字母 {{x|M}}、{{x|O}}。右下角两个空位设计用于扩展或其他符号的兼容。 {| class="wikitable" |+介母 |- | +0||∅ |- | +1||{{x|i}} |- | +2||{{x|u}} |- | +3||{{x|ü}} |- |} 包含3个介母与一个空介母。其中 {{x|ü}} 用于拼写[[原希]]中的非规则音节(如 彪 {{x|büL}})和 {{x|4u-}}、{{x|hu-}}。 {| class="wikitable" |+韵母 |- ! !!1!!9!!11!!19 |- |80+||∅||{{x|a}}||{{x|e}}||{{x|o}} |- |A0+||{{x|1s}}||{{x|1}}||{{x|E}}||{{x|A}} |- |C0+||{{x|Y}}||{{x|L}}||{{x|V}}||{{x|6}} |- |E0+||{{x|2}}||{{x|T}}||{{x|8}}||{{x|3}} |- |} 包含15个韵母和一个空韵母。其中{{x|1s}}构成[[原希]]中的非规则音节(如 私 {{x|t1s}})。 对于部首的编码。即只取声、介、韵之一,其余部分填充为空。所以用于排序时部首字母的顺序韵母最前、介母稍后、声母最后。 {| class="wikitable" |+编码后缀 |- ! 编码 !! 含义 !! SXCC形式 |- | -1 || 字音终止 || ! |- | ±0 || 平凡状态 || |- | +1 || 常态{{x|H}}且字音终止 || Z! |- | +2 || 常态{{x|H}} || Z |- | +3 || 转置{{x|H}}且字音终止 || X! |- | +4 || 转置{{x|H}} || X |- | +5 || 声旁、音节连接 || - |} 编码后缀添加在音节或部首后,Z 和 X 用于处理 转置{{x|H}} 和 常态{{x|H}},! 用于结束一个字音,- 用于连接多音节的声旁或无法用一码表示的复杂非规则音节。 容易发现,一个空音节(声、介、韵皆空)也可添加编码后缀,这是实用的:有时我们需要同时添加多个编码后缀,这时较为后者就应添加在序列随后的空音节上。值得注意的是,编码后缀独立出来和合并在前面的音节上是等价的,但储存时通常需正规化(计算NXCC时尤其需要注意),尽可能合并到一个音节上。(注:在多树希顶方言中,部首{{x|H}}或许也与常态{{x|H}}编码后缀等价。) === 对应字音关系=== 希字码用于描述希顶语[[字音]],亦实现[[希雅语]]为表层呈现(同时对应[[新标希|标希]]、[[〇改]],但不构成双射)。可支持'''音译声旁'''和'''嵌套部首'''、'''多重H'''、'''整字部首'''等多种形式。作为希字码仅需按顺序罗列元素与所需的编码后缀,便于解析、分析、排序。 希字码到希顶语字音的过程称解码(decode),对于不同方言的实现不同。下面是对于[[希雅语]]所需的逻辑: XCC的第一个token通常应为一个音节或一个空音节。(如不构成音节或视同一个''多''(非1)音节声旁,或视为非法序列,更推荐的形式可以是一个空音节后加 - 。)如遇 - 则连接下一token成为多音节声旁。 部首的初始方向是向前,我们记方向为 Δ,记反向操作为 -Δ,记前后为 ◅、▻。遇到一般的部首、Z 时我们的 Δ 不变,仅需添加对应的部首或 {{x|H}}。遇到 X 时Δ:=-Δ,并在序列上添加 {{x|H'}}(如◅) 或 {{x|'H}}(如▻)。 === SXCC=== …… === NXCC === …… === 希雅语 === ↪ 请查看页面:[[希雅语]] == 示例 == …… == 相关 demo 与解析库 == ……
该页面使用的模板:
Template:Ruby
(
查看源代码
)
Template:X
(
查看源代码
)(受保护)
Module:Arguments
(
查看源代码
)
Module:Xd
(
查看源代码
)(受保护)
返回
希字码
。