Skip to content

Latest commit

 

History

History
296 lines (268 loc) · 18.8 KB

change_summary-hans.md

File metadata and controls

296 lines (268 loc) · 18.8 KB

主要改码说明及争议取码

  1. 「冎」取码
    根据汉文库典及沈红莲女士的回信(二),「冎」的上部是辅助字形,故「冎」取「月月」。

  2. 「軣」取码
    根据沈红莲女士的回信(一),「軣」取「十十金金」。列举相关字例如下:

Unicode 汉字 取码
U+43EE 月.大尸.金
U+5841 田.金.金土
U+6442 手.尸十.金
U+6E0B 水.卜一.金
U+7582 田.金.金一
U+8EE3 十十.金.金
U+2B753 𫝓 十.大尸.金
U+2D0F2 𭃲 水金.中.弓
U+2DD11 𭴑 火.金.金
U+2DF89 𭾉 中田.金.金廿
U+2E42A 𮐪 廿.口.金木
U+2E4FC 𮓼 中戈.金.金
U+2E6CE 𮛎 口人.金.金
  1. 「参」取码
    有观点认为:根据规则,「参」应当视为上中下三分字:字首为「厶」,次字首为「大」,次字身为「彡」。当前未发现仓颉输入法的任何规则或理论支持将「⿱厶大」视作字首,故「参」字应当取码「戈大竹竹」。
    在官方码表中,「参」字均取码「戈大竹竹竹」。
    目前流行的输入法软件中,「参」字多取「戈大竹竹竹」。
    故本码表跟从官方码表取「戈大竹竹竹」。
    相关字:叁参奙貵軬𫊲 等

  2. 「春舂秦冬各备夅夆帝登」作字首(次字首)的取码
    在官方码表中,分割字首字身时,若遇「春舂秦冬各备夅夆帝登」,则将「春舂秦冬各备夅夆帝登」整体视作字首取码(唯「䆐」字例外,取「手大竹木木」)。
    例如:「蠢」取「手日中戈戈」而非「手大日中戈」,「凳」取「弓廿竹弓」而非「弓人一口弓」。
    有观点认为此取法不符合仓颉的取码规则,「蠢」应取「手大日中戈」,「凳」应取「弓人一口弓」,否则与「盆」(金尸竹廿)、「奮」(大人土田)等字取码矛盾。
    有观点认为此取法与其他含「𡗗夂癶」的字取码规则不统一,因「癹」官方取码「弓人竹弓水」而非「弓弓水」,「𠒏」取「手大一一山」而非「手一一山」(等等)。
    本码表兼容两种取码。

  3. 「韲」上方部件取码
    《第五代仓颉输入法手册》将「齊」列作难字,取「卜难」,书附码表中将「𪗇」形字的「齊」视作字首。
    「汉文库典」中,「韲」字取「卜难中尸一」,将「韲」的上部(齊頭)视作字首,取码「卜难」。
    本码表依官方取码,将「齊」和「韲」的上部(齊頭)视为难字,均取码「卜难」。
    列举相关字例如下:

Unicode 汉字 取码
U+4421 卜难.人月人
U+97F2 卜难.中尸一
U+9F4A 卜难
U+20188 𠆈 卜难.月.女
U+20197 𠆗 卜难.人.一口
U+2019C 𠆜 卜难.十中.女
U+20397 𠎗 人.卜难.中
U+21141 𡅁 口.卜难.木
U+2405C 𤁜 水.卜难.手
U+26803 𦠃 卜难.中.月中
U+26815 𦠕 卜难.口.人月
U+2698F 𦦏 卜难.竹难
U+27DD4 𧷔 卜难.月山金
U+2889E 𨢞 卜难.一金田
U+28F3B 𨼻 弓中.卜难.女
U+29410 𩐐 卜难.一.一一
U+29413 𩐓 卜难.土中一
U+29766 𩝦 卜难.人.戈女
U+29E75 𩹵 卜难.中.弓中
U+2A509 𪔉 卜难.月山.中 / 卜难.月山.弓
U+2A5CE 𪗎 卜难.竹弓.金
U+2A5D0 𪗐 卜难.田.金日
U+2A654 𪙔 卜难.卜一.山
U+2A68E 𪚎 卜难.卜山.山
U+2CE72 𬹲 卜难.田
U+2E2E1 𮋡 卜难.一月中
U+2E530 𮔰 卜难.中一戈
  1. 「鹿」上方部件取码
    《第五代仓颉输入法手册》将「鹿」、「廌」、「慶」字列作难字,属于取码「首、难、尾」的类型,分别取码「戈难心」、「戈难火」、「戈难水」。除此之外,未收录其他包含「鹿」的上部(鹿頭)的字。
    「汉文库典」中,「𢉖」字取码「戈难戈戈」。
    关于难字是否可类推的问题,沈红莲女士在回信(二)中提及:「可以加难字,但希望大家有共识,也要考虑重码问题」。
    考虑官方意见及重码问题,本码表将「鹿」的上部(鹿頭)视为难字,取码「戈难」。「鹿」、「廌」、「慶」三字则维持视作例外字,保持原编码不变。

  2. 「𫠣」(「拣」右侧)的取码
    「拣」字在「汉文库典」中取码「手大女金」,在朱邦复工作室提供的《内码对照表》中取码「手大女木」(苍颉检字法/六代)。《第五代仓颉输入法手册》未收「拣」字。
    有观点认为「手大女金」、「手女弓木」的「女」多余,不符合《第五代仓颉输入法手册》所述之「精简原则」,亦与「东」字取码不保留「女」相悖,故「𫠣」应取「大弓木」。
    本码表依「汉文库典」,「𫠣」字取码「大女尸金」,容错「大女弓木」。
    相关讨论见 Issue #17

  3. 「𫥮」右侧部件的取码
    有观点认为,「𫥮」右侧部件是整体字,应从高到低依次取「月」(冂)、「金」(丷)和尾码「金」(八)。
    反对观点认为,「丷」跨越「冂」的两侧,不能组合成「丷」,否则违反「完整原则」。「从高到低」的规则应在不破坏「完整原则」的情况下使用,而非必须遵循。
    有观点认为,参考「楽」、「𠔜」,此部件中,「一」上方的部份(⿲冫同𡿨)应从左到右取,故应取「戈」(丶)、「一」(㇀)、「金」(八)。
    反对观点认为,「楽」、「𠔜」不能证明「一」上方的部份(⿲冫同𡿨)应从左到右取,《第五代输入法手册》中亦不见此叙述。
    本码表「𫥮」字身取「月金金」,并设兼容码「月戈金」。
    相关讨论见 Issue #17
    列举相关字例如下:

Unicode 汉字 取码
U+2B96E 𫥮 卜山.月金金 / 卜山.月戈金
U+2BBC6 𫯆 月金.土.日竹
  1. 简化字「执」、「纨」右侧「丸」取码
    按字形,简化字「执」末码不能取「戈」,当取「大」。
    《第五代仓颉输入法手册》未收简化字,「汉文库典」取「大弓大」。
    本码表取「大弓大」,容错「大弓戈」。

  2. 「𣎆」、「𦝠」、「𦟀」取码
    《第五代输入法手册》将「𣎆」列为复合字,按规则,独立的「𣎆」当取「卜弓」。但《第五代输入法手册》附录码表未收「𣎆」字。「汉文库典」中,「𣎆」取码「卜女口月弓」。
    本码表兼容两种取码。「𦝠」、「𦟀」同理。

  3. 「靑」取码
    《第五代输入法手册》未收此字。朱邦复工作室《内码对照表》中该字的 1987 版五代取码为「手一月」,「汉文库典」取码「手一月」(即将「円」设为「月」的辅助字形)。
    本码表取「手一月」,容错「手一月中一」。

  4. 「斉」取码
    《第五代输入法手册》未收此字,「汉文库典」取码「卜大中」(其意不明,或有误)。含相同形状的「𠂁」字在「汉文库典」中取码「尸中戈」
    有观点认为「斉」下方的「丿二」,首笔为撇,与「尸」的辅助字形「ㅑ」(首笔为竖)不同,故不能取「尸」,故「斉」宜取「卜大中中一」或「卜大卜人中」。
    有观点认为,《第五代输入法手册》(第43页)提及:「为字形均衡而向左撇的“纵”笔画」取「丨(纵)」,「丿二」的首笔似属此情况。故「丿二」首笔可视作竖,取「尸」。
    本码表取「卜大尸中」。

  5. 「𠥓」、「𠚡」取码(「尸」、「山」新增辅助字形)
    「𠥓」字取码困难,去信官方询问,沈红莲女士建议增加「S」作为「尸」的辅助字形,故「𠥓」取「尸尸」。
    本项目采纳此建议,取「尸尸」。
    「𠚡」、「𧀍」外框同理,取「山山」。
    列举相关字例如下:

Unicode 汉字 取码
U+20953 𠥓 尸尸
U+20967 𠥧 尸尸.一火.口
U+20969 𠥩 尸尸.廿一金
U+2096A 𠥪 尸尸.月.竹难
U+2096B 𠥫 尸尸.竹山.尸
U+2096C 𠥬 尸尸.廿.人难
U+206A1 𠚡 山山.月.竹难
U+2700D 𧀍 山山.山山.土
  1. 包含倒转部件汉字的取码
    「𠄏」、「𰒥」、「𫸪」等字,分别包含「了」、「弓」、「戈」等字旋转或翻转产生的部件。这些部件不常用,取码较困难。
    六代「片」键增设一功能表示「翻转」,如「𠄏」字取码「弓弓片」(先按「了」取码「弓弓」,然后补一「片」表示旋转)。
    本码表采用此方法,适用于下表列出的字。
部件 Unicode 汉字 取码
U+2010F 𠄏 弓弓片
U+221B4 𢆴 女戈.弓弓片
U+221D6 𢇖 女戈.卜山.山 / 女戈.卜山.片
U+2BE2A 𫸪 弓.弓片
U+304A5 𰒥 戈片.戈
U+30C9E 𰲞 卜山.戈片 / 卜弓.戈片
U+20114 𠄔 弓戈弓片
U+28668 𨙨 口日山片
U+286DC 𨛜 口片.口.日山
U+287A0 𨞠 口片.廿金.山
U+287B0 𨞰 口片.竹心.山
U+20432 𠐲 人.戈一.片
U+22A0B 𢨋 戈一.戈口片
U+23028 𣀨 戈片.卜水
U+24489 𤒉 戈一.戈片.火
U+24493 𤒓 戈一.戈片.火
U+27951 𧥑 戈一.戈片.月
U+27E42 𧹂 卜片.月山金
U+2C886 𬢆 卜片.月山山
U+30A07 𰨇 人片.一.一火
U+2E5D9 𮗙 月山.竹山片

为免困扰,暂设定此方法适用范围限于上表列出的部件。

  1. 弯曲笔画的取码
    「𡦹」、「𡆢」等字包含了弯曲的笔画,本码表将此类封闭弯曲、末端交叉的字形一律取为「大」,因此「𡦹」取码为「戈弓.大大」,「𡆢」取「田.大」。
    列举关字例如下:
Unicode 汉字 取码
U+26E57 𦹗 廿.一大.金
U+201C7 𠇇 人.戈手大
U+2034B 𠍋 人.戈大.戈
U+20AB3 𠪳 一田.竹难.大
U+211A2 𡆢 田.大
U+219B9 𡦹 戈弓.大大
U+219D1 𡧑 十.大.大
U+2D047 𭁇 中大.一金
  1. 「㐃」的取码
    《第五代输入法手册》未收此字。「汉文库典」取码「戈中」(即将「△」设为「戈」的辅助字形)。 本码表取「戈中」。「𡉡」字同。

字形兼容

注:基本区、扩展 A 区至扩展 I 区中的传承字设字形兼容,简化字不设字形兼容。若同一字的不同字形在 Unicode 中分开编码,亦不设字形兼容。兼容区、兼容增补区汉字按来源字形编码,不兼容其他字形。

部件 取码 备注
心戈 / 心一
大弓戈 / 大弓大
戶/户/戸 竹尸 / 戈尸 / 一尸 「一尸」仅部份兼容。例外:戶、户、戸
竹水 / 一水
礻/⺬ 戈弓火 / 一一火
中中一中 / 中中一弓
匀/勻 心戈一 / 心一一 例外:匀、勻
(𠬸) 弓水 / 竹尸水 仅限:沒、歿、𤣻、𩑦
人戈弓戈 / 人一尸中
竹水卜 / 竹水戈一
竹十口 / 一十口 按字源从「舌」者兼容两种字形。按字源从「𠯑」或其他,以及未能查证者,仅兼容Unicode Code Chart收录之字形
戈一弓人 / 一一弓人
廿手 / 廿土竹
十月一一 / 十月山女 例外:值、値、惪、悳
吞/呑 一大口 / 竹大口 例外:吞、呑
口竹土 / 口一土
吳/吴/呉 口女弓大 / 口一大 / 口女弓金 「口女弓金」仅部份兼容。例外:吳、吴、呉、俁、俣、娛、娯、娱、悞、悮、𦨳、𦨳、𦨼
日戈尸中 / 竹尸尸中 / 竹心尸中 例外:即、卽、唧、喞
日戈一女山 / 竹尸一女山 / 竹心一女山 例外:既、旣、塈、墍、暨、曁、概、槪、溉、漑
一中月卜 / 一水月
爭/争 月尸木 / 弓尸木 例外:爭、争、凈、净、崢、峥、掙、挣、淨、浄、猙、狰、睜、睁、箏、筝、靜、静
月土口 / 月手口
竹大心 / 一大心
弓竹难 / 竹尸竹难 / 尸竹竹难 按字源从「臽」者兼容三种字形。按字源从其他,以及未能查证者,仅兼容Unicode Code Chart收录之字形
弓大竹卜一 / 弓大竹卜女
竹十竹难 / 一十竹难
俞/兪 人一月弓 / 人一月女 例外:俞、兪、偷、偸、喻、喩、媮、婾、榆、楡
廿金田一 / 金一金田
為/爲 戈大弓火 / 月竹弓火 例外:爲、為、僞、偽、潙、溈、蔿、蒍、𤔡、爳
真/眞 十月山金 / 心月山金 例外:真、眞、填、塡、巔、巓、慎、愼、槙、槇、鎮、鎭、顛、顚、鷏、鷆、𥛺
廿金月廿 / 金一金廿
查/査 木日一 / 木月一 例外:查、査
廿难金 / 竹竹难金 / 金一难金
土尸人大 / 手尸人大
木人弓戈 / 十人弓戈 / 木人竹水 / 十人竹水 在左作字首:十水 / 木水,如「麵」:十水一田中 / 木水一田中
女戈竹戈 / 女戈大
黃/黄 廿一中金 / 廿中田金 例外:黃、黄、橫、横
廿廿口 / 廿土廿口
十廿金卜 / 十廿金一
竹廿竹竹人 / 竹廿人竹人
一山日 / 大山日 仅限:基本区、扩展A区
月山女一中 / 月山女一弓
凡/卂 竹弓戈 / 弓大 按字源从「丮」
弓十 / 弓大(作偏旁時) 按字源从「卂」
𣎆/𦝠 卜弓 / 卜大
尸水竹竹人 / 尸水人人人 / 尸水人竹人
廿金戈日女 / 廿金一日女 / 廿人戈日女 / 廿人一日女 例外:𣝡、𣞼
十手一心 / 十手十心
弓难山 / 竹难山

字形问题

Unicode 汉字 UCS 字形 其他字符集标准字形 说明
U+446E 从「朶」 GB 18030-2000/2005:从「朵」,GB 18030-2022:从「朶」 本码表依 UCS 字形
U+44B3 从「朶」 GB 18030-2000/2005:从「朵」,GB 18030-2022:从「朶」 本码表依 UCS 字形
U+4548 从「片」 GB 18030-2000/2005:从「爿」,GB 18030-2022:从「片」 本码表依 UCS 字形
U+454E 从「日」 GB 18030-2000/2005:从「目」,GB 18030-2022:从「日」 本码表依 UCS 字形
U+4949 从「宀」 GB 18030-2000:从「宀」,GB 18030-2005/2022:从「冖」 本码表依 UCS 字形
U+4A76 从「屮」 GB 18030-2000/2005:从「㞢」,GB 18030-2022:从「屮」 本码表依 UCS 字形
U+6A69 从「几」 GB 18030-2000:从「卂」,GB 18030-2005/2022:从「几」 本码表依 UCS 字形
U+81A5 G源从「末」,H源从「未」 GB 18030-2000/2005:从「末」,GB 18030-2022:从「未」 本码表兼容两种字形
U+20624 𠘤 ⿱凝氷 CNS 11643 明體、楷體:⿰冫⿱疑氷,CNS 11643 宋體:⿱凝氷 本码表依 UCS 字形
U+2278B 𢞋 从「亻」 GB 18030-2005/2022:从「忄」 本码表依 UCS 字形
U+23EE4 𣻤 G源右从「木」,T源右从「水」 CNS 11643:右从「水」 本码表依 UCS G源字形。从「水」的是U+23E73「𣹳」
U+2459B 𤖛 从「且」 GB 18030-2005:从「旦」,GB 18030-2005:从「且」 本码表依 UCS 字形
U+24A8A 𤪊 从「今」 GB 18030-2005/2022:从「令」 本码表依 UCS 字形
U+268B6 𦢶 从「秀」 GB 18030-2005/2022:从「秃」 本码表依 UCS 字形
U+27664 𧙤 从「朶」 GB 18030-2005:从「朵」 本码表依 UCS 字形。从「朵」的是U+2C856「𬡖」
U+2AF5C 𪽜 从「段旁 CNS 11643:从「假旁 本码表依 UCS 字形

排序调整

注:仅记录「一般排序」版本的排序调整,不记录「简化字优先」和「传统汉字优先」版本。

编码 原排序 当前排序 编码 原排序 当前排序 编码 原排序 当前排序
bt 皿冊 冊皿 ib 禸宀 宀禸 rnlb 𠶴𡃴 𡃴𠶴
btis 臓臟 臟臓 ibhaf 鶣鵏 鵏鶣 rki 吰呔 呔吰
cki 鈜鈦 鈦鈜 jj 卄艹廾 艹廾卄 rmmr 跖唔 唔跖
cyiu 鋶銃 銃鋶 jtbu 寛宽 宽寛 rsmg 喔嚁哐 喔哐嚁
dnin 栘杼 杼栘 juln 剜剋 剋剜 tbhu 苋藐 藐苋
dpi 杓构 构杓 kbnl 郗郁 郁郗 tbli 萤繭 繭萤
eafc 灦灝 灝灦 kdln 剎刹 刹剎 tbmbc 顜顢 顢顜
ebhu 观沉 沉观 lnhe 衱版 版衱 thoo 蓯蓗蓰蓏 蓯蓰蓏蓗
ebug 灈濉 濉灈 mbpym 鹂鹝鸸 鹂鸸鹝 thvi 蘶茋 茋蘶
edlo 濑漱 漱濑 nem 亟丞 丞亟 tjmn 靪苧 苧靪
ee 汉双 双汉 mfbuu 覔覝視 視覔覝 tjmu 靰莞 莞靰
ea 汨沓汩 沓汨汩 mgmvn 珁甄 甄珁 tlq 茟羋 羋茟
ehbt 洫盪 盪洫 mkp 忝憨懕恐 憨忝恐懕 tvii 兹茲 茲兹
eitc 瀇濂 濂瀇 mre 砅泵 泵砅 tmwf 蔈蘸 蘸蔈
elmo 洮溃 溃洮 mrnl 郚酃 酃郚 tog 萑茌 茌萑
esmg 濯洭渥 渥濯洭 no 欠久 久欠 tw 苗曲 曲苗
fbok 敝敞 敞敝 nvlmi 蜑蚀 蚀蜑 uwjr 崓崮 崮崓
fduce 糭糉 糉糭 oihp 飥侂 侂飥 tyrv 蘘藹 藹蘘
ffbf 爣熒 熒爣 ol 个仲 仲个 vfnau 絶絻 絻絶
foir 熗焓 焓熗 olok 攸倏 倏攸 vis 妒幻 幻妒
gfhne 鷇縠 縠鷇 opnri 镵镪 镪镵 vmbb 嬬绷 绷嬬
gkq 摮摯 摯摮 opu 岱伅钆 岱钆伅 vmi 纩戕 戕纩
gycb 墑墒 墒墑 opyiu 锍铳 铳锍 ybr 啻迥 迥啻
hahaj 皡皞 皞皡 ormbc 頜頷 頷頜 yrbn 亮亭 亭亮
hhdn 筣簃 簃筣 punl 鄒邨 邨鄒
hkp 忝懲 懲忝 qhsk 撽捩 捩撽
hlmo 筄篑 篑筄 qklmi 螯蛰 蛰螯
hjsmm 翺翱 翱翺 qybb 揥撾 撾揥
hqr 筘吿 吿筘 rhsk 噭唳 唳噭
hwhaf 鷭鶹 鶹鷭 rjpu 哓嘧 嘧哓