Skip to content

Latest commit

 

History

History
296 lines (268 loc) · 18.8 KB

change_summary.md

File metadata and controls

296 lines (268 loc) · 18.8 KB

主要改碼說明及爭議取碼

  1. 「冎」取碼
    根據漢文庫典及沈紅蓮女士的回信(二),「冎」的上部是輔助字形,故「冎」取「月月」。

  2. 「軣」取碼
    根據沈紅蓮女士的回信(一),「軣」取「十十金金」。列舉相關字例如下:

Unicode 漢字 取碼
U+43EE 月.大尸.金
U+5841 田.金.金土
U+6442 手.尸十.金
U+6E0B 水.卜一.金
U+7582 田.金.金一
U+8EE3 十十.金.金
U+2B753 𫝓 十.大尸.金
U+2D0F2 𭃲 水金.中.弓
U+2DD11 𭴑 火.金.金
U+2DF89 𭾉 中田.金.金廿
U+2E42A 𮐪 廿.口.金木
U+2E4FC 𮓼 中戈.金.金
U+2E6CE 𮛎 口人.金.金
  1. 「参」取碼
    有觀點認為:根據規則,「参」應當視為上中下三分字:字首為「厶」,次字首為「大」,次字身為「彡」。當前未發現倉頡輸入法的任何規則或理論支持將「⿱厶大」視作字首,故「参」字應當取碼「戈大竹竹」。
    在官方碼表中,「参」字均取碼「戈大竹竹竹」。
    目前流行的輸入法軟件中,「参」字多取「戈大竹竹竹」。
    故本碼表跟從官方碼表取「戈大竹竹竹」。
    相關字:叁参奙貵軬𫊲 等

  2. 「春舂秦冬各备夅夆帝登」作字首(次字首)的取碼
    在官方碼表中,分割字首字身時,若遇「春舂秦冬各备夅夆帝登」,則將「春舂秦冬各备夅夆帝登」整體視作字首取碼(唯「䆐」字例外,取「手大竹木木」)。
    例如:「蠢」取「手日中戈戈」而非「手大日中戈」,「凳」取「弓廿竹弓」而非「弓人一口弓」。
    有觀點認為此取法不符合倉頡的取碼規則,「蠢」應取「手大日中戈」,「凳」應取「弓人一口弓」,否則與「盆」(金尸竹廿)、「奮」(大人土田)等字取碼矛盾。
    有觀點認為此取法與其他含「𡗗夂癶」的字取碼規則不統一,因「癹」官方取碼「弓人竹弓水」而非「弓弓水」,「𠒏」取「手大一一山」而非「手一一山」(等等)。
    本碼表兼容兩種取碼。

  3. 「韲」上方部件取碼
    《第五代倉頡輸入法手冊》將「齊」列作難字,取「卜難」,書附碼表中將「𪗇」形字的「齊」視作字首。
    「漢文庫典」中,「韲」字取「卜難中尸一」,將「韲」的上部(齊頭)視作字首,取碼「卜難」。
    本碼表依官方取碼,將「齊」和「韲」的上部(齊頭)視為難字,均取碼「卜難」。
    列舉相關字例如下:

Unicode 漢字 取碼
U+4421 卜難.人月人
U+97F2 卜難.中尸一
U+9F4A 卜難
U+20188 𠆈 卜難.月.女
U+20197 𠆗 卜難.人.一口
U+2019C 𠆜 卜難.十中.女
U+20397 𠎗 人.卜難.中
U+21141 𡅁 口.卜難.木
U+2405C 𤁜 水.卜難.手
U+26803 𦠃 卜難.中.月中
U+26815 𦠕 卜難.口.人月
U+2698F 𦦏 卜難.竹難
U+27DD4 𧷔 卜難.月山金
U+2889E 𨢞 卜難.一金田
U+28F3B 𨼻 弓中.卜難.女
U+29410 𩐐 卜難.一.一一
U+29413 𩐓 卜難.土中一
U+29766 𩝦 卜難.人.戈女
U+29E75 𩹵 卜難.中.弓中
U+2A509 𪔉 卜難.月山.中 / 卜難.月山.弓
U+2A5CE 𪗎 卜難.竹弓.金
U+2A5D0 𪗐 卜難.田.金日
U+2A654 𪙔 卜難.卜一.山
U+2A68E 𪚎 卜難.卜山.山
U+2CE72 𬹲 卜難.田
U+2E2E1 𮋡 卜難.一月中
U+2E530 𮔰 卜難.中一戈
  1. 「鹿」上方部件取碼
    《第五代倉頡輸入法手冊》將「鹿」、「廌」、「慶」字列作難字,屬於取碼「首、難、尾」的類型,分別取碼「戈難心」、「戈難火」、「戈難水」。除此之外,未收錄其他包含「鹿」的上部(鹿頭)的字。
    「漢文庫典」中,「𢉖」字取碼「戈難戈戈」。
    關於難字是否可類推的問題,沈紅蓮女士在回信(二)中提及:「可以加難字,但希望大家有共識,也要考慮重碼問題」。
    考慮官方意見及重碼問題,本碼表將「鹿」的上部(鹿頭)視為難字,取碼「戈難」。「鹿」、「廌」、「慶」三字則維持視作例外字,保持原編碼不變。

  2. 「𫠣」(「拣」右側)的取碼
    「拣」字在「漢文庫典」中取碼「手大女金」,在朱邦復工作室提供的《內碼對照表》中取碼「手大女木」(蒼頡檢字法/六代)。《第五代倉頡輸入法手冊》未收「拣」字。
    有觀點認為「手大女金」、「手女弓木」的「女」多餘,不符合《第五代倉頡輸入法手冊》所述之「精簡原則」,亦與「东」字取碼不保留「女」相悖,故「𫠣」應取「大弓木」。
    本碼表依「漢文庫典」,「𫠣」字取碼「大女尸金」,容錯「大女弓木」。
    相關討論見 Issue #17

  3. 「𫥮」右側部件的取碼
    有觀點認為,「𫥮」右側部件是整體字,應從高到低依次取「月」(冂)、「金」(丷)和尾碼「金」(八)。
    反對觀點認為,「丷」跨越「冂」的兩側,不能組合成「丷」,否則違反「完整原則」。「從高到低」的規則應在不破壞「完整原則」的情況下使用,而非必須遵循。
    有觀點認為,參考「楽」、「𠔜」,此部件中,「一」上方的部份(⿲冫同𡿨)應從左到右取,故應取「戈」(丶)、「一」(㇀)、「金」(八)。
    反對觀點認為,「楽」、「𠔜」不能證明「一」上方的部份(⿲冫同𡿨)應從左到右取,《第五代輸入法手冊》中亦不見此叙述。
    本碼表「𫥮」字身取「月金金」,並設兼容碼「月戈金」。
    相關討論見 Issue #17
    列舉相關字例如下:

Unicode 漢字 取碼
U+2B96E 𫥮 卜山.月金金 / 卜山.月戈金
U+2BBC6 𫯆 月金.土.日竹
  1. 簡化字「执」、「纨」右側「丸」取碼
    按字形,簡化字「执」末碼不能取「戈」,當取「大」。
    《第五代倉頡輸入法手冊》未收簡化字,「漢文庫典」取「大弓大」。
    本碼表取「大弓大」,容錯「大弓戈」。

  2. 「𣎆」、「𦝠」、「𦟀」取碼
    《第五代輸入法手冊》將「𣎆」列為複合字,按規則,獨立的「𣎆」當取「卜弓」。但《第五代輸入法手冊》附錄碼表未收「𣎆」字。「漢文庫典」中,「𣎆」取碼「卜女口月弓」。
    本碼表兼容兩種取碼。「𦝠」、「𦟀」同理。

  3. 「靑」取碼
    《第五代輸入法手冊》未收此字。朱邦復工作室《內碼對照表》中該字的 1987 版五代取碼為「手一月」,「漢文庫典」取碼「手一月」(即將「円」設為「月」的輔助字形)。
    本碼表取「手一月」,容錯「手一月中一」。

  4. 「斉」取碼
    《第五代輸入法手冊》未收此字,「漢文庫典」取碼「卜大中」(其意不明,或有誤)。含相同形狀的「𠂁」字在「漢文庫典」中取碼「尸中戈」
    有觀點認為「斉」下方的「丿二」,首筆為撇,與「尸」的輔助字形「ㅑ」(首筆為竪)不同,故不能取「尸」,故「斉」宜取「卜大中中一」或「卜大卜人中」。
    有觀點認為,《第五代輸入法手冊》(第43頁)提及:「爲字形均衡而向左撇的“縱”筆畫」取「丨(縱)」,「丿二」的首筆似屬此情況。故「丿二」首筆可視作竪,取「尸」。
    本碼表取「卜大尸中」。

  5. 「𠥓」、「𠚡」取碼(「尸」、「山」新增輔助字形)
    「𠥓」字取碼困難,去信官方詢問,沈紅蓮女士建議增加「S」作為「尸」的輔助字形,故「𠥓」取「尸尸」。
    本項目採納此建議,取「尸尸」。
    「𠚡」、「𧀍」外框同理,取「山山」。
    列舉相關字例如下:

Unicode 漢字 取碼
U+20953 𠥓 尸尸
U+20967 𠥧 尸尸.一火.口
U+20969 𠥩 尸尸.廿一金
U+2096A 𠥪 尸尸.月.竹難
U+2096B 𠥫 尸尸.竹山.尸
U+2096C 𠥬 尸尸.廿.人難
U+206A1 𠚡 山山.月.竹難
U+2700D 𧀍 山山.山山.土
  1. 包含倒轉部件漢字的取碼
    「𠄏」、「𰒥」、「𫸪」等字,分別包含「了」、「弓」、「戈」等字旋轉或翻轉產生的部件。這些部件不常用,取碼較困難。
    六代「片」鍵增設一功能表示「翻轉」,如「𠄏」字取碼「弓弓片」(先按「了」取碼「弓弓」,然後補一「片」表示旋轉)。
    本碼表採用此方法,適用於下表列出的字。
部件 Unicode 漢字 取碼
U+2010F 𠄏 弓弓片
U+221B4 𢆴 女戈.弓弓片
U+221D6 𢇖 女戈.卜山.山 / 女戈.卜山.片
U+2BE2A 𫸪 弓.弓片
U+304A5 𰒥 戈片.戈
U+30C9E 𰲞 卜山.戈片 / 卜弓.戈片
U+20114 𠄔 弓戈弓片
U+28668 𨙨 口日山片
U+286DC 𨛜 口片.口.日山
U+287A0 𨞠 口片.廿金.山
U+287B0 𨞰 口片.竹心.山
U+20432 𠐲 人.戈一.片
U+22A0B 𢨋 戈一.戈口片
U+23028 𣀨 戈片.卜水
U+24489 𤒉 戈一.戈片.火
U+24493 𤒓 戈一.戈片.火
U+27951 𧥑 戈一.戈片.月
U+27E42 𧹂 卜片.月山金
U+2C886 𬢆 卜片.月山山
U+30A07 𰨇 人片.一.一火
U+2E5D9 𮗙 月山.竹山片

為免困擾,暫設定此方法適用範圍限於上表列出的部件。

  1. 彎曲筆畫的取碼
    「𡦹」、「𡆢」等字包含了彎曲的筆畫,本碼表將此類封閉彎曲、末端交叉的字形一律取為「大」,因此「𡦹」取碼為「戈弓.大大」,「𡆢」取「田.大」。
    列舉關字例如下:
Unicode 漢字 取碼
U+26E57 𦹗 廿.一大.金
U+201C7 𠇇 人.戈手大
U+2034B 𠍋 人.戈大.戈
U+20AB3 𠪳 一田.竹難.大
U+211A2 𡆢 田.大
U+219B9 𡦹 戈弓.大大
U+219D1 𡧑 十.大.大
U+2D047 𭁇 中大.一金
  1. 「㐃」的取碼
    《第五代輸入法手冊》未收此字。「漢文庫典」取碼「戈中」(即將「△」設為「戈」的輔助字形)。 本碼表取「戈中」。「𡉡」字同。

字形兼容

註:基本區、擴展 A 區至擴展 I 區中的傳承字設字形兼容,簡化字不設字形兼容。若同一字的不同字形在 Unicode 中分開編碼,亦不設字形兼容。兼容區、兼容增補區漢字按來源字形編碼,不兼容其他字形。

部件 取碼 備註
心戈 / 心一
大弓戈 / 大弓大
戶/户/戸 竹尸 / 戈尸 / 一尸 「一尸」僅部份兼容。例外:戶、户、戸
竹水 / 一水
礻/⺬ 戈弓火 / 一一火
中中一中 / 中中一弓
匀/勻 心戈一 / 心一一 例外:匀、勻
(𠬸) 弓水 / 竹尸水 僅限:沒、歿、𤣻、𩑦
人戈弓戈 / 人一尸中
竹水卜 / 竹水戈一
竹十口 / 一十口 按字源从「舌」者兼容兩種字形。按字源从「𠯑」或其他,以及未能查證者,僅兼容Unicode Code Chart收錄之字形
戈一弓人 / 一一弓人
廿手 / 廿土竹
十月一一 / 十月山女 例外:值、値、惪、悳
吞/呑 一大口 / 竹大口 例外:吞、呑
口竹土 / 口一土
吳/吴/呉 口女弓大 / 口一大 / 口女弓金 「口女弓金」僅部份兼容。例外:吳、吴、呉、俁、俣、娛、娯、娱、悞、悮、𦨳、𦨳、𦨼
日戈尸中 / 竹尸尸中 / 竹心尸中 例外:即、卽、唧、喞
日戈一女山 / 竹尸一女山 / 竹心一女山 例外:既、旣、塈、墍、暨、曁、概、槪、溉、漑
一中月卜 / 一水月
爭/争 月尸木 / 弓尸木 例外:爭、争、凈、净、崢、峥、掙、挣、淨、浄、猙、狰、睜、睁、箏、筝、靜、静
月土口 / 月手口
竹大心 / 一大心
弓竹難 / 竹尸竹難 / 尸竹竹難 按字源从「臽」者兼容三種字形。按字源从其他,以及未能查證者,僅兼容Unicode Code Chart收錄之字形
弓大竹卜一 / 弓大竹卜女
竹十竹難 / 一十竹難
俞/兪 人一月弓 / 人一月女 例外:俞、兪、偷、偸、喻、喩、媮、婾、榆、楡
廿金田一 / 金一金田
為/爲 戈大弓火 / 月竹弓火 例外:爲、為、僞、偽、潙、溈、蔿、蒍、𤔡、爳
真/眞 十月山金 / 心月山金 例外:真、眞、填、塡、巔、巓、慎、愼、槙、槇、鎮、鎭、顛、顚、鷏、鷆、𥛺
廿金月廿 / 金一金廿
查/査 木日一 / 木月一 例外:查、査
廿難金 / 竹竹難金 / 金一難金
土尸人大 / 手尸人大
木人弓戈 / 十人弓戈 / 木人竹水 / 十人竹水 在左作字首:十水 / 木水,如「麵」:十水一田中 / 木水一田中
女戈竹戈 / 女戈大
黃/黄 廿一中金 / 廿中田金 例外:黃、黄、橫、横
廿廿口 / 廿土廿口
十廿金卜 / 十廿金一
竹廿竹竹人 / 竹廿人竹人
一山日 / 大山日 僅限:基本區、擴展A區
月山女一中 / 月山女一弓
凡/卂 竹弓戈 / 弓大 按字源从「丮」
弓十 / 弓大(作偏旁時) 按字源从「卂」
𣎆/𦝠 卜弓 / 卜大
尸水竹竹人 / 尸水人人人 / 尸水人竹人
廿金戈日女 / 廿金一日女 / 廿人戈日女 / 廿人一日女 例外:𣝡、𣞼
十手一心 / 十手十心
弓難山 / 竹難山

字形問題

Unicode 漢字 UCS 字形 其他字符集標準字形 說明
U+446E 从「朶」 GB 18030-2000/2005:从「朵」,GB 18030-2022:从「朶」 本碼表依 UCS 字形
U+44B3 从「朶」 GB 18030-2000/2005:从「朵」,GB 18030-2022:从「朶」 本碼表依 UCS 字形
U+4548 从「片」 GB 18030-2000/2005:从「爿」,GB 18030-2022:从「片」 本碼表依 UCS 字形
U+454E 从「日」 GB 18030-2000/2005:从「目」,GB 18030-2022:从「日」 本碼表依 UCS 字形
U+4949 从「宀」 GB 18030-2000:从「宀」,GB 18030-2005/2022:从「冖」 本碼表依 UCS 字形
U+4A76 从「屮」 GB 18030-2000/2005:从「㞢」,GB 18030-2022:从「屮」 本碼表依 UCS 字形
U+6A69 从「几」 GB 18030-2000:从「卂」,GB 18030-2005/2022:从「几」 本碼表依 UCS 字形
U+81A5 G源从「末」,H源从「未」 GB 18030-2000/2005:从「末」,GB 18030-2022:从「未」 本碼表兼容兩種字形
U+20624 𠘤 ⿱凝氷 CNS 11643 明體、楷體:⿰冫⿱疑氷,CNS 11643 宋體:⿱凝氷 本碼表依 UCS 字形
U+2278B 𢞋 从「亻」 GB 18030-2005/2022:从「忄」 本碼表依 UCS 字形
U+23EE4 𣻤 G源右从「木」,T源右从「水」 CNS 11643:右从「水」 本碼表依 UCS G源字形。从「水」的是U+23E73「𣹳」
U+2459B 𤖛 从「且」 GB 18030-2005:从「旦」,GB 18030-2005:从「且」 本碼表依 UCS 字形
U+24A8A 𤪊 从「今」 GB 18030-2005/2022:从「令」 本碼表依 UCS 字形
U+268B6 𦢶 从「秀」 GB 18030-2005/2022:从「秃」 本碼表依 UCS 字形
U+27664 𧙤 从「朶」 GB 18030-2005:从「朵」 本碼表依 UCS 字形。从「朵」的是U+2C856「𬡖」
U+2AF5C 𪽜 从「段旁 CNS 11643:从「假旁 本碼表依 UCS 字形

排序調整

註:僅記錄「一般排序」版本的排序調整,不記錄「簡化字優先」和「傳統漢字優先」版本。

編碼 原排序 當前排序 編碼 原排序 當前排序 編碼 原排序 當前排序
bt 皿冊 冊皿 ib 禸宀 宀禸 rnlb 𠶴𡃴 𡃴𠶴
btis 臓臟 臟臓 ibhaf 鶣鵏 鵏鶣 rki 吰呔 呔吰
cki 鈜鈦 鈦鈜 jj 卄艹廾 艹廾卄 rmmr 跖唔 唔跖
cyiu 鋶銃 銃鋶 jtbu 寛宽 宽寛 rsmg 喔嚁哐 喔哐嚁
dnin 栘杼 杼栘 juln 剜剋 剋剜 tbhu 苋藐 藐苋
dpi 杓构 构杓 kbnl 郗郁 郁郗 tbli 萤繭 繭萤
eafc 灦灝 灝灦 kdln 剎刹 刹剎 tbmbc 顜顢 顢顜
ebhu 观沉 沉观 lnhe 衱版 版衱 thoo 蓯蓗蓰蓏 蓯蓰蓏蓗
ebug 灈濉 濉灈 mbpym 鹂鹝鸸 鹂鸸鹝 thvi 蘶茋 茋蘶
edlo 濑漱 漱濑 nem 亟丞 丞亟 tjmn 靪苧 苧靪
ee 汉双 双汉 mfbuu 覔覝視 視覔覝 tjmu 靰莞 莞靰
ea 汨沓汩 沓汨汩 mgmvn 珁甄 甄珁 tlq 茟羋 羋茟
ehbt 洫盪 盪洫 mkp 忝憨懕恐 憨忝恐懕 tvii 兹茲 茲兹
eitc 瀇濂 濂瀇 mre 砅泵 泵砅 tmwf 蔈蘸 蘸蔈
elmo 洮溃 溃洮 mrnl 郚酃 酃郚 tog 萑茌 茌萑
esmg 濯洭渥 渥濯洭 no 欠久 久欠 tw 苗曲 曲苗
fbok 敝敞 敞敝 nvlmi 蜑蚀 蚀蜑 uwjr 崓崮 崮崓
fduce 糭糉 糉糭 oihp 飥侂 侂飥 tyrv 蘘藹 藹蘘
ffbf 爣熒 熒爣 ol 个仲 仲个 vfnau 絶絻 絻絶
foir 熗焓 焓熗 olok 攸倏 倏攸 vis 妒幻 幻妒
gfhne 鷇縠 縠鷇 opnri 镵镪 镪镵 vmbb 嬬绷 绷嬬
gkq 摮摯 摯摮 opu 岱伅钆 岱钆伅 vmi 纩戕 戕纩
gycb 墑墒 墒墑 opyiu 锍铳 铳锍 ybr 啻迥 迥啻
hahaj 皡皞 皞皡 ormbc 頜頷 頷頜 yrbn 亮亭 亭亮
hhdn 筣簃 簃筣 punl 鄒邨 邨鄒
hkp 忝懲 懲忝 qhsk 撽捩 捩撽
hlmo 筄篑 篑筄 qklmi 螯蛰 蛰螯
hjsmm 翺翱 翱翺 qybb 揥撾 撾揥
hqr 筘吿 吿筘 rhsk 噭唳 唳噭
hwhaf 鷭鶹 鶹鷭 rjpu 哓嘧 嘧哓