五笔自学教程 第十节合体字的输入
凡是“字根总表”上没有的汉字,也即“键外字”,都可以认为是由字根和笔画拼合而成的,这类字我们]称之为“合体字”。
一、合体字的取码规则
1.规范笔顺
“合体字”的编码,一般情况下,要按照正确的书写顺序进行。
例如:新:立木斤 (笔顺正确)
立斤木 (笔顺错误)
中:口 丨 (笔顺正确)
丨 口 (笔顺错误)
2.取大优先
要以“再增添一个笔画,便不能构成笔画更多的字根”为限度,拆取“笔画尽可能多”的结构作为字根,这叫做“取大优先”。
例如:失:
人 (正确)
大 (错误,因“大”的横笔,应当尽量向前凑,使“
”成为笔画更多的“
”)
建:
二丨 廴 (正确)
一 十 廴 (错误,因“十”的横笔可以向前凑,使“一”成为笔画更多的“二” )
注:“取大优先”,俗称“尽量往前凑”,是在拆分汉字时,最常用到、使拆分具有唯一性的基本规则。离开这一规则,必然使一个字有许多种拆法,使编码缺乏唯一性。
例如:夷,按规范笔顺和取大优先只能拆成“一弓人”,因“弓”的第一笔添不到“一”上,“人”的第一笔也添不到“弓”上,所以拆成“一弓人”已经是“尽可能往前凑”了。另外,“夷”如拆成“大弓”,显然又违背了规范笔顺,固不可取。
3.兼顾直观
在编码时,为了使字根特征明显易辨,有时就要暂时牺牲“书写顺序”和“取大优先”的原则,形成极个别例外的情况。
例:“国”字,按“书写顺序”,其字根应是:“冂王、一”,但这样编码,不但有悖于该字的字源,也不能使字根“口”直观易辨。我们只好违背“书写顺序”,按“囗王、”的顺序编码。
同样的例子又如:
自: 丿目 (正确,似乎没有“取大优先”,但直观性很好。
亻
三 (错误,虽“取大优先”,但缺乏直观,且又太散。)
4.能连不交
请看以下取码实例:
天: 一 大 (正确,“一”与“大” 是相连接的关系,比较直观。)
二 人 (错误,“二”与“人” 交叉在一起了)
生:丿王(正确,“丿”与“主”是相连的,被认为优先。)
土(错误,“”与“土”是交叉的,此处不可取。)
般来说,“连”比“交”更为“直观”,更能显现字根的笔画结构特征,更易于辨认。所以,当有几种取码可能性时,“连”的应比“交”的优先。
5.能散不连
有时候,一个汉字的几个字根,都不是单笔画,这些字根之间的关系,常常在散”和“连”之间模棱两可。如: 占:卜 口。
两个字根按“连”处理,便是杂合型(3型)字,如按“散”处理,便是上下型(2型)字。如: 矢
大。
两个字根按“连”处理,“矢”便是杂合型(3型)字;两个字根如果按“散”处理,“矢”便是上下型(2型)字。如:午
十。
都是既可“连”,又可“散”的关系。
当遇到这种既能“散”,又能“连”的情况时,我们规定:只要不是单笔画,一律按“能散不连”判别,即优先确定为“散”的关系,叫做“能散不连”。
按“能散不连”的拆分规则判别,以上两例中的“占”和“矢”,都被认为是“上下型”(2型)字编码,而不作为独体或杂合型(3型)。