首页 . 文学 . 语言文字 . 计算语言学及语料库语言学 . 计算语言学 . 书面汉语自动切词

插入测定法

/insertion test approach/
条目作者冯志伟

冯志伟

最后更新 2022-01-20
浏览 165
最后更新 2022-01-20
浏览 165
0 意见反馈 条目引用

在确定书面汉语切分单位时,用特定的自由语素(如“的”)插入待测定的结构中,从而判定某一结构是词组还是合成词的一种方法,如果能插入而不改变该结构的意义,则可以判定该结构为词组;反之则为合成词。

英文名称
insertion test approach
所属学科
语言文字

语言学中的“词汇完整性假设”指出,句法规则不能影响到词汇内部的任何成分。在插入测定法中,把特定的自由语素插入待测的结构中,实际上是通过插入这种方法来观察句法规则能否影响到待测结构的内部,如果不能插入,则说明句法结构不能影响到待测结构的内部,从而判定待测结构是合成词而不是词组。所以插入测定法实际上就是利用词汇完整性假设,根据词汇的可拆性来区别合成词与词组的一种方法。

“形+名”的偏正结构,其切分的分合问题,可以用插入测定法来确定。

①“形”(单音节)+“名”(单音节)。“新鞋”中插入特定的自由语素“的”,形成“新的鞋”,意义没变,可判定“新鞋”为词组,不是合成词,应切分为“新/鞋”。同理,“小床”应切分为“小/床”“白花”应切分为“白/花”。“白菜” 中插入特定的自由语素“的”,形成的“白的菜”,其意义与“白菜”不同,可判定“白菜”不是词组,而是合成词,不能切分。同理,“红花”(一种药材) “苦瓜”“红茶”“红旗”也不能切分。

②“形”(单音节)+“名”(双音节)。“白砂糖”中插入“的”,形成“白的砂糖”,意义没有改变,可判定“白砂糖”为词组,应切分为“白/砂糖”。同理,“甜点心”应切分为“甜/点心”“香橡皮”应切分为“香/橡皮”。“小媳妇”中插入特定的自由语素“的”,形成“小的媳妇”,其意义与“小媳妇”不同,可判定“小媳妇”不是词组,而是合成词,不能切分。同理,“老姑娘”“老革命”“高帽儿”也不能切分。

③“形”(双音节)+“名”(单音节)。“贫困县”中插入“的”,形成“贫困的县”,意义没有改变,可判定“贫困县”为词组,应切分为“贫困/县”。同理,“富裕村”应切分为“富裕/村”“先进队”应切分为“先进/队”。“美丽岛”中插入“的”,形成“美丽的岛”,其意义与“美丽岛”(一个地名)不同,可判定“美丽岛”不是词组,而是合成词,不能切分。同理,“牡丹江”“横断山”“橄榄绿”(一种颜色)也不能切分。

插入测定法比较客观,适用范围比较广,但是,有时也会得出一些不合常识的结论。例如,北京话中可以说“鸡”,不可以说“鸭”,而要说成“鸭子”。如果用插入自由语素“的”的方法来测定“鸡蛋”和“鸭蛋”“鸡蛋”可以改说成“鸡的蛋”“鸭蛋”不可以改说成“鸭的蛋”,于是得出结论:“鸡蛋”是词组,“鸭蛋”是合成词,这种结论与人们的语感相差太大。事实上,人们普遍认为“鸡蛋”和“鸭蛋”都不是词组,而是合成词。所以,使用插入测定法时要考虑到各种复杂情况。

除了插入“的”之外,还可以插入其他成分来确定切分单位。在自动切分中,可以使用插入“得”或“不”的方法来确定某些述补结构的分合问题。某些由动词加动词或动词加形容词构成的述补结构,它们的分合常常难以确定。使用插入测定法时,可以规定,双音节的述补结构中间,如果可以插入“得”或“不”,则一般应予切分。例如,“走到”可以插入“得”或“不”:“走/得/到,走/不/到”,因此,“走到”应切分为“走/到”。如果述补结构中间不能插入“得”或“不”,则不能切分。例如,“鼓动,揭露,震动,加深,毁坏”。在有“得”或“不”的述补结构中,如果去掉“得”或“不”后,前后两个字不构成一个词的,则不能切分。例如,“来得及/来不及”“对得起/对不起”“说得过去/说不过去”“了不起”。

相关条目

阅读历史

    意见反馈

    提 交

    感谢您的反馈

    我们会尽快处理您的反馈!
    您可以进入个人中心的反馈栏目查看反馈详情。
    谢谢!