苏联数学家O.S.库拉金娜(Olga Sergeevna Kulagina)在研究机器翻译的实践中,采用集合论方法来描述语言的某些基本概念,提出了语言的集合论模型。罗马尼亚数学家S.马尔库斯(S. Marcus)在库拉金娜工作的基础上,进一步提出了语法性的数学模型,使语言的集合论模型更加丰富和完善。
语言的集合论模型有三个初始概念——词、成立的句子、域。
①词:元素的有限集合
,其中,元素
被称作词。
②成立的句子:元素的任何一个有限的有序序列,被称作句子,记作
。
句子的一切集合分为两个子集:“成立的句子”的子集和“不成立的句子”的子集。凡是在形式上正确的句子,都叫作成立的句子。所谓形式上正确,是指语法上正确,而不是指意义上正确。例如,在英语中,不仅“He is here.”(他在这儿。)和“Tired old tigers pace restlessly.”(一些疲倦的老虎不安地踱着。)是成立的句子,就是“*the dog is open”(*狗开着。)和“*the book has two children”(*书有两个孩子。)这样的在语法上正确而在语义上不相容的句子,也是成立的。但是,“*those dog am barking”(*那些狗在吠叫。)和“*he have two children”(*他有两个孩子)则是不成立的句子,因为它们在语法上不正确(具体原因为单复数的不一致)。
成立的句子的集合,记作。
③域:某一个词的完整的形式系统,即某一个词的词形变化的全部形式的集合,叫作这个词的域(окретность)。例如,对于名词“dog”(狗),有“dog”(单数形式)和“dogs”(复数形式),它们构成了“dog”的一个域;对于动词“learn”(学习),有“learn”(动词原形)、“learns”(第三人称单数形式)、“learned”(过去式)和“learning”(进行式或者现在分词),它们构成了词“learn”的一个域。词的域,记作
。
词、成立的句子、域这三个概念都不能在模型中定义,它们是从外部提出来的。