这一原则建立在“成分识别域”(constitute recognized domain, 简称CRD)概念基础上。CRD是指需要理解或识别一个句法结构的界限或范围。一个短语或句子的成分识别域越小,这个短语或句子就越容易加工。在一个识别区域内,两个直接成分之间的距离越短,这两个直接成分的关系也越容易确立。相反,如果两个直接成分之间的距离越远,则越难以加工。因此,相对说话人而言,尽量将两个直接成分的距离靠近,方便自己也方便听话人。这就是所谓的直接成分尽早识别原则。例如下面的例子:
①IVP[gaveNP[the valuable book that was extremely difficult to find]PP[to Mary]]
(我送了那本很难找到的很有价值的书给玛丽。)
①中动词gave(“送”)与to Mary(“给玛丽”)之间是直接成分关系,但是二者之间隔了9个成分(加上动词和介词总共11个成分),在动词“gave”出现之后需经过9个词语之后才等到“to Mary”出现,因此记忆负担较重,加工难度较高。这个加工效率可以通过直接成分的数量与构成这些直接成分的词语的总数的比例来计算。上例动词gave(“送”)有两个直接成分,一个是book(“书”),还有一个Mary(“玛丽”),共有三个直接成分,这三个直接成分由11个词语组成。用直接成分的数量除以单词的数量,就可以得到这个句子的加工效率:3/11=27.27%。但是,如果将上面句子的结构转换成下面的例子:
②IVP[gavePP[to Mary]NP[the valuable book that was extremely difficult to find]]
(我送给玛丽的那本书很有价值很难找到。)
②同样有3个直接成分但处理距离只有4个词语,用同样的计算方法,处理效率为3/4=75%。因此②的处理效率比①高。由于②结构更容易加工处理,因此也容易受到说话人和听话人的偏好,因此在人类语言中较为普遍。
霍金斯的直接成分尽早识别原则可以用来解释人类语言语序类型中的优势结构。在测量人类语言语序类型的三个最重要的成分S、O、V中,假定其中的S和O都带修饰成分,那么直接成分尽早识别原则对语序的选择机制就会显现出来。霍金斯根据美国俄勒冈大学语言学家R.S.汤姆林的语言样本进行统计和计算,在总共217个VO语言中有SVO、VSO、VOS三种基本语序,计算它们直接成分与词的比率,得到的结果是,SVO语序组合直接成分与词的比率最高,心理加工效率最高,SVO、VSO、VOS三种语序分别依次为:84%、75%、70%。VOS直接成分与词的比率最低。因此SVO语序是在VO语言中被采用数量最多的语言,为168(占77%),而VSO语序的语言为37(占17%),VOS的语言为12(占6%)。
用同样的方法来计算OV语序的三种组合SOV、OVS、OSV,也根据S和O都带有修饰语的样本统计,得到的结果是:SOV语序直接成分与词的比率为84%,OVS的比率为70%,OSV的比率为45%。185种实际语言样本中,采用SOV语序的语言为180种,占97%;OVS语序的语言只有5种,占3%,而OSV语序的语言为0。因此,在OV型语言中,最多的是SOV,其次是OVS,最后是OSV(几乎不存在)。