术语变体有形态变体(morphological variation)、句法变体(syntactic variation)、语义变体(semantic variation)、扩展变体(expanded variation)4类。
形态变体即有形态变化或派生关系的术语变体。例如,在英语中,“measure”(测量)和“measurement”(测量)有形态上的联系,“measurement”是“measure”加后缀“-ment”构成的,“measure”和“measurement”之间有派生关系,它们是术语的形态变体;“cell”(细胞)和“cells”(“细胞”的复数形式)之间也有形态上的联系(一个是单数形式,一个是复数形式),也是术语的形态变体。类似的还有,“analysis method-analytic method-analytical method”(分析方法),“cell component-cellular component”(细胞成分),“cell differentiation-cellular differentiation”(细胞分化),“formula-formulae”(公式),“accuracy-accuracies”(精确度)都是术语的形态变体。
句法变体即与句法结构有关的术语变体。例如,在英语中,“comprehension of language”是“language comprehension”(语言理解)的句法变体,前者的句法结构是N+of+N(名词+表示从属关系的介词of+名词),而后者的句法结构是N+N。类似的还有,“disease of the abdomen-abdominal disease”(急腹症),“fraction of cell-cells of fractions”(细胞分离),“thresholds of perception-perception thresholds”(感知阈限),“autoimmune disease-disease with autoimmune”(自身免疫疾病)也都是术语的句法变体。
语义变体即有语义联系的术语变体。例如,英语中,“speech comprehension ”(口语理解)是“language comprehension”(语言理解)的 语义变体,因为“speech”(口语)和“language”(语言)有语义上的联系,它们是近义术语。类似的,“response rate-reaction rate”(反应速度),“anterior part-anterior segment”(前部)也都是术语的语义变体。
扩展变体即由基本术语扩展而成的术语。术语扩展的手段有修饰、并列、结构转换等。术语经过扩展之后,其含义可能会发生变化,但是,在术语的自动发现中,这种扩展术语与基本术语有密切的联系,对于自动发现具有参考价值,仍然应当是术语发现研究的对象。例如,在英语中,“abnormal chromosome”(非正常染色体)通过在“chromosome”前面附加修饰语X扩展而成的“abnormal X chromosome”(非正常X染色体)就是术语“abnormal chromosome”的扩展变体;“axillary vein”(腋静脉)通过在“vein”的前面并列“artery and”的方式扩展而成的“axillary artery and vein”(腋动脉和腋静脉)就是术语“axillary vein”的扩展变体;“isolated cell”(离体细胞)通过结构转换之后成为句子“cells were isolated”(细胞离体了),这个句子与术语“isolated cell”有密切的联系 ,对于术语的自动发现有价值,也可以看成是术语“isolated cell”的扩展变体。类似的还有,“benign neoplasm”(良性赘生物 )-“neoplasm were benign”(赘生物是良性的),“hypothesis test”(假设检验)-“test this hypothesis”(检验这个假设)也都可以看成是术语的扩展变体。
在术语的自动发现和自动识别中,处理好变体才能提高系统的结果召回率。