首页 . 管理学 . 情报学 . 信息组织 . 【文献信息组织】

主题检索语言

/subject retrieval language/
条目作者曹树金

曹树金

最后更新 2023-12-16
浏览 371
最后更新 2023-12-16
浏览 371
0 意见反馈 条目引用

将自然语言中的词语规范化后作为揭示信息资源内容主题的语词标识,用于信息资源组织和检索的情报检索语言。又称主题法、主题语言。

英文名称
subject retrieval language
又称
主题法、主题语言
所属学科
情报学

主题是直接概括信息资源内容的概念,通常是信息资源具体论述的对象和研究的问题。用来表达信息资源内容主题的词称为主题词。主题词不同于自然语言的语词,它是将自然语言中的词经过人工规范后的语词,即经过词汇控制的语词。主题检索语言以语词作为检索标识,按字顺排列,直观性强,提供了一种直接面向具体对象、事实或概念的信息组织方法和信息检索途径。

主题法的类型可以有许多不同的划分,按照选词方法,可以分为标题法、元词法、叙词法、关键词法、分类主题一体化语言等;按照主题使用时组配的先后顺序,可以分为先组定组式主题法、先组散组式主题法和后组式主题法;按照使用时是否对主题词进行控制,可以分为受控主题法与非受控主题法。

是一种以标题词作为主题标识、以词表预先确定的组配方式标引和检索信息资源的主题法。所谓标题词,是指经过词汇控制,用来标引信息资源主题的词或词组,通常为比较定型的名词术语。世界上使用较为广泛的标题词表是《美国国会图书馆标题表》。标题法除了直接选取自然语言的单词和词组作为标题标识外,还采用其他一些标题形式。标题法主要通过设置参照的方式对标题词之间的联系进行揭示。标题词之间的关系主要有等同关系、等级关系和相关关系。等同关系揭示标题词与非标题词之间的关系;等级关系和相关关系都揭示标题词之间的关系。作为传统的主题法类型,标题法开创了主题法的最初形式,探索了标题法词汇控制的一系列方法,如制定了标题选择和确定准则、标题形式、标题之间关系的揭示、标题标引过程中组配方法的使用等,为主题法的发展奠定了坚实的基础。

随着现代信息资源数量的剧增,标题法作为一种列举式主题法类型,已经无法满足信息资源标引和检索的需要。元词法就是为了克服标题法的不足而发展起来的一种主题法类型,它是以元词作为主题标识,通过字面组配的方式表达信息资源主题的主题法。元词是指用来标引信息资源主题的、最基本的、字面上不能再分的语词。元词法是后组式主题法,在使用元词法的情况下,对复合主题资源的标引和检索都是通过元词的组配进行的。正是因为元词法是后组式的,所以它只适用于标识单元方式检索系统。因此元词法检索系统必须由两个部分组成:元词卡部分和文献题录卡或文摘卡部分。虽然元词法存在直接性差、不适宜查找基本主题的信息资源等问题,已经基本被叙词法所取代,但是元词法率先探索了后组式检索方法,元词法使用的反记法是机械检索系统中倒排档的先声,后来为叙词法等主题类型所采用。此外,元词法还探索了后组式检索中的规律和问题,包括联号、职号等辅助符号使用方法及对各种检索系统的适应性,为叙词法的发展和使用开辟了道路。

是以从自然语言中精选出来的、经过颜色控制的语词为信息资源的主题标识,通过概念组配方式表达信息资源主题的主题法类型。叙词是经过规范化处理的、以基本概念为基础的表达信息资源主题的词或词组。叙词语言是受控主题语言的主流。截至21世纪10年代,国外的叙词表不少于千种,国内也超过130种,中国使用最广泛的叙词表是《汉语主题词表》。叙词法集多种检索语言的优点于一身,是多种检索语言的原理和方法的综合,使其成为一种具备优异性能的现代检索语言。

是一种以关键词作检索词的主题检索语言。关键词是指那些出现在文献中,对表征文献主题内容具有实质意义的语词,即对揭示和描述文献主题老说是重要的、带关键性的语词。关键词法将关键词不加规范或只作极少量的规范化处理,按字顺排列,提供检索途径。

分类法与主题法的有机结合就是分类主题一体化。分类主题一体化是一种实现了分类语言和主题语言兼容互换的系统,即一个分类系统与一个主题系统实现完全兼容,有机地融合为一个整体,既能充分发挥各自独特的功能,又能通过配合发挥最佳的整体效应。

是指复杂主题的标识,在词表中就已经组配好了,使用时可以直接从词表的标识中选取。标题法就属于这一类型。

在词表中未组配好,而是在标引阶段根据信息资源的主题需要进行组配的。采用叙词表在标引阶段建立标题,就属于这一类型。

用户检索前,主题系统中的主题词是单立的,检索时才根据检索需要进行组配。元词法、叙词法就属于这一类型。

是依据特定主题词表揭示信息资源的组织方法。如标题法、叙词法等均属于这一类型。它们的共同特点是标引和检索均依据选定的主题词表对主题概念进行转换,从而可以通过词表对信息资源内容的规范表达和相互关系的揭示来改进检索效果。

即自然语言主题法,是一种直接应用文献或用户使用的自然语言语词进行检索的方法。这种方式包括关键词法、自然语言文本检索等。

主题检索语言是一种从内容角度标引和检索信息的方法,以事物为中心的直接性是主题检索语言的最主要特点。其他特点为:

主题检索语言打破了类目或者职能体系的限制,主要采用一些在检索中使用频率较高的语义相关、概念等级相关和族系相关的名词术语,或者概念明确、形式固定、专指性强的术语,专称和词组对档案文献的内容进行高度概括,从而达到标引和检索的目的。主题检索语言是以语言为基础的,语言表达的多样性和灵活性,决定了主题检索语言在表达文献内容方面的灵活性。

由于主题检索语言是用自然语言来标识的,不必像分类检索语言那样转换成代码,而且所选用的名词术语、专称、词组等大多数都直观易懂,对于部分从字面上不易理解的主题词,在主题表中对其含义进行了简要注释,因此即使是对于毫无专业知识的人来说,也能十分顺利地应用主题检索语言来检索出自己所需的信息。

在应用主题检索语言过程中,可以选用主题表中两个或两个以上的正式主题词进行组合搭配,在词与词之间建立起语义关系或逻辑关系,从而产生一个复合式的具有特定含义的新概念,以表达用单个主题词难以表达的特殊主题。它不仅可以用数量有限的正式主题词,在一定范围内扩大检索空间,提供变化多端、精细、准确的检索途径,而且经过词素轮排后,所有独立词都可作为查词入口,大大增加了检索途径,从而为多元检索创造了条件。

主题词表是文献与情报检索中用以标引主题的一种检索工具,是一些规范化的、有组织的、体现主题内容的、已定义的名词术语的集合体。由主表、类目表、族性表、轮排表、多种语言对照表、特殊词汇表、语法语义关系表、主题词字顺表及主题词属分关系的词族表等构成。世界常用主题词表有:①《美国国会图书馆标题表》。该表是世界上最具影响力的一部标题表,是美国国会图书馆在编目实践的基础上编制而成的。②《汉语主题词表》。该表是由原中国科学技术情报研究所和原北京图书馆主持编制,1980年出版的大型综合性主题词表。③《社会科学检索词表》。该表是中国社会科学文献信息中心编制的一部供社会科学文献资源标引和检索的词表。④《中国分类主题词表》。该表是在《中国图书馆分类法》类目与《汉语主题词表》主题词的基础上,将分类法与主题法相结合编制成的一体化主题词表。

  • 叶继元.信息组织. 2版.北京:电子工业出版社,2015.
  • 司莉.信息组织原理与方法.武汉:武汉大学出版社,2011.

相关条目

阅读历史

    意见反馈

    提 交

    感谢您的反馈

    我们会尽快处理您的反馈!
    您可以进入个人中心的反馈栏目查看反馈详情。
    谢谢!