分众分类法由用户创建,并在用户之间共享。“Folksonomy”是一个创造词,由T.V.沃首次提出,由“folks”(一群人、一伙人)和“taxonomy”(分类法)两个词合成,沃进一步把分众分类法分为宽分众分类法和窄分众分类法。
分众分类法
由用户提供的社会化标签构成的,结构扁平、缺乏词汇控制的Web2.0资源的分类系统。又称大众分类法、社会分类法。
- 英文名称
- folksonomy
- 所属学科
- 图书馆学
- 又称
- 大众分类法、社会分类法
构成分众分类法的基本元素是标签(tags)。美味书签(Del.icio.us)是最早使用社会化标签组织资源的网站。它是一个社会化网页收藏夹,用户在收藏自己感兴趣的网站或网页时为其创建标签,这些标签在用户之间共享,形成了所有网页资源的分众分类。随着Web2.0应用的发展,社会化标签和分众分类法被广泛应用于图书、博客、新闻、图片、视频等诸多资源的组织和检索中。在图书馆领域,美国宾夕法尼亚大学图书馆的PennTags项目首先将标签和分众分类应用于馆藏,作为受控词表的补充,但该项目已停止维护。美国社会化书目服务网Library Thing通过标签和分众分类法,由用户组织和共享书目数据,拥有一定数量的用户群。国内的豆瓣网通过标签来组织图书、音乐、电影等多重类型的资源。
分众分类法反映的是用户而不是资源创建者的信息组织思路。分众分类法的标签由用户个人自发定义,自由灵活、共建共享是其突出的特点。信息资源所采用的标签由用户群体定义的频率来决定,例如豆瓣网在图书元数据中展示的“成员常用的标签”便是用户群为该图书提供的标签中频次最高的一部分。分众分类法动态更新,能迅速反映信息资源的变化情况,使用频率低的标签逐渐淡出,使用频率高的标签可以帮助用户发现当前的热点和趋势。
分众分类法结构扁平,缺乏词汇控制,因而很难使用它揭示复杂的词间关系。与经过严格选词、词形控制和词间关系控制的受控词表相比,标签在表达概念时缺乏语义的精确性。一词多义、同义词等情况未经处理,甚至存在同一词语的大小写、单复数形式被视作不同标签的情况。同时,分众分类法没有等级结构,标签与标签之间不存在词表中常见的上下位关系。由于用户标签五花八门,可能会产生“噪声”(例如供个人完成任务使用的“私有”标签),降低资源描述的准确性。
有研究和应用结合分众分类法和受控词表,将标签作为受控词表的入口词,或在分众分类法中引入部分词汇控制(如Library Thing的标签进行了词形控制),集合两者的优点对信息资源进行组织和检索。