词云最初广泛应用于基于Web2.0的网站和博客,主要用来对关键词元数据的频率分布进行可视化、对网站内容进行描述,是一种导航辅助工具。词云的可视化形式最初广泛应用于在以社区为导向的网站(如Flickr、Delicious或Technorati)中使用标签作为索引方法,后发展成为信息可视化的核心技术,应用于许多不同的环境中。词云技术也处于不断发展的过程,如词云布局形式由最早的逐行式发展到螺旋式、紧凑式,再到可结合边界形状进行布局,如微软研究院对词云增加了时间的因素,分析了随时间变化的各个状态的词云。
词云的核心在于使用不同的大小、颜色、位置、形状展示不同类别的内容的重要性。作为一种可视化的方式,词云可以达到非常高效的传播效率。依据可视化的空间维度,词云主要是二维的平面可视化,但是也有以球面即三维的形式展示词云的应用案例。词云有一类特别的应用是标签云。互联网上的用户生成内容,例如用户上传的照片,往往会伴随着一些用户所添加的标签(Tags)。标签主要起到对内容分类的功能,而每一类标签对应不同数量的内容。使用词云的形式可以展现每一类内容的规模。
针对词云的研究主要有:①分析词云的有效性和视觉感知;②对词云可视化进行改进和扩展;③使用词云作为其组成部分的文本分析系统。词云不仅用于展示标签,也多用于呈现文本的关键词语,以帮助人们简明扼要地了解文本的大体内容。作为信息可视化的一种核心技术,它被应用于许多不同的环境中。例如在新闻媒体竞争越发激烈的背景下,词云为很多媒体所应用,使得内容表达的形式更为简明、直观,加强媒体和受众的互动。同时它也被用于提炼并展示网络中用户生成内容,包括网络用户的博文、评论、共享的知识等。