2001年,互联网的创始人T.伯纳斯-李指出,语义网可能以超过人类想象的方式改变科学知识的生产和共享过程。2009年,牛津大学动物学系图像生物信息学研究小组的D.肖顿等人首次系统提出了语义出版的概念,并认为语义出版可以增强学术文章的表现形式,通过语义链接和原始数据提供等多种途径,使科研数据和科学文献的整合与获取变得更加容易。
语义出版在出版内容、表现形式和服务方式上有4种特征。①内容结构化。语义出版通过给文章内容添加结构标签和语义标签,将非结构化内容转变为半结构化内容。②对象关联化。语义标引和语义链接可以实现不同领域、不同站点的数字对象之间丰富的、多层次的、关系明确的关联网络。③信息可视化。语义出版强调细粒度知识单元的可视化表现,借助可交互的视觉化数字对象呈现科学知识。④阅读个性化。语义出版不仅关注知识单元之间的关联性,更关注读者与数字内容之间的相关性,可以根据读者需求动态重组内容,满足读者阅读需求。
语义出版系统架构可以分为数据层、业务层、交互层和用户层4个层面。①数据层存储海量的网络化、结构化、半结构化文档与数据。②业务层强调不同粒度的知识单元之间的关联,目标是构建多模态、多粒度、多层次的知识网络。③交互层是内容资源的展示与交互层面,强调根据用户特征和用户需求发布和展示内容资源。④用户层强调识别用户的特征、根据用户画像构建用户兴趣网络,并提供个性化服务。
作为一种新型出版形态,语义出版在专业与学术出版领域发展迅速。语义出版将以往由单个用户独立完成的文献分析整理工作转移给出版系统,在一定程度上减轻了科研人员的负担,提升了科学交流的效率。