首页 . 管理学 . 图书馆学 . 【信息组织】 . 本体  . 关联数据

关联数据

/linked data/
条目作者贾君枝

贾君枝

最后更新 2024-01-25
浏览 429
最后更新 2024-01-25
浏览 429
0 意见反馈 条目引用

由万维网联盟(W3C)推荐的数据规范,是发布与连接网上结构化数据的最佳实践。

英文名称
linked data
提出者
T.B.李
所属专题
信息组织
所属学科
图书馆学

2006年由英国科学家T.B.李提出。关联数据将不同领域中人、公司、图书、电影、音乐、基因、统计及科学数据、评论等连接而形成全球数据空间网,并在此基础上形成新的应用类型,如关联数据浏览器、关联数据搜索引擎及面向领域的应用。

使用统一资源标识符(URI)作为事物的名称;使用超文本传输协议统一资源标识符(HTTP URI)使任何人都可以访问这些名称;当有人访问某个标识名称时,以标准的形式,如资源描述框架(RDF)、SPARQL提供有用的信息;尽可能提供相关的URI,使人们可以发现更多的事物。其中,超文本传输协议统一资源标识、资源描述框架数据模型和链接是发布关联数据的关键技术。HTTP URI表达资源的访问地址,RDF数据模型使得数据结构化,RDF链接则表示资源或数据之间的关联。遵循以上原则发布的关联数据,可以形成广泛多样的数据间链接,不仅可以把不同来源的数据库进行链接,而且能把原先不能进行互操作的数据之间进行链接,既实现了链接其他数据,也实现了被其他数据链接。

可以简单划分为选择资源、定义URI、数据模型化、词汇表的使用、RDF文档发布五大步骤。2014年W3C工作组针对政府数据发布了关联数据发布的最佳实践,分为十步:利益相关者的准备、数据集选择、数据模型化、适当的授权、关联数据的URI、标准词汇的使用、数据转换、机器存取数据的提供、发布新数据集、发布者的社会责任。万维网联盟语义网教育和拓展兴趣组于2007年着手关联开放数据(LOD)项目,旨在促使基于开放协议的数据集遵循关联数据发布原则,转换成RDF形式并发布于网上,大量提升网络关联数据的数量。据统计,至2014年8月30 日,数据集发布平台datahub.io中发布的关联数据集已达到1014个,RDF三元组数量约1880亿,而发布的目的是更好地应用或消费,其应用领域由最早开始的图书情报、计算机领域延伸至商业企业、气象、生命科学、政府、地理科学等多个领域。

在不同领域发布的关联数据集上构建的网络应用范围较广,并在此基础上开发了一系列关联数据消费工具和平台。关联数据应用主要强调针对终端用户通过搜索引擎检索查询、浏览器浏览可视化、消费数据本身及利用数据之间的关系实现不同关联数据间的融合聚类。既有通用的关联数据应用,又有特定领域的关联数据应用,而以前者居多。对关联数据的检索查询,旨在迅速准确地获得所关注的数据,而关联数据浏览或可视化,更注重于数据导航及其形象化显示,通过RDF三元组中的链接实现对数据之间关系的消费,进而对数据进行融合与聚类,根据关联数据的发布原则,把融合后的数据再次发布到网络上,实现增值服务。

相关条目

阅读历史

    意见反馈

    提 交

    感谢您的反馈

    我们会尽快处理您的反馈!
    您可以进入个人中心的反馈栏目查看反馈详情。
    谢谢!