首页 . 理学 . 计算机科学技术 . 人工智能 . 自然语言处理 . 文本挖掘 . 文本挖掘评测

话题检测与跟踪会议

/Topic Detection and Tracking; TDT/
条目作者赵军

赵军

最后更新 2022-12-23
浏览 108
最后更新 2022-12-23
浏览 108
0 意见反馈 条目引用

由美国国防高级研究计划委员会(DARPA)主办的一个关于信息抽取的会议。又名TDT。

英文名称
Topic Detection and Tracking; TDT
又名
TDT
所属学科
计算机科学技术

TDT致力于以事件的形式组织新闻信息的技术的研究和评测,其目标是将文本切割为不同的新闻报道,监控其中新事件的报道,并且将同一话题下的分散报道按照某种结构有效组织起来。TDT 的研究始于 1996 年,当时要求提出一种能监控新闻信息流的核心技术,这种技术可以有效的发现世界上发生的特定领域的新事件的报道。1997年,DARPA以及美国国家标准技术研究所(NIST)资助并主持了TDT系列评测会议。话题是TDT中的一个最基本的概念,在最初的研究阶段,话题与事件含义相同。一个话题是指由某种原因或者条件引起的,发生在特定时间和地点,并可能伴随某些必然结果的一个事件。后来,话题的概念要相对宽广一些,它包括一个核心事件或活动以及与之直接相关的事件或活动。TDT主要包括五个子任务:①对新闻报道的切分(Story segmentation)。②新事件识别(New event detection / Fist story detection)。③报道关系识别(Story link detection)。④话题识别(Topic detection)。⑤话题跟踪(Topic tracking)。

第一届TDT于1998年举行,评测包含了中文和英文两种语言,公开评测的任务包括:对新闻报道的切分、话题跟踪与话题识别三项,采用了错误识别代价(漏报率与误报率相结合)作为主要评测指标,这种评测方法也一直被后续的TDT系列评测会议所沿用。第二届TDT于1999年举行,评测内容增加了首次报道识别和报道关系识别两项任务。从第三届(TDT2000)到最后一届(TDT2004)评测,都是围绕上述五项任务展开,并且增加了对阿拉伯语的评测,其中重点评测的两个任务是报道关系识别和话题跟踪。

相关条目

阅读历史

    意见反馈

    提 交

    感谢您的反馈

    我们会尽快处理您的反馈!
    您可以进入个人中心的反馈栏目查看反馈详情。
    谢谢!