TDT致力于以事件的形式组织新闻信息的技术的研究和评测,其目标是将文本切割为不同的新闻报道,监控其中新事件的报道,并且将同一话题下的分散报道按照某种结构有效组织起来。TDT 的研究始于 1996 年,当时要求提出一种能监控新闻信息流的核心技术,这种技术可以有效的发现世界上发生的特定领域的新事件的报道。1997年,DARPA以及美国国家标准技术研究所(NIST)资助并主持了TDT系列评测会议。话题是TDT中的一个最基本的概念,在最初的研究阶段,话题与事件含义相同。一个话题是指由某种原因或者条件引起的,发生在特定时间和地点,并可能伴随某些必然结果的一个事件。后来,话题的概念要相对宽广一些,它包括一个核心事件或活动以及与之直接相关的事件或活动。TDT主要包括五个子任务:①对新闻报道的切分(Story segmentation)。②新事件识别(New event detection / Fist story detection)。③报道关系识别(Story link detection)。④话题识别(Topic detection)。⑤话题跟踪(Topic tracking)。
第一届TDT于1998年举行,评测包含了中文和英文两种语言,公开评测的任务包括:对新闻报道的切分、话题跟踪与话题识别三项,采用了错误识别代价(漏报率与误报率相结合)作为主要评测指标,这种评测方法也一直被后续的TDT系列评测会议所沿用。第二届TDT于1999年举行,评测内容增加了首次报道识别和报道关系识别两项任务。从第三届(TDT2000)到最后一届(TDT2004)评测,都是围绕上述五项任务展开,并且增加了对阿拉伯语的评测,其中重点评测的两个任务是报道关系识别和话题跟踪。