1953年,美国学者I.J.古德(I.J.Good)首先描述了原创思想来自英国学者A.M.图灵(Alan Mathison Turing,1912~1954)的平滑算法。
古德-图灵打折法的直觉是使用看到过一次的事物的计数来帮助估计从来也没有看到过的事物的计数。只出现过一次的单词或N元语法叫作单元素或者叫作只出现过一次的单词。古德-图灵打折法的直觉就是使用单元素的频度作为零计数的一元语法的频度来重新估计概率量的大小。
古德-图灵打折法的基本根据简单而聪明,源于对于零频度事件的直觉:把一个零频度单词或者N元语法看成是刚才没有发生的事件;如果这个事件要发生,它将是这个新的N元语法中首次看到的事件。因此,观察一个零频度N元语法的概率就可以用首次观察一个N元语法的概率来模拟。即统计语言处理中“再发生”的概念,也就是使用刚才第一次观察过的事物的数量来帮助估计从来没有观察过的事物的数量。