美国学者J.爱依斯讷(Jason Eisner)在2002年提出一个问题:假定一个气象学家在2799年研究全球气候变暖的历程,而找不到在2007年夏天任何关于美国巴尔的摩州、马里兰州的天气的记录资料,但是在偶然中发现了爱依斯讷的日记,其中列出了在这个夏天的每一天他吃冰激凌的数量,这样就可以利用这些关于冰激凌数量的观察来估计每一天的气温。
为了简单起见,假定每一天的天气只有两种状态:“冷”(记为COLD)和“热”(记为HOT)。这样一来,爱依斯讷提出的这个问题可以描述如下:给定一个观察序列O,每一个观察是一个整数,它对应于在某一个给定的日子所吃的冰激凌的数量;引起爱依斯讷吃冰激凌的天气的状态序列是“隐藏的”,这个隐藏的状态序列用Q表示,它的值为HOT或COLD。这个问题就是一个典型的隐马尔可夫模型的问题。观察似然度就是从观察O判断隐藏的状态是HOT还是COLD的似然度问题。
下图是用于描述吃冰激凌的隐马尔可夫模型的一个样本。HOT和COLD两个状态分别表示热天气和冷天气,观察的值(吃冰激凌的数量)取自字母表O = {1, 2, 3},每一个观察值表示爱依斯讷在给定的日子吃冰激凌的数量。
在状态为HOT的情况下,爱依斯讷吃冰激凌的观察似然度如上图左下角的矩阵所示(0.2、0.4、0.4分别为吃一个、两个、三个冰激凌的概率);在状态为COLD的情况下,爱依斯讷吃冰激凌的观察似然度如上图右下角的矩阵所示(0.5、0.4、0.1分别为吃一个、两个、三个冰激凌的概率)。
隐马尔可夫模型可以根据观察似然度和转移概率,求解隐藏在观察之后的状态。