国际人类基因组单体型图计划的目标是构建人类DNA序列中多态位点的常见模式,即单体型图,简称HapMap。计划将运用单体型分型的方法,找出约50万个标签SNP(tag SNP),用来代表整个人类基因图谱中的SNP集合,从而更容易的找出tag SNP与表型之间的关联。HapMap的结果将为研究人员确定对人类健康或疾病有影响的基因位点,以及对药物或环境反应的相关基因位点提供关键信息。大量研究表明,基于单体型包含了多个SNP遗传信息的本质特征,采用单体型完成对复杂性状的分析比单独使用某个SNP具有更好的统计分析效果。
单体型的推断方法主要有3类:实验法、系谱推断法和统计算法。其中,实验法又包括单分子稀释法、AP-PCR、长插入克隆法与双倍型-单体型转化等。系谱法则是通过检测相关个体的基因型,追溯染色体片段在家系中的传递,进而推断单体型状态。目前,统计算法是单体型推断的主流方法,已被广泛应用于大规模人类基因组单体型推断的研究中,主要分为Clark算法、最大似然算法和贝叶斯算法。对单体型的频率估计、单体型的确定以及tag SNP的选择,不仅可以应用于基因精细定位或候选基因分析,其更重要的应用领域,在于对复杂遗传疾病及药物反应的关联分析。估计单体型与特定性状间的关联,使用回归分析是最简便的方法之一,通常的做法是将单体型多态性作为一个因素,与年龄、性别等其他因素共同纳入回归方程进行分析。简单回归分析长面临的问题是单体型存在的不确定性,在对个体单体型推断时,结果往往是多个单体型出现的概率而非某个确定的单体型。为解决该问题,可以采用混合模型或比分检验的方法,将概率作为权重直接整合到统计模型中,完成疾病与单体型的分析。
目前已经有研究用单体型作为遗传标记来进行心理疾患的遗传学研究,并取得了一些发现。例如,有研究表明,在阿什肯纳兹犹太人群中,儿茶酚-O-甲基转移酶(COMT)基因上的单体型与精神分裂症相关。