高通量测序的核心在于边合成边测序,可以通过检测末端合成时释放出的不同荧光信号来获得待测核酸分子的序列信息,因而它具有通量高、成本低的特点,可实现全基因组测序、全外显子测序、靶基因测序、转录组测序、脱氧核糖核酸(deoxyribonucleic acid; DNA)-蛋白质相互作用测序(ChIP测序)和表观基因组检测。
高通量测序
能够一次对几十万到几百万条核酸分子进行序列测定和定量分析的检测技术。又称二代测序(next generation sequencing; NGS)。
- 英文名称
- high-throughput sequencing
- 又称
- 二代测序
- 所属学科
- 现代医学
第一种高通量测序技术——大规模平行标签测序(massively parallel signature sequencing; MPSS)问世于20世纪90年代,但该技术并没有对外开放。经过发展,2005年焦磷酸测序仪开发成功,成为第一台商业化高通量测序仪,也是高通量测序史上的里程碑。之后高通量测序技术不断革新。2006~2008年,先后开发了基于可逆染料终止子技术和基于乳液聚合酶链式反应(PCR)的测序方法,这些大型测序仪大大提高了测序通量和测序效率。2009~2010年开始有基于簇生成原理和半导体的个人测序仪问世,以满足小型实验室的独立测序要求,推动了高通量测序技术的广泛应用,并为临床检测服务奠定了基础。同时,2008年后单分子测序的概念提出,包括Heliscope单分子测序、单分子实时(SMRT)测序、纳米孔DNA测序等一批三代测序仪陆续出现,丰富了高通量测序市场。
相较于一代测序,二代测序具有诸多优势:首先通量高,可以满足上百万的测序反应同时在一个反应体系中进行;其次成本低,二代测序技术每百万碱基(Mb)的检测成本比一代测序技术降低90%以上;最后,检测敏感度高,二代测序灵敏度可达1%,随着测序深度增加甚至可以降到更低,不仅可以检测肿瘤组织中低频的罕见基因变异,也可以应用于液体活检,大大提高了实验的可操作性。高通量测序的另一优势在于发现未知突变,这一特点有利于遗传性肿瘤基因风险模型的构建和肿瘤相关基因数据库的完善。截至21世纪初,人类已建立了较为完善的癌症基因信息的数据库——肿瘤基因图谱(The Cancer Genome Atlas; TCGA)数据库,这也推动了肿瘤相关基因研究的进步。
高通量测序的用途广泛,可以在全基因组、全转录组水平进行基因点突变、插入、缺失、融合、拷贝数改变、DNA甲基化等基因变异和表观遗传学改变的检测。其开发伊始便助力于人类基因组计划的完成,并有助于全基因组关联分析(genome-wide association study; GWAS),即推动后基因组时代的进步。高通量测序具有很高的临床应用价值,可用于肿瘤的遗传风险、预后评估和精准治疗的开展。2017版美国国立综合癌症网络(National Comprehensive Cancer Network; NCCN)指南对非小细胞肺癌的治疗方案进行细化,推荐根据表皮生长因子受体(EGFR)、大鼠肉瘤病毒癌基因同源物(KRAS)、c-ros肉瘤致癌因子-受体酪氨酸激酶(ROS proto-oncogene 1, receptor tyrosine kinase; ROS1)、间变性淋巴瘤激酶(ALK)、程序性死亡配体1(PD-L1)等基因和/或蛋白检测的结果将患者进行分类治疗。传统基因检测技术需要进行多次检测才可以为临床出具一份综合报告,而高通量测序只需一次检测便可以对上述基因多种变异类型进行分析,并能定量检测基因突变率,为临床医师提供全面信息。
高通量测序技术发展的速度要明显快于人类对基因与疾病认知的更新速度,数据产生能力的提高远远快于数据挖掘能力的提高,导致许多生物信息数据不能顺利转化成临床可用的信息,从一定程度上造成了数据冗余和浪费的现象,需要通过加快信息挖掘和提高解读能力来实现高通量测序数据的充分利用。