G-四分体是构成G-四链体结构的基本单元,它是由四个鸟嘌呤碱基彼此间通过弱相互作用的N—H和O—H胡斯坦(Hoogsteen)氢键结合而形成;两个、三个或更多个G-四分体通过π-π相互作用堆叠可形成G-四链体结构。G-四链体中位于串联鸟嘌呤核苷酸之间而不参与G-四分体形成的核苷酸被称为loop环结构,loop环上的核苷酸数量通常为1~7个,且数量越少,G-四链体结构越稳定。一般含有两层G-四分体的G-四链体结构不太稳定,含有三层或以上G-四分体的G-四链体结构比较稳定(图1、图2)。按形成G-四链体结构所需的富G序列的数目可分为分子内和分子间G-四链体,由一条富G序列形成的为分子内G-四链体,由两条到四条富G序列形成的为分子间G-四链体;按G-四链体结构中链的取向可分为平行、反平行和混合型的G-四链体;按G-四链体结构的形状可分为螺旋桨式、椅式和篮式G-四链体。在转录过程中基因的富G序列(DNA)和转录生成的RNA还可以结合形成杂合(DNA/RNA)的分子间G-四链体结构。在生命体中,DNA/RNA杂合的G-四链体结构的丰度比单纯的DNA、RNA G-四链体高。
G-四链体结构不仅在哺乳动物细胞中广泛存在,而且在酵母菌和大肠杆菌等多种菌类中也存在,甚至在植物中也有可形成G-四链体结构的富G序列。在人类基因中有几十万条可形成G-四链体结构的富G序列,它们存在于基因启动子区或转录起始位点上、下游以及端粒末端等重要的功能调控区。端粒末端富G的TTAGGG重复序列形成的G-四链体结构能调控癌细胞端粒酶的活性,抑制肿瘤细胞增殖,诱导其凋亡。一些癌基因启动子区存在一条或多条富G序列,其G-四链体结构的形成和性质可上调或下调基因的转录活性和蛋白表达,因此G-四链体结构被认为是调控癌基因功能的新靶点。研究热点之一是确定这些G-四链体结构对特定癌基因的生物学功能,并基于与G-四链体的相互作用发现有效的癌症治疗方法。以核酸G-四链体结构为靶点,筛选和发现具有特异性调控癌基因功能的化学小分子是化学生物学领域的一大机遇和挑战。
在体外钾离子等可以诱导富G序列形成G-四链体,并稳定G-四链体的结构。稳定的G-四链体结构在溶液中可保存数周或更长时间。质谱法、圆二色谱(CD谱)、核磁共振谱(NMR谱)和晶体X射线衍射等现代波谱是分析G-四链体形成、性质和结构的重要方法,已使用高分辨的核磁共振谱和X-晶体衍射图解析了多个癌基因富G序列形成的G-四链体结构。核酸G-四链体还可以作为探针分子研究生命化学的过程和机理;G-四链体与血红素组合可以构建信号放大的传感器检测DNA;核酸G-四链体与原卟啉结合可构建高灵敏的分析传感器检测微量的Pb2+等金属离子;荧光修饰的G-四链体可作为探针发展新的荧光分析方法;基于核酸富G序列形成G-四链体结构的多态性可以构建新型核酸纳米材料、纳米器件和分子机器。核酸G-四链体为抗癌药物提供了新靶点,也为生物物理化学的研究提供了新颖的探针工具。