转录激活因子样效应物TALE蛋白于1989年在植物病原黄单胞杆菌中被分离出来,最早发现的TALE蛋白是AvrBs3。TALE蛋白与植物的转录激活因子类似,可通过Ⅲ型分泌系统注入宿主植物细胞中并穿透核膜进入细胞核,识别并结合植物基因组DNA特定位点,激活特定基因表达,从而提高植物的易感性。TALE蛋白特异性识别并结合宿主DNA的机制于2009年发表于《科学》杂志上。TALE蛋白识别DNA的高分辨率晶体结构于2012年被解析。
TALENs融合蛋白首次产生于2011年,有文献报道,TALE蛋白与FokⅠ蛋白融合,并验证了此融合蛋白的基因组定点编辑功能。2014年完成全部TALEN元件的解码工作。TALEN基因编辑技术已被用于人类细胞、水稻、拟南芥、线虫、果蝇、小鼠、大鼠及斑马鱼等多种细胞和物种的基因靶向修饰。
人工改造的融合蛋白,由转录激活因子样效应物TALE蛋白的DNA结合区域和FokⅠ蛋白的内切酶活性区域融合而成。人工改造的TALE蛋白从N端到C端分别为分泌信号、重复序列构成的DNA结合区域和C端转录激活区(图1)。中间重复序列高度保守,由33~35个氨基酸残基构成,其中第十二和十三位氨基酸为可变残基,称为重复可变双残基(repeat variable di-residue; RVD)。RVD决定了与DNA序列结合的特异性(图1)。
图1 TALE蛋白结构及部分RVD与DNA碱基对应关系图
去除TALE蛋白的C端转录激活区域,并与FokⅠ内切核酸酶的切割结构域组合,即形成TALENs(图2)。
图2 TALENs蛋白结构及作用示意图
可用于基因组的定点编辑,如基因敲除、基因敲入及定点突变等。
不同RVD组合识别不同的DNA碱基。已确定的RVD超过20种,重复可变双残基NI、重复可变双残基NG、重复可变双残基HD、重复可变双残基NN和重复可变双残基HG分别识别A、T、C、G/A和T碱基,不同RVD可按照任意的顺序组合,从而达到识别不同DNA序列的目的。靶位点可根据需要选取,TALENs对靶位点的要求是5′端以T开始。
通过FokⅠ的非特异性切割活性在基因组上引入双链DNA损伤。
通过同源重组或其他末端连接机制在DNA损伤处插入或替换序列,从而对基因组序列进行编辑。
相比锌指核酸酶(zinc finger nuclease; ZFN)等基因组修饰酶,TALENs商业化程度高,构建方法方便快捷,可进行高通量操作。不同RVD的随意组合使得TALENs技术的应用范围非常广泛。增加靶序列长度可充分保证其识别的特异性,降低了脱靶概率。易组装、特异性强、切割效率高的TALENs已广泛应用于不同物种的基因组靶向修饰。
应用TALENs对复杂的基因组进行精确的定点编辑,对于基础生命科学研究意义重大,并有望应用于人类疾病治疗方法的研究与改进。