通常由RNA聚合酶Ⅱ催化转录,主要功能是对基因表达进行表观遗传调控,以RNA的形式在很多重要的生物学过程中发挥不同的生物学作用。lncRNA的分子大小差异很大,较大的lncRNA可达数千甚至数万个核苷酸;但有时也会将100~200个核苷酸的非编码RNA称为lncRNA。截至2021年3月,NONCODE数据库记录了549813条lncRNA转录物,其中包括173112条人lncRNA和131874条小鼠lncRNA。
长非编码RNA
一类长度超过200个核苷酸、一般不编码蛋白质的转录物。
- 英文名称
- long non-coding RNA; lncRNA
- 所属学科
- 现代医学
人基因组中有20000~25000个基因,外显子序列在基因组全序列中约占1%,在每个基因(外显子加内含子)序列中约占5%,基因组中大部分序列为非蛋白质编码序列。这些序列曾被认为是基因组的“垃圾序列”或“转录噪声”,并无任何功能。随着研究的深入,人们发现多数的“垃圾序列”能够以组织(空间)特异性或阶段(时间)特异性的方式转录为RNA,表明它们可能具有重要的生物学功能。
21世纪初,人们发现,包括lncRNA在内的大量的非编码RNA转录物构成了哺乳动物转录物组的主要成分,但是并未进行功能分析。与此同时,T.Bousse等人发现人类1型副流感病毒F基因中含有的一段lncRNA能够影响转录的终止;J.L.Rinn等人关于HOTAIR RNA具有表观遗传调节作用的发现更是引起人们对于lncRNA的极大关注。已有大量具有重要生物学功能的lncRNA被发现。lncRNA没有统一的命名规则,通常根据其功能或来源进行命名。
lncRNA属于调节性非编码RNA。根据lncRNA编码基因与邻近蛋白质编码基因在基因组的位置和相对方向,可分为:基因间lncRNA,内含子lncRNA,同义lncRNA,反义lncRNA和双向lncRNA(见图)。
①同义lncRNA(sense),由蛋白质编码基因的同义链转录生成;②反义lncRNA(antisense),由蛋白质编码基因的反义链转录生成;③内含子lncRNA(intronic),由蛋白质编码基因的内含子转录生成;④基因间lncRNA(intergenic),由基因间序列转录生成;⑤双向lncRNA(bidirectional),在同一基因座向两个方向(方向相反)转录。编码RNA为蓝色框,非编码RNA为红色框。
lncRNA可产生于多种途径,例如:①因蛋白质编码基因突变使阅读框受到干扰,外显子融合形成功能性lncRNA;②因染色质重排使原本截然分开的2个未转录序列串联形成1个含有多个外显子的lncRNA;③因转座复制而产生功能性或非功能性lncRNA;④因相邻重复序列的串联重复而产生功能性lncRNA;⑤因转座元件插入而产生功能性lncRNA;⑥在转录后加工过程中产生。
lncRNA广泛存在于真核生物中,但是其表达具有较强的组织/细胞特异性或发育阶段特异性。在不同种属间,lncRNA基因在基因组中的定位比较保守,但是其结构和序列保守性较低。lncRNA在细胞内的亚细胞结构定位依据于不同的lncRNA而有所不同,可定位于细胞核和细胞质。
动物lncRNA大部分是由RNA聚合酶Ⅱ转录生成,少数由RNA聚合酶Ⅲ转录生成;植物lncRNA还可由RNA聚合酶Ⅳ和Ⅴ转录生成。lncRNA的转录受到严格的调控,以适应细胞的生命活动,但其机制尚不清楚。据报道许多调节蛋白质编码基因的转录因子能够对lncRNA基因的启动子进行调节;此外,一些特定的RNA结合蛋白质对lncRNA稳定性的作用也可能影响lncRNA的表达水平。
lncRNA能够以多种方式、在多个层面通过对基因表达的调节,进而影响生命活动。已知lncRNA在细胞增殖、分化,哺乳动物的生长、发育,以及细胞应激、炎症、疾病的发生发展等多种生理病理过程均发挥重要作用。
lncRNA的分子较长,能够在链内形成一些特殊结构与不同的大分子相互结合、相互作用。能够与lncRNA相互作用的分子可大致有以下几类:①小分子RNA。通过lncRNA分子所含有的与小分子RNA,如miRNA的互补序列与小分子RNA结合,起到吸附小分子RNA的作用。②靶mRNA。通过lncRNA分子所含有的与mRNA的互补序列与mRNA结合,起到反义RNA的作用。③RNA结合蛋白质。通过lncRNA分子中特殊的一致性序列或链内特殊结构与其结合并调节其功能。lncRNA链内特殊结构也可被其他蛋白质识别、结合,从而影响蛋白质的定位或功能,调节相应蛋白质的活性。④DNA。通过lncRNA分子中部分序列与双链DNA分子结合,形成局部的三链结构;或lncRNA分子的5′端或3′端与局部解链的DNA结合,形成RNA-DNA杂交双链,改变这段DNA分子所在特定区域的DNA构象;或通过RNA结合蛋白质的相互作用,将特定蛋白质募集到特定的DNA位点。
lncRNA可通过对染色质结构、转录、转录后加工、翻译等方面的调节,对基因表达产生影响。
lncRNA可通过与DNA相互作用或与染色质蛋白质相互作用,并募集染色质重塑复合体,改变染色质的结构,形成结构致密的基因沉默区。此外,lncRNA招募的染色质重塑复合体可对染色质进行表观遗传修饰,如lncRNAHOTAIR通过招募染色质重塑复合体PRC2并将其定位到HOXD位点,使该位点的H3K27甲基化、H3K4去甲基化,导致HOXD位点沉默。
lncRNA能够通过多种机制在转录水平实现对基因表达的沉默。例如:①lncRNA能够与转录因子结合以阻碍其与靶基因启动子的结合。lncRNA也可以通过与蛋白质编码基因启动子区域形成RNA-DNA杂交分子,进而抑制转录因子与启动子结合干扰基因的表达。②lncRNA可以抑制RNA聚合酶Ⅱ和转录因子的活性或介导染色质重塑,影响下游基因表达。③lncRNA能够与miRNA结合,阻碍其与靶mRNA的相互作用。④lncRNA能够调控转录因子或调节蛋白质的亚细胞定位,阻止其入核,进而影响其靶基因的表达。⑤有的lncRNA基因在蛋白质编码基因上游启动子区转录,干扰该基因的表达。
lncRNA能够通过对mRNA转录后加工的调节影响基因表达。其作用方式包括:①通过与蛋白质编码基因的转录物形成互补双链封闭剪接位点,干扰mRNA的剪接加工,或通过影响剪接调控因子而影响mRNA前体的剪接;②以天然反义RNA的形式与mRNA形成双链RNA分子,抑制mRNA的核质转运,导致mRNA在核内滞留等。
lncRNA可以多种方式在翻译水平影响基因表达,包括:①抑制翻译起始复合物相关蛋白质与mRNA的结合,或募集阻遏蛋白结合mRNA而抑制翻译;②通过影响特定蛋白质与mRNA的结合而改变mRNA的稳定性,从而影响蛋白质编码基因的表达;③有些lncRNA可通过影响核糖体与mRNA的相互作用或阻止miRNA的抑制作用而促进翻译。
越来越多的研究表明lncRNA具有重要的生物学功能,尤其是lncRNA与人类疾病的关系引起人们格外的关注,某些特定lncRNA的表达水平有可能成为肿瘤或其他疾病诊断的标志物。但是关于lncRNA的研究仍处于起步阶段,对lncRNA的序列和结构特征、对其结构与功能的关系尚不清楚;lncRNA自身的表达调控以及作用机制仍有待深入研究;适宜于lncRNA的研究手段和技术策略更是急需发展和建立。这些也将成为lncRNA的研究焦点。