在真核生物中常有这种情况:表达程度高的基因有较短的外显子和内含子,也就是说它们的结构比较紧凑,如哺乳动物(人、鼠)、线虫(Caenorhabditis elegans)、球蒴藓(Physcomitrella patens)以及拟南芥的花粉都是如此。目前有3种假说解释这一现象:
(1)转录效率说:结构紧凑的基因转录效率高。
(2)基因设计说:高度表达的基因(主要是管家基因)所需的表观遗传调控简单,故长度较短。
(3)突变偏向说:高度表达的基因存在与转录相耦联的删减现象,故长度较短。
其中转录效率学说更受关注,而且还有两个子观点:1)“节能”说:结构紧凑的基因为转录节省能量。2)“省时”说:结构紧凑的基因为转录节省时间。关于“省时”的问题,Seoighe et al曾提出反对意见,认为多个RNA聚合酶可以同时在一个模板上转录,故合成多份mRNA拷贝比合成一份mRNA多不了多少时间。本文则试图否证“节能”说。
我们知道在动物体内不同器官大小差异巨大。假定我们分别选取一个在大器官(如肺)中特异性表达的基因和一个在小器官(如前列腺)中特异性表达的基因,而且它们在单个细胞中表达程度是接近的。如果两个基因长度也接近,那么肺需要花费更多的能量以产生多拷贝的mRNA。根据“节能”学说,前者的基因长度(主要取决于内含子长度)应比后者短些,以降低转录耗能。假如我们证明前者基因长度不比后者短,则有可能否定“节能”学说,这是本研究的理论基础。
通过比较人类149个LTS(Large tissue/organ specific)基因和96个STS(Small tissue/organ specific)基因以及小鼠的140个LTS和246个STS基因的长度和表达量的关系,我们发现在表达程度接近的情况下,LTS基因与STS基因的长度差异不显著(包括内含子平均长度、内含子总长度、CDS长度、UTR长度),只有当基因间表达程度差异较大时,大量表达的基因才比微量表达的基因显著地紧凑。也就是说:决定基因紧凑程度的是基因在单个细胞里的表达量,与器官大小(反映转录总能耗)无关,这与“节能”学说是相矛盾的。
我们还可以估测一下基因组内含子的转录能耗,这时我们要选取一个管家基因(因为它表达量大,能耗高)。假设基因中存在一个长度阈值为L的内含子(超过这个阈值将对人体不利),它在每个细胞内每2h产生30个mRNA,转录时每个核苷酸消耗2分子ATP,则每个细胞每天因为这个内含子存在而要消耗的转录能量是:
![]() |
在人类基因组中只有0.9%的内含子长度超过该阈值,可见内含子并不能带来多少转录能耗。在小鼠基因组中同样可以进行类似的计算,得到的结果是只有6.8%的内含子长度超过该阈值,内含子的存在与否影响不大。有例外情况的是酵母,按照上述方法计算约有86.5%的内含子超过阈值。这说明在单细胞真核生物中长内含子的存在有较大的能耗影响,所以这类低等真核生物内含子都比较短。
从上述分析来看,“节能”学说在哺乳动物体内似乎不适用,所以应该考虑别的假说,例如“省时”学说。Seoighe et al曾认为多个RNA聚合酶可以同时在一个模板上转录,故合成多份mRNA拷贝比合成一份mRNA多不了多少时间。假设转录进行速率是0.03s/nt,则完成一个长度为L的基因转录需要时间为0.03L;若有k个RNA聚合酶同时在一个模板上转录,产生n份mRNA拷贝需要的时间为:
![]() |
此外还有其他的假说,认为短基因被无效转录或是错误剪接的频率较低,或者长基因不适合拥挤在有限的染色质间区室(interchromatin compartment)里,或者高度表达的基因不需要过于复杂的调控(即基因设计学说)。
在单细胞生物以及拟南芥和水稻的孢子体中则存在相反的情况:表达长度高的基因内含子反而长。而且在被研究的生物中普遍存在者mRNA长度与表达量呈负相关的现象,这正好可以用“节能”学说来解释。因此我们不能完全否认“节能”选择在形成紧凑的mRNA中的作用,因为翻译也是一个相当耗能的过程。


没有评论:
发表评论