2009/04/27

外显子识别与内含子密度

Deng-Ke Niu, Exon definition as a potential negative force against intron losses in evolution. Biology Direct 2008, 3:46

不同真核生物中内含子数量(密度)差异巨大。已有证据显示原始真核生物祖先有高密度的内含子,现代生物内含子密度的多样化是演化历程中内含子丢失速率有差异的结果。至于为何存在这种差异,尚无定论。

关于内含子丢失的机理,有两个假说:(一)cDNA与对应的基因组DNA间的同源重组导致内含子丢失。(二)2个基因组DNA通过不等交换导致基因删减。不过后者很少能解释内含子丢失速率差异,所以人们多是根据前者来解释。有人认为:产生cDNA需要反转座子,反转座子活性低的生物(如Plasmodium),内含子丢失速率就低。但是脊椎动物的反转座子活性很高,而它们丢失内含子的速率和Plasmodium相当,故这个观点有些站不住脚。还有人认为:由于发育过程中体细胞和性细胞的分化,在性细胞中只表达少量的基因,只有在这些基因中丢失内含子才是在进化上有效的。但这也只在低等生物中成立,Huntington等人发现在高等动物中内含子丢失主要发生在管家基因中,而管家基因的内含子仍比组织特异性基因多。本文将针对脊椎动物提出一个抑制内含子丢失的机制:外显子识别。

在转录后加工过程中存在两种剪接位点识别机制:外显子识别和内含子识别。前者的特点是剪接体识别一定长度以下的外显子,并把之间的区域(被认为是内含子)切去;后者的特点是剪接体识别一定长度一下的内含子,并直接把它剪去。由于生物越高等,内含子越多、越长,所以脊椎动物常使用外显子识别机制,而低等生物常使用内含子识别机制。

之前有证据显示:临近内含子一齐丢失会导致几个外显子合并文一个较长的外显子,这类长外显子的存在将导致剪接位点识别错误,从而产生不正常的mRNA产物,这就是内含子丢失突变。



如图所示,假设一个基因有6个外显子(1、4、5、6、7、3)和5个内含子(a、c、d、e、b)。现在发生了一次内含子丢失突变,内含子c,d,e丢失,外显子4、5、6、7合并成外显子2,在之后进行转录及转录后加工过程中根据剪接位点识别机制、外显子大小、内含子大小可分为以下四种情况:



也就是说,决定内含子丢失后果的因素,要看剪接位点识别机制、外显子大小、内含子大小等因素,事实上还有其他因素,例如丢失的内含子是否有重要调控功能等。

根据这个假说,脊椎动物主要使用外显子识别(情况1),故内含子丢失一般是不利的,所以它们内含子密度比较高。至于偶然发生的内含子丢失,是因为个别mRNA剪接采用内含子识别机制,所以基因组中遗留下来的内含子都不超过一个阈值。在脊椎动物中允许内含子丢失的情况有:
(1)内含子丢失后产生的外显子不大,仍可被剪接体正确识别。
(2)内含子丢失后产生的外显子位于头或尾。
(3)内含子丢失发生在机体非必需基因中。
(4)内含子丢失发生在多拷贝基因中,故对机体无显著影响。

但是,Plasmodium是一个例外情况,它主要使用内含子定义,但是内含子丢失速率却很低。在上文曾提到,影响内含子丢失的速率很多,至于外显子定义机制在决定内含子丢失速率中有多大贡献还有待研究。

2009/04/26

牛染色体组测序完成

The Bovine Genome Sequencing and Analysis Consortium. The Genome Sequence of Taurine Cattle: A Window to Ruminant Biology and Evolution. Science 324, 522-528(2009)


据4月24日的《科学》杂志报道说,研究人员现在已经完成了对整个牛染色体组的测序,这一成就对我们加深了解哺乳动物的进化、加速牛奶和肉制品的基因改良并由此而更好地了解人类疾病以及对它们的相关治疗都会有促进作用。在2篇独立的报告中,Richard Gibbs及其同僚重点介绍了Bovine Genome Sequencing and Analysis Consortium的最近的发现,该项目对牛的基因组进行了分辨率精细的测序;而Bovine HapMap Consortium则将研究焦点放在对牲畜进化和驯养历史的追踪工作上。 对这2个项目进行研究的工作人员发现,牛的基因组含有至少2万2000个基因,其中大约有1万4345个基因在7种其它的哺乳动物种系中具有对应的基因。 这些发现显示,在牛的进化和驯养过程中,基因的数量和构成的变化是如何改变牛的生物学系统并对它们的繁殖、免疫能力、乳汁分泌和消化造成了最为显著的影响的。这些研究人员还对来自19个不同地理和在生物学上混杂繁殖的497头不同牛只DNA中的3万7470种差异进行了调查。他们发现,母牛的进化与我们人类本身的进化截然不同,它们从一个有着非常大的有效祖先群体到近期发生的快速的群体下降,而不是反过来的那种一种情形。文章的作者将这种进化归因于与以往驯化活动、因农业专门化所作的选择以及与动物豢养的形成相关的遗传学瓶颈。 但是,牛品种中的多样性的现有水平看来至少与那些在人类群体中的水平一样地强健有力。在一篇Perspective中,Harris Lewin对这些发现进行了更为详细的探讨,并重点介绍了其对人类健康和可持续性农业的意义。


Science Magazine China: http://www.sciencemagchina.cn/highlights090424.aspx

The existence of plant species

In my opinion,植物物种是存在的。

关于植物物种是否存在的问题,是现代物种概念被引进之后提出的,而且是与动物界相比较之后提出来的。首先我们应回顾一下现代物种的概念,虽然迄今为止仍无一个公认的物种定义,但至少有这么几点大家是认同的:物种是一个独立的繁殖单位和进化单位,不同物种之间存在生殖隔离。由于在动物界有性生殖是最主要的繁殖方式,因而根据生殖隔离的标准去定义动物物种很方便。但是把这个标准搬到植物界会遇到一些麻烦,这就是所谓困扰植物学家的“三大灾难”——种间杂交、多倍体和无性生殖。这三个过程可谓是相辅相成,首先是发现植物界里存在着比动物界多得多的种间杂交现象,从表面上看起来不同植物物种之间的生殖隔离有些“形同虚设”。后来细胞学和遗传学的研究表明该过程是一个“先杂交,后多倍化”的过程。举个例子,一粒小麦(Thiticum monococcum, T. monococcum)与斯氏麦草(T.searsii)杂交,后代本是不育的,可是染色体一加倍,就成了可育的拟二粒小麦(T.dicocoides),它是一个异源四倍体。拟二粒小麦继续与滔氏麦草(T.tauschii)杂交,然后染色体再加倍,就成了异源六倍体——普通小麦(T.aestivum)。植物就是这样通过杂交——多倍化——再杂交——再多倍化的过程,创造了许许多多在动物界里几乎不可能发生的“奇迹”。这是一种情况,另一种情况是,杂交——多倍化过程里还会产生同源三倍体,一旦走到这一步意味着有性生殖即已走到尽头,以后只能依靠无性生殖来繁殖后代。香蕉就是其中最典型的代表。既然不存在有性生殖,就更谈不上种间生殖隔离了。基于以上现象,有人就提出植物物种并非是真实存在的实体,仅仅是人们的一种主观上的划分罢了。

但是,现在又有人根据一些研究资料提出:即使仍以生殖隔离作为物种划分的主要指标,植物物种仍然是真实存在的,一个植物物种能代表一个独立的繁殖进化单位。他们指出:植物界存在所谓“高频率”的无性繁殖、种间杂交、多倍体形成等现象,是与动物界相比较而言。究竟在植物界发生这些现象的频率高到了什么程度,是否足以颠覆整个植物界关于物种的划分标准,长期以来是缺乏定量统计的。

近年来的一些统计工作对该问题的解决指明了方向。Jared M. Diamond 在他的评论Horrible Plant Species里提到,对美国马萨诸塞州Concord地区838个植物物种调查表明,有17个物种只能进行无性生殖,有37个物种是由同源多倍体组成,有3个物种是其他物种之间的“杂交产物”。其余781个物种虽然有些也存在染色体变异的现象,但都能用生殖隔离的标准做出清晰的划分。也就是说,所谓困扰植物学家的“三大疑问”的无性繁殖、种间杂交、多倍化现象,在这个样本里只占7%,可谓微不足道。

Loren H.Rieseberg等人使用“杂交力指数”(crossability index, CI)作为衡量动、植物物种与独立繁殖系的关联程度,以此来检测目前人们划分出来的“植物物种”是否真的代表一个个独立的繁殖单位。他们一共收集了114个植物属(包含1231个种间杂交组合)与170个动物属(包含694个种间杂交组合)的数据。分析结果相当出人意料:竟有69.5%的植物物种能代表独立的繁殖系,相反在动物物种里这个比例只有39.2%。他们的研究至少告诉我们两个结论:(1)植物分类学家做的“分类工作”可谓相当准确(事实上无论是在古代还是现代,形态学差异仍是分类的主要依据;也就是说,形态差异基本上代表了生殖隔离,Loren的单因子回归分析证明了这点)。(2)如果我们承认动物物种是存在的,那么植物物种就更是存在的。为什么动物里只有39.2%的物种代表独立的繁殖单位呢?因为CI评价的是物种间“合子后隔离”的强弱程度,而动物界里普遍存在的是“合子前隔离”,植物界里也存在着一部分“合子前隔离”,也就是说Loren的结果是偏低的。以上这些结果证实了植物物种和动物一样是真实存在的,并非是人类主观臆想划分出来的。

我也赞成这种观点。事实上,纵观整个生物界,当初为什么会提出使用生殖隔离作为物种分类标准呢?事实上,物种间的生殖隔离是一种表面现象,生殖隔离意味着遗传物质不能自由交流,也就意味着遗传物质之间的差异。不同物种之间遗传物质是存在较大差异的。在基因测序技术发明之前,人们只能使用生殖隔离作为遗传物质差异程度的“标志”,由此带来了文章开头提到了一系列不必要的麻烦。现在,全基因组的测序技术发展得很快,对于一些已完成测序的物种,我们可以从分子水平上直截了当地看出它们的差异从而把不同物种区分开来。但即使在今天,全基因组测序仍是一项耗资巨大的工程。(对于像细菌等原核生物,几乎只能进行无性生殖,有人提出根据其16S rRNA的序列同源性来区分物种,虽然不是百分之百准确,但不失为一种好办法)。好在Loren已用统计学方法证明了形态差异基本上代表着遗传物质的隔离, 使我们仍可以放心的按照形态学的方法来分类形形色色的物种,而不必在乎它们之间是否曾有过奇怪的“杂交”。至于我们能否等到这样一天,测量一个全基因组序列就像测溶液的pH值一样容易,以至于我们能从分子水平上轻而易举地把物种划分出来,还是一个未知数。

参考文献
1. Levin, D.A. The nature of plant species. Science 204, 381-384(1979)
2. Diamond, J.M. Horrible plant species, Nature 360, 627-628(1992)

3. Loren H.Rieseberg, Troy E.Wood, Eric J.Baack. The nature of plant species, Nature 440, 524-526(2006)

2009/04/25

基因紧凑的奥秘

Yi-Fei Huang, Deng-Ke Niu. Evidence against the energetic cost hypothesis for the short introns in highly expressed genes. BMC Evolutionary Biology, 2008, 8:154

在真核生物中常有这种情况:表达程度高的基因有较短的外显子和内含子,也就是说它们的结构比较紧凑,如哺乳动物(人、鼠)、线虫(Caenorhabditis elegans)、球蒴藓(Physcomitrella patens)以及拟南芥的花粉都是如此。目前有3种假说解释这一现象:
(1)转录效率说:结构紧凑的基因转录效率高。
(2)基因设计说:高度表达的基因(主要是管家基因)所需的表观遗传调控简单,故长度较短。
(3)突变偏向说:高度表达的基因存在与转录相耦联的删减现象,故长度较短。
其中转录效率学说更受关注,而且还有两个子观点:1)“节能”说:结构紧凑的基因为转录节省能量。2)“省时”说:结构紧凑的基因为转录节省时间。关于“省时”的问题,Seoighe et al曾提出反对意见,认为多个RNA聚合酶可以同时在一个模板上转录,故合成多份mRNA拷贝比合成一份mRNA多不了多少时间。本文则试图否证“节能”说。

我们知道在动物体内不同器官大小差异巨大。假定我们分别选取一个在大器官(如肺)中特异性表达的基因和一个在小器官(如前列腺)中特异性表达的基因,而且它们在单个细胞中表达程度是接近的。如果两个基因长度也接近,那么肺需要花费更多的能量以产生多拷贝的mRNA。根据“节能”学说,前者的基因长度(主要取决于内含子长度)应比后者短些,以降低转录耗能。假如我们证明前者基因长度不比后者短,则有可能否定“节能”学说,这是本研究的理论基础。

通过比较人类149个LTS(Large tissue/organ specific)基因和96个STS(Small tissue/organ specific)基因以及小鼠的140个LTS和246个STS基因的长度和表达量的关系,我们发现在表达程度接近的情况下,LTS基因与STS基因的长度差异不显著(包括内含子平均长度、内含子总长度、CDS长度、UTR长度),只有当基因间表达程度差异较大时,大量表达的基因才比微量表达的基因显著地紧凑。也就是说:决定基因紧凑程度的是基因在单个细胞里的表达量,与器官大小(反映转录总能耗)无关,这与“节能”学说是相矛盾的。
我们还可以估测一下基因组内含子的转录能耗,这时我们要选取一个管家基因(因为它表达量大,能耗高)。假设基因中存在一个长度阈值为L的内含子(超过这个阈值将对人体不利),它在每个细胞内每2h产生30个mRNA,转录时每个核苷酸消耗2分子ATP,则每个细胞每天因为这个内含子存在而要消耗的转录能量是:


在人类基因组中只有0.9%的内含子长度超过该阈值,可见内含子并不能带来多少转录能耗。在小鼠基因组中同样可以进行类似的计算,得到的结果是只有6.8%的内含子长度超过该阈值,内含子的存在与否影响不大。有例外情况的是酵母,按照上述方法计算约有86.5%的内含子超过阈值。这说明在单细胞真核生物中长内含子的存在有较大的能耗影响,所以这类低等真核生物内含子都比较短。

从上述分析来看,“节能”学说在哺乳动物体内似乎不适用,所以应该考虑别的假说,例如“省时”学说。Seoighe et al曾认为多个RNA聚合酶可以同时在一个模板上转录,故合成多份mRNA拷贝比合成一份mRNA多不了多少时间。假设转录进行速率是0.03s/nt,则完成一个长度为L的基因转录需要时间为0.03L;若有k个RNA聚合酶同时在一个模板上转录,产生n份mRNA拷贝需要的时间为:



此外还有其他的假说,认为短基因被无效转录或是错误剪接的频率较低,或者长基因不适合拥挤在有限的染色质间区室(interchromatin compartment)里,或者高度表达的基因不需要过于复杂的调控(即基因设计学说)。


在单细胞生物以及拟南芥和水稻的孢子体中则存在相反的情况:表达长度高的基因内含子反而长。而且在被研究的生物中普遍存在者mRNA长度与表达量呈负相关的现象,这正好可以用“节能”学说来解释。因此我们不能完全否认“节能”选择在形成紧凑的mRNA中的作用,因为翻译也是一个相当耗能的过程。

2009/04/17

被子植物的起源

On the Origin of Flower Plants

Elizabeth pennisi. On the Origin of Flower Plants. Science 324, 28-31 (2009)



1879年达尔文给英国植物学家Hooker写了一封信,称被子植物的出现是一个“棘手的谜团”。被子植物从诞生到统治植物界仅数千万年,在整个地质史上可谓沧海一粟。而且在当时达尔文尚不认为进化是可以快速、乃至断裂的。

130年过去了,如今科学家们仍在努力研究:显花植物是何时、何地、如何起源的?最核心的问题在于:被子植物的祖先是什么?化石证据表明,被子植物好像是突然出现的,中间似乎没有过渡物种,这着实很令人费解。

(一)第一朵花在何方
被子植物种类如此繁多,以致于难以直接区分在进化史上谁先谁后。20世纪大多数人们认为木兰是最原始的被子植物。直到20世纪末,随着分子系统生物学的引进,人们开始逐渐揭开被子植物起源之面纱。无油樟(Amborella trichopoda)是一种小灌木,它开着约6mm的黄绿色小花,并被人们放到了被子植物进化树的根基上。

(二)寻觅化石
与分子证据相比,最能说明问题的还是化石证据。瑞典自然历史博物馆的Else Marie Friis在30年内搜寻到了数百种微米级的花朵化石,年代约在7千万到1.2亿年前。化石种类如此繁多,证明大约在1亿年前被子植物就已逐渐走向繁盛了。1998年,中国吉林大学的Ge Sun发现了一种可能更为原始的花朵化石——Archaefructus(称为“古果”),年代估计约为1.44亿年前。Archaefructus尚无花瓣、萼片,但已有闭合的心皮了,Kevin Nixon等人认为它甚至比Amborella更原始。

但是,Archaefructus的“被子植物之母”荣誉并没有维持多久,几个月之后即被证实它的实际年龄应是1.25亿年而非1.44亿年。诸如此类关于花朵化石的研究经常引发争议,因为化石样品通常很不完整。

(三)有花之前
人们认为原始被子植物是起源于裸子植物的一种。裸子植物在2亿年前处于繁盛时期,其中包括一些类似于现代苏铁蕨的物种,例如已经灭绝的Bennettitale(本内苏铁),还有Gnetale。此外,在侏罗纪时期种子蕨也很茂盛(现已灭绝),Caytonia(开通蕨)就是其中有名的代表,它似乎具有类似原心皮的结构。这几种物种均与被子植物有着密切的关系。

20世纪80年代中期Crane提出了anthophyte hypothesis(生花植物假说)。他认为Bennettitale和Gnetale的两性生殖器官可以组合起来视为原始花的结构,故把Bennettitale和Gnetale都视为“生花植物”。这一学说在当时还有不少证据支持,但很快陷入困境了,因为眼前化石种类繁多,差异巨大,很难从各种各样的结构中理清相互亲缘关系。

还有一个很糟糕的事情是:分子进化树把Gnetale从生花植物分支中脱离出来,与其它裸子植物并列。分子的证据的确非常奇怪:没有任何其它植物与被子植物有较近的亲缘关系——中间留下了一个空档。

(四)胜利之源
或许,被子植物的真正祖先永远是个谜。但还有一个问题是:为什么被子植物如此快地统治了整个植物界?种子蕨类和裸子植物在3.7亿年前出现,并统治地球约2.5亿年之久。而之后仅过了数千万年被子植物迅速崛起并取而代之。

“分子钟”的测算将被子植物进化史推至约2.15亿年前。康奈尔大学的Karl Niklas分别在20世纪80年代和90年代(1997年)构建了一个数据库显示一种植物化石出现及消亡时间,借此反映一个植物物种的产生及消亡时期,结果发现:历史上新的被子植物总是“爆发式”出现,而且消亡的被子植物很少,仿佛它们能够“抵抗灭绝”。


对于被子植物在地球上的迅速繁盛及扩散,昆虫和其它动物可谓功不可没(特别是它们帮助植物有效地传粉使得群体基因多样性得以扩大)。此外,被子植物基因组的高度重复也造就了其形态多样性和代谢多样性。2009年1月DePamphilis在American Journal of Botany上报道:在许多较原始的被子植物如睡莲(water lily)、木兰(magnolia)里存在许多同步发生的重复基因,但在Amborella里却没有,说明在Amborella分离之后、睡莲出现之前曾有一次基因扩增事件;由此认为,多倍化是产生新基因、推动进化的有利力量。此外,人们还发现在eudicot(真双子叶植物)起源过程中可能还有一次基因扩增事件,在被子植物的进化史上存在着诸如此类的“扩增热点”。

2009/04/13

物种形成十七问

Speciation

Andrew P. Hendry. Speciation. Nature 458, 162-164(2009)



问:物种是真实存在的吗?
答:是的,但是作为分类学上角度上的“种”也有人类的主观意像在里面。

问:生物学家是如何描述“物种”的?
答:区别物种的一系列法则最好能适用于整个生物界。许多人热衷于此,目前有关法则达到数十种,不过普遍被大家接受的是“生物学物种概念(biological species concept,BSC)”

问:什么是“生物学物种概念”(BSC)?
答:BSC认为物种是一个独立繁殖系,不同物种之间存在生殖隔离。但这一法则并不总是适用:例如约有25%的植物与10%的动物能与(至少一种)其他物种杂交;广义的BSC认为物种是在自然条件下能保持自身遗传稳定性的群体,故不同物种间少量基因交流的允许的。

问:BSC遇到了什么困难?
答:有2个问题:(1)BSC不适用于地理上相隔离的物种,如果人为地让两物种相遇则不能体现自然情形。(2)BSC不适用于无性繁殖和已灭绝的物种。

问:一个群体怎样才能成为一个新的物种?
答:物种的形成与其说是“质变”不如说是“量变”,我们的注意力应集中在什么力量推动了speciation,而不是费尽心思地去划清物种间界限。这样一来我们也不必担心未来某一天我们的孩子还是不是人。

问:世界上有多少物种?
答:根据林奈双名法命名的物种约150万种,当然还有更多的物种有待发现。而且要知道现存的物种只是一小部分,绝大多数物种已经灭绝了。

问:新种形成需多长时间?
答:一直以来认为新种形成是很缓慢的,至少需要数百万年,但也不完全如此,例如东非维多利亚湖里的数百种丽鱼就是在约15000年内形成的。此外有人甚至认为一个物种只需经过数十代繁衍,子代之间即可产生显著的生殖隔离,当然想要获得稳定的、不可逆的生殖隔离需要花费更多的时间;但有一点毋庸置疑:因多倍化而形成的新种确实是“瞬间的”。

问:物种形成的动力来自何处?
答:以前认为这是源于随机遗传差异逐代积累,近来认为自然选择推动差异扩大。现在认为生物体对不同环境的适应导致不同物种的形成,也就是所谓的ecological speciation过程。

问:什么是ecological speciation?
答:当时达尔文就有这种观点了。原本是同一个物种的两个群体由于分别适应了两种不同的环境,最后形成了两个不同物种,因为它们的杂交后代是无法适应任何一种环境的。例如达尔文在加拉帕哥斯群岛上发现的不同雀类就是如此。现在许多人认为ecological speciation是造就生物多样性的主要原因。

问:物种形成必须经过生殖隔离吗?
答:可以说是,也可以说不是。一直以来人们普遍认为想在同个地域形成新物种是不可能的,(即使存在一些反对意见也迅速被埋没了),直到最近有人通过数学建模的方法才发现同域物种也是可能形成的。

问:为什么反对同域物种形成的声音如此强烈?
答:因为异地物种形成的观点已深入人心,除非有人把它彻底推翻了。

问:竞争是否有利于同域物种的形成?
答:一定程度上来说是的,特别是同一地域两个群体对资源的争夺可能导致生态位相互分离。问题的关键在于竞争要激烈到什么程度。

问:杂交是否有利于同域物种的形成?
答:是的,特别是在植物中更常见,主要是通过异源多倍体的形式形成新物种。但也不是完全如此,还可以采用人工杂交的方法,例如人们已经通过人工杂交的方法培育出了不少太阳花的种间杂种还有蝴蝶的种间杂种,并没有经过一个多倍化的过程。

问:是否存在“成种基因”?
答:在基因水平上研究物种形成机制,问题的关键在于形成生殖隔离需要什么类型的基因,多少数量的基因。有人报导称已确定了一些“成种基因”,但是按照ecological speciation的观点来看,“成种基因”应该是一系列的基因,所以说这个问题还有待于商榷。

问:人类能促进物种形成吗?
答:可以。我们可以提供各种新的、分离的生境从而加快启动ecological speciation过程。

问:人类能限制物种形成吗?
答:可以。有时几个“分支种”之间虽然有了一些差异但是尚未形成生殖隔离,如果人为地将它们聚合到一起,是可以延缓乃至防止新物种形成的。

问:关于物种形成,未来的发展趋势如何?答:以后,我们的目光应该逐渐从研究物种形成的调节转移到推动物种形成的驱动力上,例如自然选择的作用,特别是性选择的作用。而且,在基因水平上研究物种的形成将揭示更多的奥秘。