生命起源百年探索:进化论、信息论、热力学谁是主角?

|专题项目 作者:腾讯研究院 2021-03-01

作者:Natalie Elliot、郭瑞东(译)、刘培源(译)

探索生命起源问题的两条路径

       生命是如何起源的?科学家们已经研究这个问题几十年了,他们也发明了一些巧妙的方法来试图找出答案。科学家甚至试图利用达尔文的进化论(即生物学中最有力的理论)来回答问题。但是目前仍未得到一个满分的答案:因为他们将遭遇这个世界上最繁杂的理论迷宫,而这迷宫的终点是一个死胡同。
       当科学家寻找生命的起源时,他们通常有两个方向可以选择:或者通过地球上生活过的有机体的记录向前回溯,或者从前生命世界中某个假想的节点出发向后推测。
       通过第一条路,科学家跟踪化石记录,分析物种间遗传关系是如何分岔的;同时,他们搜寻地球化学遗迹,来推测远古生命在地球上的存在形式。在这条路的尽头,便是地球生命最古老的祖先。科学家将这个祖先命名为: LUCA,即最后普遍共同祖先(The Last Universal Common Ancestor)。LUCA被认为是地球现存所有生命的始祖。

图1:始于LUCA的系统发生树,分化出细菌(蓝)和古细菌(红),并共同进化出真核生物
       按照生物学家的推测:LUCA 是一个微生物或微生物群体,所有的地球生命都由此诞生。尽管科学家们(如 Heinrich Heine 大学的分子生物学家 William Martin 等)已经能够推断出 LUCA 基因图谱的某些部分,但他们还未得到一个完整的描述。他们也无法看到 LUCA 之外的生命形式:LUCA 不一定是第一个生命,或者在LUCA之前也许还有其他形式的生命存在。
       总而言之,科学家们认定,地球至少有一次,在某处涌现出来一个活系统,它就是LUCA。
       为了强调 LUCA 之前的任何生命目前都是不可知的,科学家将 LUCA 称为系统发生的事件视界(phylogenetic event horizon)。系统发生学是一门研究在整个进化过程中物种之间遗传关系的学科,科学家由此追溯生命的进化史。“事件视界”这个术语来自天体物理学,指的是黑洞周围的一个边界,在边界之内则逃逸速度大于光速。因为没有任何东西能够超越光速,所以我们无法亲眼目睹事件视界内的任何事件。LUCA 也是如此,它是生物学的“事件视界”,科学家无法用系统发 生分析追溯更早的生物记录。
       那接下来该怎么办?

生命涌现自化学

       尽管面对系统发生树的局限,科学家们仍然试图探索更早的过去,并从新的假设出发进行推理。例如,在20世纪20年代,苏联生物化学家 Aleksandr Oparin 和英属印度科学家J. B. S. Haldane 分别开始提出生命的化学起源理论模型,探讨生命如何从早期地球的物质中诞生。
       20世纪50年代,美国化学家斯坦利·米勒和哈罗德·尤里开始在实验室验证这些假设,他们试图证明,早期地球上的基本化学物质,可以自发生成简单的生物分子。

图2:米勒和尤里的烧瓶实验示意,简单的无机物最终形成了氨基酸
       首先,米勒和尤里创造了一个由他们认为存在于地球早期大气层中的气体组成的环境。然后他们通过电流模拟闪电。在这样的刺激下,他们实验的原始汤中产生了一系列简单的生物分子,其中包括构成生命的基本单元——氨基酸。
米勒实验指出,实验人员可以在实验室中创造一些早期生命的诞生条件。然而,这一努力却困难重重。最基本的,米勒和尤里无法模拟由这些简单构件形成复杂生物分子(如核苷酸、以及如更复杂的蛋白质和核酸)所需的条件。科学家之后提出假设,认为米勒所所设想的环境是错误的。
       从那时起,“无法自发用从地球原始汤中的基本化学物质中孕育出生命”成为共识。此后关于于生命起源理论数量激增,以至于似乎我们需要一组平行宇宙,才能验证所有的可能性。

来自进化论的启发

        无论科学家们采取何种途径来寻找生命的起源,大多数人都会借鉴查尔斯 · 达尔文在1859年《物种起源》中的思想来帮助解答。虽然达尔文不认为当时的科学可以直接解释生命起源,但他的许多观点成为了这个领域进步不可或缺的灵感来源。
       例如,达尔文的生命树比喻描绘了物种在进化过程中的呈现树状结构,这也开启了对系统发生树根部 LUCA 的搜寻。达尔文在《物种起源》中认为,可能所有在地球上生活过的有机生命都起源于某种原始形式,生命首先诞生于此。这让他的同时代人接受了地球生命只有一个起源的观点。

图3:原始汤假说认为生命起源于某个物质和环境条件合适的水域中,该假说在20世纪20年代正式提出,其思想来源于达尔文
       达尔文在1871年写给植物学家约瑟夫·道尔顿·胡克的信中推测,生命可能是在一个温暖的小池塘里形成的,里面有各种各样的氨及磷酸盐、光、热和电。这引发了此后大量的实验,探索诞生了生命的“原始汤”。
       最重要的是,达尔文的自然选择理论帮助研究者提出了一些假说,用以思考化学物质怎样组织成生命形式。自然选择的过程告诉我们,随着种群的繁殖和进化,那些最适应环境的物种会生存下来。许多研究者认为,自然选择也可以解释无生命物质是如何开始自组织成有生命形式的过程。如果新物种是通过自然选择出现的,那么可能就存在具有进化能力的生命化学前体物质——这种进化也许标志着生命的开始。
       圣菲研究所的理论物理生物学家 Chris Kempes 说:“使用达尔文的理论来弥合化学与生物学之间的鸿沟,需要以一种新的方式思考化学进化。”事实上,当今的研究者正在这样思考,这也显示了进化论的普适性。引人注目的是,1994年,美国宇航局采用了达尔文的定义来指导对宇宙中生命的研究:生命是一个能够进行达尔文进化的自我维持的化学系统。
       随着科学家们扩展达尔文进化论的指导范围,一些人质疑我们是否需要一个能超越它的新理论。对 Kempes 来说,进化论是研究生命起源的至高法则,但它可能不是我们需要的全部:进化论是一个法则,但可能还有其他法则。
       对于乔治亚理工学院的物理学家 Jeremy England 来说,达尔文进化论解释了地球上生命的进化,但我们最好还是接受需要一个更一般化的理论来解释为什么物质会自发地组织起来形成生命。事实上,科学家们在解决生命起源这一棘手问题时,已经深入到了进化过程的起点,试图扩展进化论的适用范围。在这个过程中,他们开始以令人惊讶的新方式看待生命。

从自然发生到信息遗传

       生命起源是容易还是困难?这个问题包含了一个悖论——自达尔文无意中重新点燃了探索之火后就一直存在的悖论。
       如果用19世纪后期的眼光看,生命颇为简单。它似乎能从任何地方突然长出来,尤其是在腐烂的物质中。肉上的蛆和谷物里的老鼠表明,生命的自然发生既不罕见,也不奇怪。

图4:巴斯德的鹅颈烧瓶实验,高温处理后的肉汤不会发生腐败(出现细菌),细菌来自空气
       与达尔文同时代、同处19世纪后期的法国生物学家路易斯·巴斯德试图证明这种观点是错误的。为了做到这一点,巴斯德分离出无菌的有机培养基,展示了没有生命凭空出现。经由此,他让人觉得生命的诞生是一件极其罕见的事情——看起来几乎不可能。巴斯德实验的影响是让许多同时代的人完全放弃了对生命起源问题的研究。
       然而,如果像达尔文同时代的人逐渐相信的那样,地球上并非一直存在生命,一开始没有,那么就至少发生过一次生命的自发涌现。
       但生命是怎样涌现的?20世纪中期,当 Miller 和 Urey 试图从化学汤中创造生命时,一个来自不同学科的人也迷上了这个问题。他就是物理学家埃尔温·薛定谔,在薛定谔帮助下,生命起源研究离开了化学汤实验,进入分子遗传学阶段。
       在1944年的著作《生命是什么?》中,薛定谔解释他之所以对生命着迷,是因为生命似乎与物理学家或化学家研究的“任何物质”都有着截然不同的行为。这并不是说生命不受物理定律约束——生命物质和其他一切物质受同样的定律支配。而是说从物理定律的角度看,生命非常奇妙。
       在封闭的物理系统中,熵随着时间的推移而增加:从统计学上讲,物质变得更加无序,因为有更多可能的方式使它变得无序,而非有序。而在生命系统中,事情并非如此:随着时间的推移,秩序和复杂性在增加。薛定谔想要解释这个事实是如何产生的。
       为了解释生命现象,薛定谔提出了有趣的想法:我们可能需要另一个定律或者概率,比如负熵。除此之外,薛定谔还认为通过确定生命如何通过复制延续下去,也许能到另一种解释。

图5:薛定谔在其经典著作《生命是什么?》中提出了假说:基因是一种非周期晶体
       生物体经由自我复制、变异,并通过上述过程来产生越来越复杂的结构,这种方式可以通过理解薛定谔所谓的“遗传物质”来解释。薛定谔认为最需要理解的是“活细胞最基本的部分”(即“染色体” ),这个部分的物质类似于“非周期性晶体”。薛定谔猜想,类似非周期性晶体的结构可能才是遗传的机制,也可能是生命有能力维持秩序和复杂性的源头。

       随着对遗传物质搜寻工作的展开,另一个人物提出了第二个关键的理论观点。即数学家克劳德·香农,信息论的创始人。在他1948年的开创性文章“通信的数学理论”中,香农试图解释通信的基本结构,并证明信息如何以二进制的形式编码和传输。对于香农来说,信息是一种对不确定性或意外的度量。

       我们可能认为通信传递的就是信息,但是,从香农的观点来看,信息是关于不确定性的——不确定性或意外越多,我们得到的信息就越多。某种程度上,信息是一个编码与解码系统,而编码和解码是分子遗传学的核心任务。但很快,香农的信息概念就帮助研究者建立关于生命起源的理论——这个巨大的惊喜甚至让薛定谔感到困惑。

       薛定谔的思想启发了詹姆斯·沃森和弗朗西斯·克里克。他们在化学家罗莎琳·富兰克林科研数据的帮助下发现了 DNA 的双螺旋结构。

       正如沃森和克里克在其里程碑论文《核酸分子结构:脱氧核糖核酸的结构》(1953年)的结束语中指出的那样,DNA 可以被视为所有生命的关键复制机制。他们写道:“我们也注意到,论文所假设的特定碱基配暗示了一种潜在的遗传物质复制机制。”

图6:沃森(左)和克里克(右)与他们的DNA双螺旋模型
       仅仅一个月后,他们发表了第二篇论文《脱氧核糖核酸结构的遗传学意义》(1953年)。在该文中他们注意到遗传物质似乎也能传递信息。用文章原话来说:“因此,似乎这些碱基的精确序列就是携带遗传信息的编码。”动物学家和科学史学家 Matthew Cobb 评论道:沃森与克里克并没有研究过香农信息论背后的计算和控制思想,但是他们有相似的直觉——信息是理解任何编码与解码系统的关键

信息编码视角下的

生命起源问题

       当然,沃森与克里克的发现对整个进化生物学,特别是分子生物学具有深远的意义。但它对生命起源研究的意义是什么呢?
       理解了遗传物质复制的机制,科学家们开始探索这样一种观点,即早期的生命演化,如果不是从第一个生命开始,那就是从自复制开始。然而困难在于,DNA 不可能是第一个自复制子——它不可能自发地从地球早期的化学物质中涌现出来。
       DNA一旦形成,它就携带了制造蛋白质所需的信息。这些蛋白质承担着生命的大部分功能性工作,从构建细胞到在器官之间传递信号。DNA 还依赖于酶这类特殊蛋白质,以便催化自复制反应。但是早期地球上并没有蛋白质,它们需要 DNA 才能产生。如果 DNA 和自我复制的蛋白质都不是一开始就有的,那么是什么分子开始了自复制过程?
       20世纪60年代,科学家开始考虑生命自复制过程启动者可能是核糖核酸,即 RNA。在生物体中,RNA 是帮助 DNA 将其信息转化为蛋白质产生功能性产物的中间物质。多年来,RNA 被简单地认为是传递 DNA 信息的信使,这样RNA的编码就可以翻译为功能性蛋白质。然而,新的RNA 实验表明,与 DNA 不同,RNA 可能承担复制所必需的模板及催化两种功能,而非单一催化功能。
       科学家们知道,就像 DNA一样,RNA 也可以携带信息;后续又发现RNA也可以像蛋白酶一样催化化学反应。在20世纪80年代,分子生物学家西德尼·奥特尔曼和化学家托马斯·切赫以及各自的研究团队在这方面取得了进展:他们各自独立地证明了 RNA 分子可以像酶一样起到催化作用。

图7:RNA世界假说认为生命进化早期没有蛋白质(酶),无机环境中首先涌现出具备自复制和催化能力的类RNA分子,然后演化出膜结构,最后才是DNA和蛋白质
       在发现 RNA 的这种催化特性后不久,科学家们开始更广泛地接受“RNA 世界”假说。在这个假说中,RNA 是一种早期的生命形式,能够催化自身信息的复制。然而,RNA 世界假说也受到了一系列问题的困扰。首先,即使实验人员证明 RNA 可以像酶一样工作,它们通常依靠外部酶来起始复制过程。此外,许多科学家现在认为,RNA 是如此不稳定,以至于它不能在前生命地球的极端温度下进行催化反应,并开启进化。
       关于谁是地球上最早的复制子(replicator),RNA 世界假说的对立理论近年来也开始出现。例如,2017年,科学家 Elizaveta Guseva、Ken A. Dill 和 Ronald N. Zuckermann 提出了一个理论:类蛋白质分子可能是最早的复制子
对 RNA 世界假说的挑战,表明科学家对生命的化学起源还远未达成共识。事实上,缺乏共识似乎正在驱使科学家们回到假设的开端,并提出更激进的新假说。

更激进的假说

       大约20年前,物理学家弗里曼·戴森在他的《生命起源》(Origins of Life,1999)一书中提出了一种双起源假说,以解释早期生命所必需的两个过程:新陈代谢与复制。戴森继承了微生物学家林恩·马古利斯的开创性工作,后者发现早期细胞生命至少结合了两种不同来源的生命成份,共同形成了有核细胞

图8:马古利斯的内共生理论认为现代真核细胞来自多种原始生命的共生,线粒体起源于好氧细菌,叶绿体起源于光合自养细菌
       对戴森来说,米勒和尤里的原始汤实验可以帮助科学家了解早期新陈代谢。RNA 世界为研究复制过程提供了可能的视角:“第一次新陈代谢的开始必定是基于类似蛋白质的分子,而首次遗传物质的复制过程是基于类似核酸的分子。”他把前者比作计算机硬件,后者比作软件。
       戴森认为,新陈代谢必须先于自复制出现,但两者对于机器来说都是必不可少的。与香农一样,戴森认为,生命的起源也是信息处理系统的起源
       自戴森之后,其他人也开始以不同的方式思考生命可能是如何出现的——思考得更加系统、更多地基于热力学、以及更一般化。
       威斯康星大学麦迪逊分校的植物学家兼实验生物学家 David Baum 强调,为了理解生命的化学起源,我们必须认真对待生命前化学系统巨大的复杂性。正如他所解释的:生命起源领域经常遇到挫折的原因之一,是人们常常把它当作一个单一问题,但事实并非如此。生命起源是一系列独立问题的总和。包含遗传物质的细胞系统(甚至更复杂的系统)并不是一下子从随机的化学反应中突然蹦出来的。
       Baum 解释说,在基因层面的生命起源实验中,有两个现象是关键。第一种现象是模板(templating):“一个由特定序列结构单元组成的分子,能够反过来间接促进精确序列的代代生成。”这个过程类似于信息系统,并且是实验者可以复现的。第二种现象是翻译(translation),这意味着理解 RNA 分子如何与蛋白质分子互作并控制其顺序。相比之下,翻译现象复杂且令人着迷,远远超出了现在的实验范围。
       虽然 Baum 谨慎地指出了目前的实验局限性,但他对在实验室中研究生命起源的前景充满希望。他认为任何实验人员都必须相信“生命没那么罕见”。这并不是说生命是一件简单的事情:“在进化过程中,容易的事情发生了,但偶尔,这些容易的事情以一种奇怪的顺序积累起来,产生出真正意外的东西。”在 Baum 看来,宇宙定律必然会产生生命,但是化学物质如何变成特定的生命系统,仍然是不可知的。我们可以说,生命早期的化学充满了香农定义的信息,即充满了惊喜。

热力学是生命的

第一性原理吗?

       物理学家 Jeremy England 从另一个角度看待生命起源问题。对他来说,生命的诞生一点也不令人惊讶:它自然而然地遵循着物理定律就发生了。在他的“耗散驱动适应性”(dissipation-driven adaptation)假说中,宇宙法则自然而然就会产生我们称之为生命的有序结构。

图9:MIT 物理学副教授Jeremy England在2013年提出了耗散驱动适应性的假说,把生命起源看做是热力学的必然结果
       England 的理论解释了薛定谔的挑战,即为什么生命不遵循封闭系统必然熵增的路径,以及为什么随着时间推移,生命反而变得更有序和更复杂。正如 England 在2014年的演讲及他的新书《Every Life Is on Fire》中阐述的,在具有强大能量来源(如太阳)的非平衡系统中,物质必然形成有助于消散能量的结构。对于生物来说,为了消耗能量而进行组织的最有效方式之一就是繁殖。
       根据 England 的理论,生命形式的复杂性之所以增加,不仅是因为生命受达尔文进化论影响,更重要的是生命必须能够更高效地消耗能量。按照 England 的说法:“用物理学的语言来思考进化,可以让我们找到适应性出现的新机制,而这并不一定需要达尔文的理论。
       另一些科学家,东京的地球生命科学研究所(Earth-Life Science Institute)的 Eric Smith 等人则认为,研究生命起源意味着将生物圈看成一个复杂的生物系统,以将其作为一个整体来研究。他表示:“生命状态的真实本质就在于此。”。对于 Smith 来说,生命起源研究的进化论框架经常引导科学家关注有机体的起源——这阻碍了对生命系统更广泛的思考。为了理解生命及其起源,Smith 认为,我们必须观察支撑生命本身的组织和化学结构。
       同时,亚利桑那州立大学的物理学家 Sara Walker 表示,为了理解生命,我们需要更直接地回到第一性原理。对于 Walker 来说,我们需要理解的一个关键原理是信息——我们需要比过去的遗传学家更深刻地理解信息。正如她所说:“有一种关于信息的物理学支配着生命系统”。目前,我们还不能很好地理解信息,但是如果我们开始理解信息是如何与物质相互作用的,我们将更接近于解释生命

探索起源,还是重新定义

       随着对生命起源研究进化论框架的扩大和修正,生命的定义也将扩大和修正。一旦科学家开始思考生命起源前的化学物质是如何自发地组织起来,生命和非生命之间的界限就开始模糊了。对于一些研究者(如进化生物学家 David Krakauer )来说,改变生命的定义是合适的。根据 Krakauer 的说法,对我们称之为生物的复制形式的关注使我们无法从生物学的角度思考我们面临的一系列令人着迷的涌现系统(Emergent system)——那些我们认为是活的东西

图10:圣塔菲研究所现任主席、进化生物学家David Krakauer,其“个体信息理论”研究,从信息视角梳理了个体生命的定义和分类
       Krakauer 认为,人们对“起源”有一种迷思——“你不能将原则的普遍性从原则的起源中分离开”。这是错的。这就好比说约翰内斯·古登堡为了复制《圣经》而发明了活字印刷机,所以它只能用在《圣经》上。事实上,印刷术对各种书籍都适用。同样,尽管薛定谔对化学中的复制感兴趣,但谁又能说在古腾堡的印刷场景下,复制遵循的不是相同的原则?研究生命起源的科学家最好找出生命和复制的普遍原则,而非仅仅关注地球生命的涌现历程
       在《生命是什么?》的结尾,薛定谔有一个意外转变,他似乎预见到了上述对生命的重新思考。为此,他冒险进入了“人类意识”领域。在结尾这部分,薛定谔回溯了古印度奥义书(Upanishads)的观点,认为个体意识只不过是一块收集记忆的画布,当这些记忆消失时,就没有死亡一说了。
       薛定谔写道,即使催眠师抹去了一个人的所有记忆,他也不会失去“自己”。这些记忆的内容是活生生的:相比年轻时的自己,你正在读的小说的主人公可能更靠近你的心灵,让你更熟悉,当然也更加鲜活 。因为这个世界在意识的画布上不断生成新鲜内容,所以从来没有任何“个人存在”的丧失值得我们感到痛惜。也永远不会有。

图11:人类文化的演化,已经具备了生物演化的一些特征:变异、遗传、自我复制……
       Krakauer 赞同薛定谔的许多观点。他认为生命有很多种形式,比如假使哈姆雷特还活着,计算机病毒和文化网络也可以被认为是生命形式。他还认为我们至今还未理解生命的原则。笔者问 Krakauer,他是否认为薛定谔在《生命是什么?》结尾的思考透露他是一个神秘主义者、挑唆者或其他。Krakauer 解释说,薛定谔对理解意识很感兴趣,他的观点并非神秘主义。并且, “薛定谔一直致力于寻找将文化进化与有机进化统一起来的原则。”简而言之,他也在寻求更广泛的生命法则。
       当我们研究自达尔文时代开始的生命起源探索时,会看到这个领域具有惊人的弹性——也许不同于它所研究的涌现生命系统:当理论研究遇到死胡同时,将自然地重新审视自己。这些推动生命起源研究的理论框架自身,以各种方式适应了达尔文的思想;现在它们正在超越达尔文,转向新的理论框架。
       这些框架使我们以不同的眼光审视生命:当我们在认识物质组织和复制的普遍方式时;当我们考虑跨计算和文化系统的信息传递,可能意味着新生命涌现时;当我们把生物圈整体作为一个有生命的系统时,就开始在那些看似没有生命的地方寻找生命。我们在地外行星或岩石冰缝中寻找生命迹象;亦或在文化迭代轨迹中看到生命的复制。我们寻找生命给我们带来惊喜的方式。而似乎恰恰就在我们对生命的看法开始符合我们试图构想的现实时,生命出现了

前沿杂志
互联网前沿61

2022年,从引爆AI作画领域的DALL-E 2、Stable Diffusion等AI模型,到以ChatGPT为代表的接近人类水平的对话机器人,AIGC不断刷爆网络,其强大的内容生成能力给人们带来了巨大的震撼。

2023-05-12

全站精选