造物主的工具:它创造了生物体!

在地球上繁衍了几十亿年的生物,从病毒、细菌到高等动、植物,千姿百态,结构越来越复杂,功能越来越完善,行为越来越多样。是什么决定着生物体的复杂结构和功能?大量的信息储存在哪里?它们是如何运作的?这始终是人们热切探求的问题。

自20世纪50年代沃森和克里克提出著名的DNA双螺旋结构模型以来,人们对生命本质的认识一下子进入到分子水平。接着三联体密码和密码表的发现;基因作为DNA分子中编码蛋白质区域的确定:遗传信息流从DNA→RNA→蛋白质这样的“中心法则”的提出:基因表达调控的操纵子模型的构建,以及DNA半保守复制被证实,构成了一幅遗传信息存储、表达、调节、复制到实现复杂功能的完美图画。这时,人们似乎感觉到生物体的复杂结构和功能是由基因决定的。

造物主的工具:它创造了生物体!

自从20世纪80年代末人类基因组计划一出现,破译人类遗传密码就成为当代人们共同关心的科学问题。随着人力、财力的大量投入,公共数据库中DNA碱基数目呈指数增加,大约每14个月翻一番。它超过了电脑芯片计算能力的增长速度。到2003年初,DNA碱基数目已超过170亿。从1995年科学家破译了全长为180万核昔酸的嗜血流感杆菌基因组以来,截至2004年8月31日,己公布的全基因组序列有215套,其中古细菌19套,真细菌164套,真核生物32套,包括:酵母、线虫、果蝇、拟南芥、水稻、小鼠等的完整基因组。正在测序中的有原核生物344套,真核生物235套(见htttp://igweb.integratedgenomics.com/GOLD/)。2001年2月在Nature和Science杂志上同时发表了由国际人类基因组组织(HUOO)和Celera公司分别完成的人类基因组序列及其初步的分析,给我们展示了关于人类基因组的一系列较以往更为细致、更为精确的信息。已经被测序的人类基因组含有约29亿碱基,其物理图谱覆盖率为96%,序列覆盖率为94%。这些序列中含3万~4万个编码蛋白质的基因。基因组的1.1%为外显子,24%为内含子,75%为间隔序列。截至2004年9月3日,NCBI数据库中的dbEST收集了5679423多万个代表人类基因表达小片段的EST(expressed sequence tags)数据,它已超过人类基因数目的100倍。近年来增长最快的数据是人类的SNP(single-nucleotide polymorphisms),它代表着不同人种以及正常人和某些病人基因组中碱基的差异。现已有300多万个人类非冗余SNP位点。这表明人的基因组中平均每1000个碱基就有1个碱基差异。但在已知SNP中,仅有不到1%的SNP造成蛋白质的变化。同时,由于生物芯片、二维凝胶电泳和测序质谱技术的高速发展和广泛应用,功能基因组和蛋白质组的数据也己大量涌现。通过分析海量数据,科学家们很快就发现了一些重要事实:DNA上编码蛋白质的区域,也就是基因,只占人类基因组的一小部分,不会超过整个基因组的3%,其余97%左右的DNA序列的功能仍不大清楚,国际上科学家们习惯地把这部分DNA统称为“非编码DNA”或“Junk”DNA。通过对完整基因组的比较发现,低等的生物,像病毒、细菌等只有少量的“Junk”DNA,而高等的动、植物则含有大量“Jun”DNA,它们甚至占据着基因组的大部分。这就是说,伴随着生物从简单到复杂、从低级到高级、从信息少到信息多,非编码DNA不断增加。它意味着”Junk“DNA可能蕴涵着生物体复杂性的信息。通过对完整基因组的比较还发现,线虫和果蝇的基因数(约1.2万-1.4万)仅是酵母(约6000)的两倍,而高等哺乳类,如人、鼠的基因数(约3万)也仅是线虫和果蝇的两倍。基因数目的增加似不能反映生物复杂性的增加。研究还发现人、鼠之间的基因差别仅为1%,但人、鼠之间的表型差别却如此的显著,这说明基因不足以反映生物的全部复杂性。SNP是代表基因组DNA上的差别的,现已发现的300多万个人类非冗余SNP位点98%以上分布在非编码区,这也显示哺乳动物中表型变化主要与非编码区有关。

造物主的工具:它创造了生物体!

近年来大量的新实验结果表明,非编码DNA是可以表达的,其表达产物是许多对生命过程富有活力的信息载体。小RNA(small RNA)的研究就是最突出的例子。Science周刊2001、2002连续两年将“small RNA”评选为该年度全球科学十大进展,而2002年更将其作为进展的第一位。这表明非编码DNA的研究已引起国际上的广泛关注。上世纪90年代美国Dartmouth医学院Victor Ambros小组,以线虫为对象用基因打靶技术研究某些基因对其发育的影响,找到了一个对发育有明显干扰的基因。通常线虫要通过四个幼虫阶段才能成熟,这个基因的突变使其只停留在第一阶段。令人们惊奇的是这个基因并不编码任何蛋白质,而是编码一个小RNA。以后的研究证明,这样的小RNA基因在果蝇、软体动物、鱼类以及人体中都存在。有研究报道在大肠杆菌中已经发现几十个小RNA基因,在小鼠的脑组织中发现了200多个小RNA基因。现在科学家们正系统地从真菌到植物、从无脊椎动物到哺乳动物,甚至也从低等的原核生物中寻找小RNA基因。2002年小RNA研究又取得了新的进展。几组科学家研究了酵母和四膜虫这两种生物体中的RNA干扰现象,他们发现小RNA对染色质的形状有着极大的控制作用,即小RNA能够永久性关闭或删除一部分DNA(其机制现在还不了解),而不只是简单地使DNA暂时沉默。冷泉港实验室的Shiv Grewal、Robert Martienssen等发现缺失平常的小RNA的裂殖酵母细胞不能在中心粒正确形成异染色质,从而破坏了正常的细胞分裂。弗吉尼亚大学的DavidAllis等和罗切斯特大学的Martin Gorovsky均等也发现,小RNA能引发四膜虫(tetrahymena)细胞分裂期间的DNA缺失或序列重组。这些新发现只是小RNA研究领域的一小部分,科学家们正试图确定成百种小RNA各自的功能:确定哪些物种含有哪类小RNA以及它们在该物种中的行为是什么?小RNA的出现重新唤起了科学家们对“RNA世界”的重视及对“生命起源于RNA分子”这一命题的兴趣。有的科学家认为成千上万非编码蛋白质的RNA分子组成了巨大的分子网络,调节着细胞中的生命活动,它们与蛋白质一蛋白质相互作用网络相对应,好比宇宙学中的暗物质与亮物质。因此,如果说DNA的编码区带有组成人体具体材料(蛋白质、结构RNA等)的信息,那么大量的非编码区应当包含把这些材料按照特定的时间、空间安置,以组成完整个体的四维调控信息。这种信息应有动态特征,并能产生时间标度,因而是更为复杂、更为丰富的。它们可能不采取三联体的编码方式;也可能不按照现行组成基因的方式构造信息单元;为了产生时间标度,信息单位间可能形成非线性的网络,等等。这时,人们似乎感觉到生物体的复杂结构和功能不仅仅是由基因决定的,也是由基因组中大量的非编码信息决定的。

长期以来令人惊异与困惑的是:生命并不是一群分子的堆积,它是高度有组织的。生物分子组成细胞,细胞构成组织,组织形成器官并进而构成系统。细胞核与细胞质有作用、细胞与细胞间有联系、组织与组织间有分工、器官与器官间有协同,因此一个正常生存的生物个体是极为有序的,是多层次的,是动态的。它是经过亿万年的进化才由无序到有序,由简单到复杂的。因此,生物体的复杂性并不仅仅表现在DNA信息结构的复杂性上,还表现在这些信息的实施与运作的规律上。那么,生物体的复杂结构和功能是如何产生与维持的呢?非平衡热力学理论指出平衡态是无序的,而非平衡态才可能是有序的。正常的生物体是“活”的,它能生长、发育、繁殖和新陈代谢,是一个不断地与外环境进行物质和能量交换的开放系统。生物体是远离热力学平衡的,生物体中大量的过程是不可逆的,因而生物才能生存、能进化,是有序的。这说明,非平衡是有序的起源,或者说是信息的起源。因此,遗传信息实施与运作的复杂性首先表现在与环境的相互作用上。

另外,这种复杂性也表现在生物体的层次性和整体性上。通过人类基因组计划的实施,人们得到了各种生物的基因图谱,它给了我们前所未有的大量信息。但是,仅有这类静态信息仍不能说明生物(生命)是怎样工作的,它又是如何活起来的。为此,我们必须了解基因是如何按照特定的时间、空间进行表达的,表达量有多少。不了解伴随着生物的生长发育、基因表达状况的变更,也就无法确切地说明生命的过程。同时,我们还需要了解基因网络,需要了解生物分子反应的调控途径和代谢途径等。知道了这样的一个个系统、一个个调控单元还不够,还要把所有的单元之间的关系藕联起来,整合在一起,也就是要把发生在基因表达层次、蛋白质折叠层次、酶催化层次、特定蛋白质在细胞里的定位层次、生物大分子代谢层次等等的事件整合起来。这样才能模拟生物系统的行为和用来预测如果这个系统一旦受到了剌激和外界的干扰将如何演变。近年来,系统生物学就是基于这样的观念而产生的。系统生物学的观点认为:通过不同层次关联建立起来的复杂系统,并不是简单系统的叠加。这个复杂系统会出现一些突现性行为、突现性规律,就是出现一个单独系统所不能反映的新行为。到这里,我们应该说生物体的复杂结构和功能不仅仅是由基因决定的,也不仅仅是由基因组中大量的非编码信息决定的,还是由生物体各个层次的复杂、动态相互作用决定的。

最后,对人类来说还涉及思维、意识、学习、记忆的复杂性问题。对于这类生命活动高级形式的了解还需要更长的时间、更多的努力。

造物主的工具:它创造了生物体!

陈润生,1941年6月生于天津,现为中国科学院生物物理研究所分子生物学研究中心研究员、博士生导师,中国生物物理学会常务理事,中国物理学会理事,国际人类基因组组织(HUGO)会员,国际数据库组织(CODATA)生物大分子专业组委员,国际纯粹及应用物理学会(IUPAP)生物信息学专业委员会委员;曾任国际纯粹及应用物理学会(IUPAP)生物物理专业委员会委员(1992-1996);中国生物物理学会秘书长、副理事长。1964年毕业于中国科学技术大学生物物理系。1985-1987年获洪堡奖学金作为访问学者在德国纽伦堡大学从事生物大分子电子结构研究。此后不断地在香港科技大学、中文大学,日本大阪大学,德国纽伦堡大学,美国洛杉矶加洲大学、哈佛大学等从事合作研究。1996年10月在日本筑波召开的第十五届国际科学技术数据委员会(CODATA)大会上应邀发表题为“从DNA序列数据到蛋白质三维结构”的“小谷正雄”纪念演讲,同时获得“小谷正雄”奖。

20多年来在生物信息学领域进行了系统的研究,共发表学术论文约100篇。


分享到:


相關文章: