发布网友 发布时间:2022-04-25 04:12
共1个回答
热心网友 时间:2022-07-21 02:05
人类基因组草图绘制完成后,23对染色体、30亿个碱基对这样的常识也开始为非专业人士所熟知,人类对自身遗传图谱的认识得到了很大的补充与修正。大概在2000年时,科学家还估计人类基因组中约有10万个基因,但不出5年这一数字已跌到2万~4万个,目前一种比较通行的说法是约2.5万个。这些基因所包含的DNA序列,大概只有人类基因组序列总长的2%。也就是说,人类生命蓝图中约有98%的信息似乎不属于什么基因,是无用的垃圾。然而,什么是基因垃圾呢?
地球上绝大多数生命以DNA为遗传物质,另有一些病毒使用RNA,没有别的方案——为什么是这样?科学家并不知道。他们急于寻找外星生命,哪怕只是细菌也好,一个重要原因就是想看看地球生命使用DNA是偶然还是必然。DNA由4种碱基也就是4种“字母”组成,分别称为A、T、C、G。在RNA中,字母T被换成了U。整个DNA双螺旋就像一条极长的、扭曲的梯子,梯子的两边各是一条由许多字母逐个连接而成的带子,每个字母与对面带子上相应位置的字母结合在一起成为一个梯级,称为“碱基对”。其中,只能A、T相互结合以及C、G相互结合,所以知道了DNA双链中一条的碱基顺序,另一条也就确定了,这两条链是互补的。
生物的遗传信息,就是DNA链上这些字母的排列方式。将蓝图转化为实际产品的过程,就是一段DNA根据其碱基序列合成出对应的RNA序列(转录),然后RNA序列信息指导氨基酸拼合形成蛋白质(翻译)的过程。生物体的生理机能,基本上都由蛋白质来完成,比如在血液中运送氧气、进行新陈代谢等等。可以说,DNA发出命令、RNA挥动鞭子,而蛋白质则是卖苦力的牛马。从DNA到RNA再到蛋白质的这个过程,就是生物学的“中心法则”。
能够最终形成蛋白质或者说“编码某种蛋白质”的这样一段DNA,就是我们传统意义上所说的“基因”。在人和其他生物体内,这样的基因都只占整个基因组的很小一部分,它们就像宝石一样零星地落在黑沉沉的荒野中。各基因之间是大片大片不能制造蛋白质的DNA序列,即“非编码序列”。生物学家们在很长一段时间里都认为,既然几乎所有具体的生理机能都要由蛋白质来完成,那么不编码蛋白质的DNA应该是没有用的,可以称为“垃圾DNA”。
除了性细胞,人体每个细胞里都有一整套DNA,每套DNA只有约2%的内容有用。在其他哺乳动物体内,比例也大抵如此。有些物种的基因组更加“精练”、垃圾更少,比如鸡的基因组大小只有人类的1/3、河豚则为人类的1/10,但它们的基因数量却与人类差不多。也有的更夸张,如洋葱的基因组有人类基因组的12倍那么大、阿米巴变形虫的基因组更是比人的基因组大200多倍。
人们对垃圾DNA的来源提出了多种解释,比如有一部分垃圾来自病毒。逆转录病毒是一类以RNA为遗传物质的病毒,其中我们最熟悉的是艾滋病病毒。它们侵袭宿主细胞时,会把自身的RNA转换成DNA插入基因组中,并跳来跳去大量复制。从DNA到RNA的过程叫转录,反过来就叫逆转录,这也是这类病毒的名称由来。逆转录病毒有的会致病、引起艾滋病或癌症等,也有的没有什么影响。在进化历程中,有许多逆转录病毒DNA留在了人类基因组里而成为垃圾。
还有一些垃圾DNA可能是死亡基因的遗骸,被称为“假基因”。科学家认为,它们原本是编码蛋白质的真基因,由于发生变异而失去功能被弃之不用。它们的序列与真基因非常相似,但有着细微差别,正是这些差别使假基因不能编码蛋白质。去掉假基因不会影响有机体的功能,偶尔某个假基因发生变化、死而复生倒可能造成麻烦。由于假基因的存在不增加或减少生物的生存优势,所以进化过程很难把它们从基因组里清除出去,就好像把东西扔到了垃圾桶里却没有人把垃圾桶拿出去清倒,结果在屋子里越积越多一样。假基因在生物基因组中大量存在,人体内就有约2万个,几乎与真基因的数量相当。
有证据显示,至少一部分垃圾DNA很像真正的垃圾,因为动物失去它们之后依然生活得很好。2004年10月,一组美国科学家在《自然》杂志上发表报告说,他们删除了小鼠基因组中超过100万个碱基对的非编码DNA(约占鼠基因组的1%),但并没有对这些小鼠的发育、寿命和繁殖造成可察觉的影响。在100多项评估基因活性的组织测试中,只有两项发现了差异。他们还培育出失去300万个碱基对的非编码DNA小鼠,也没有发现明显异常。