基因组:人类自传(精装)

更多详情

内容简介: 组成人类基因组的23对染色体的图谱绘制是新世纪最重大的科学发现,它提出的问题与它解答了的问题同样多。这些问题将深刻地影响我们对疾病、寿命和自由意志的思考方式。这些问题将影响你的后半生。这个让人难以置信的突破会有什么后果?《基因组》在这方面提供了超群的洞察力。通过在每一对染色体上选择一个新近发现的基因并讲述其故事,马特.里德利叙述了我们这个物种及其祖先从生命出现之初到未来医学边缘的历史。他探讨了由于基因组的图谱绘制而出现的科学、哲学以及首先问题,将帮助你理解这个科学里程碑对你、对你的孩子、对人类意味着什么。

目录: 前言
1号染色体生命 / 1
2号染色体物种 / 14
3号染色体历史 / 30
4号染色体命运 / 47
5号染色体环境 / 58
6号染色体智力 / 69
7号染色体本能 / 85
XY染色体冲突 / 101
8号染色体自身利益 / 115
9号染色体疾病 / 129
10号染色体压力 / 140
11号染色体个性 / 153
12号染色体自装配 / 166
13号染色体史前 / 178
14号染色体永生 / 188
15号染色体性别 / 199
16号染色体记忆 / 212
17号染色体死亡 / 225
18号染色体疗法 / 236
19号染色体预防疾病 / 250
20号染色体政治 / 263
21号染色体人种优化 / 278
22号染色体自由意志 / 293
参考文献 / 307

前言: 人类基因组是一套完整的人类基因,位于23对独立的染色体里。将其中的22对依照尺寸大小进行排序,并分别命名为1~22号染色体,1号最大,22号最小。剩下的那对是性染色体,在女性体内是两条大的X染色体,在男性体内则是一条大的X染色体和一条小的Y染色体。就尺寸大小而言,X染色体处于第7号和第8号染色体之间,Y染色体则是最小的。
就基因数量而言,“23”这个数目没有任何特殊的意义。许多物种拥有更多的染色体,与人类关系最近的近亲猿类就是这样的,也有很多物种的染色体要少一些。而相似的基因或有着类似功能的基因也不一定聚集在同一条染色体上。几年前我通过笔记本电脑和演化生物学家戴维·黑格(David Haig)聊天时,他说最喜欢第19号染色体。我很惊讶。他解释道,那条染色体上有各种调皮捣蛋的基因。在那之前我从来没有想过染色体竟然还有不同的性格,归根结底,它们不过是基因的组合。但是黑格的话却在我心中植入了一个想法,一直以来都挥之不去:人类第一次探索人类基因组,发现了各种细节,并将其一一展现出来。为什么不试着从每条染色体上都选择一个最具代表性的基因,讲述一下基因组的故事呢?普里莫·莱维(Primo Levi)在他的自传体短篇小说集里就用类似的方法讲述了化学元素周期表,每个化学元素是一个章节,分别讲述了他接触到该元素的那段时期里发生的事情。
于是,我想到:人类基因组本身就是一部人类的自传,它从生命诞生之时起,便用“基因语言”记录了人类和人类祖先所经历的世事更迭与变迁。有些基因从最早的单细胞生物诞生起,就没有发生变化;有些基因是当我们的祖先还是线虫的时候出现的;有些基因是当我们的祖先还是鱼的时候出现的;有些基因因为近期的一场流行病,变成了目前的形态;还有些基因可以用来研究过去几千年里人类迁移的历史。从40亿年以前到最近几个世纪,人类基因组谱写了人类的自传,记录了人类历史中的每个重要时刻。
我写下这23对染色体的名单,并在每条旁边列出对应的人类本性中的一些重要内容。这是一个缓慢而艰难的过程,我开始寻找那些具有代表性的基因,有时无法找到合适的基因,有时找到了合适的基因却发现它位于其他染色体上,真是令人沮丧。如何排列X和Y染色体是我遇到的另一个难题,在这本书中,我根据尺寸大小把它们放在了第7对染色体之后—对于X染色体而言,这再合适不过了。
乍一看来,本书似乎颇具误导性,似乎我在暗示1号染色体最早出现,其实不然。抑或是我在暗示11号染色体只与人类的性格有关,亦非如此。人类基因组里有6万~8万个基因,我无法一一道来,部分是因为截至本书成稿,只发现了不到8 000个(尽管这个数字还在以每月几百个的速度增加)。还有一部分原因是它们中的大部分主要负责人体生化反应,描述起来既枯燥又无味。
我要向大家展示的是人类完整基因组中的惊鸿一瞥,在基因组里最有趣的地方稍作逗留,看看它们告诉我们的关于人类自己的一些事情。我们这一代是幸运的,因为我们是阅读《基因组》这本书的第一批人。能够阅读基因组,意味着我们能够更好地了解人类的起源、人类的进化、人类的本性以及人类的思维,这将超过迄今为止科学带给我们的关于人类的所有知识。它将给人类学、心理学、医学、古生物学和几乎所有其他学科带来一场革命。这并非宣扬基因就是一切,或者基因比其他任何因素都重要。但是,基因的重要性是毋庸置疑的。
本书的主题不是关于人类基因组工程—基因定位与测序技术的,而是讲述了这一工程有何发现。2000年6月26日,第一份人类完整的基因组草图的绘制完成,仅仅用了短短几年时间,我们就从对于人类基因几乎一无所知变得无所不知。我坚信,我们正在经历着人类智力活动史上无与伦比的伟大时刻。同时,也有人发出了不同的声音。他们认为,仅用基因无法涵盖人类的全部。我并不否认这一点,每个人所拥有的远远超过一份遗传密码。但在此之前,人类基因几乎是一个谜,我们将是第一批破解这个谜团的人—我们即将揭晓重要的新答案,但也将面对更多的新问题,这也是我希望在本书中呈现给读者的。
导论
前言的第二部分作为本书的导论。在这个部分中,我把与基因和基因作用机制有关的主题以词汇表的形式展现出来,并加以解释。希望读者快速浏览这部分内容,以便在阅读本书的过程中遇到不清楚的术语时,能够返回此部分查询。现代遗传学术语无数,错综复杂。本书力求少用技术术语,但有些还是无法避免的。
人体有大约100万亿个细胞,大多数细胞直径不到1/10毫米。每个细胞内部都有黑色的一团,叫作细胞核。细胞核里有两套完整的人类基因组(卵细胞、精子细胞和血红细胞除外。精子细胞、卵细胞只有一套基因组,血红细胞内没有基因),其中一套来自母亲,另一套来自父亲。从理论上讲,每套基因组都有相同的23对染色体,上面有相同的6万~8万个基因。但实际上,来自父亲和母亲的基因对上常常有着细小的差别,正是这些差别决定了人的眼睛是蓝色还是棕色。人类在生育时,来自父亲和母亲的染色体经过交换和重组,便将一套完整的基因组传给了下一代。
想象一下,“基因组”是这样的一本书:
● 全书共23章,每章都是一对染色体。
● 每章都包含几千个故事,每个故事都是一个基因。
● 每个故事由不同的段落组成,称为外显子。段落之间是广告,名为内含子。
● 每个段落由词语组成,叫作密码子。
● 每个词语由字母构成,叫作碱基。
如果基因组是一本书,那么这本书有10亿个单词,长度是本书的5 000多倍,或者是《圣经》的800倍。如果按照每秒一个词、每天8小时的速度把基因组读给你听,需要100年才能读完。如果把人类基因组写下来,每个字母一毫米,则总长度堪比多瑙河。基因组可以看作巨型的文档、巨大的图书、超长的菜谱,其所有内容都收录在比针尖还小的细胞的细胞核内。
严格来讲,将基因组看作一本书不能算作一个比喻,因为它确实是一本书。一本书即一组数码信息,其内容是线性、一维和单向的。一个个小小的字母符号,按照特定的组合顺序,根据一定的规则,拼合成有意义的词汇,汇集成一本书。基因组也是这样的。不同之处在于,所有的英文书都是从左向右读,而基因组的某些部分从左向右读,某些部分又是从右向左读的,好在这两种情况不会同时出现。
(顺便提一句,这段之后,你将不会在本书中看到“蓝图”这个词了。原因有三。首先,我们读的是书。只有建筑师和工程师才使用蓝图,即便是他们,在计算机时代也开始放弃蓝图。其次,对于基因而言,“蓝图”是个很糟糕的类比。蓝图是二维的图示,而非一维的数字编码。最后,对于基因而言,“蓝图”的定义过于字面化,无法表达基因的内在对应关系。蓝图中的每一部分都对应着机器或建筑上的一个部分,但菜谱里的一句话并不对应蛋糕上要吃的那一口)。
英文书是用英文单词写成的,英文单词长短不一,由26个字母组成。而整个基因组是由三个字母的词写成的,且仅用了4个字母:A、C、G和T(分别代表腺嘌呤—Adenine,胞嘧啶—Cytosine,鸟嘌呤—Guanine和胸腺嘧啶—Thymine)。而且,它们不是写在平面的纸张上,而是写在由糖与磷酸组成的长链上。人们将这条长链称为DNA分子,碱基就附着在长链的侧面,像螺旋的阶梯一样。每条染色体是一对非常长的DNA分子。
基因组是一本非常聪明的书,它懂得在合适的条件下复印自己、读出自己。复印的过程叫作复制,读出自己的过程称为翻译。基因组之所以能够复制,是因为它的4个碱基拥有一种独特的属性:A总与T配对,G总与C配对。所以,一条单链DNA将所有的T对应所有的A,A对应T,C对应G,G对应C,依此类推,通过A-T、C-G互补配对的方式进行自我复制。实际上,DNA的通常状态即为著名的双螺旋,由原来那条DNA链和与它互补配对的一条缠绕在一起形成。
这样,互补链再次进行复制,就把原来的内容带了回来。在这次复制中,序列ACGT变成了TGCA,在下一次复制中又被转录回原来的ACGT。这使得DNA能够无限制地复制下去,却永远携带同一套信息。
翻译的过程要更加复杂一些。首先,一个基因的内容经过相同的碱基配对程序被转录成一份副本,但这份副本并非由DNA构成,而是由RNA构成。RNA是一种与DNA区别非常细微的化学物质。RNA也携带一个线性密码,与DNA使用同样的字母,不同的是使用U代替DNA中的T,表示尿嘧啶。这个RNA副本被称作“信使RNA”,通过切除所有内含子并连接所有外显子的方式进行编辑。
之后,这个信使RNA与核糖体结合,核糖体是一种微小的结构,其自身的一部分也是由RNA构成的。核糖体沿着RNA移动,依次将由3个字母组成的密码子翻译成另外一个字母表,这个字母表代表着20种不同的氨基酸中的一种,每一种氨基酸由不同的分子带来,这类分子被称为转运RNA。这些氨基酸首尾相连,形成一条与密码子顺序一致的链条。当全部信息都被翻译之后,氨基酸链将自己折叠成一个特殊的形状(具体形状由其序列决定),便形成了蛋白质。
几乎身体里的所有东西,从头发到激素,不是由蛋白质构成的,就是由蛋白质制造出来的。每个蛋白质都是被翻译出来的基因。需要特别指出的是,一种名为酶的蛋白质对身体里的化学反应起到催化作用。甚至DNA和RNA分子本身的加工、复印、纠错和组装(复制和翻译)也是在蛋白质的帮助下完成的。蛋白质还负责基因功能的开启和关闭,它们将自己附着于基因内容起始处附近的启动子和增强子,从而实现对基因开关的控制。不同的基因在身体不同的部位被开启。
基因在复制时,有时会产生错误。偶尔会丢掉或错误地加上一个字母(碱基)。有时整个句子或段落会重复出现、丢失或次序颠倒。这些被称为突变。许多突变既无害处也无益处,例如,一个密码子被改成另一个拥有相同氨基酸含义的密码子。这是因为,总共有64个不同的密码子,但对应的只有20种氨基酸,这就意味着DNA中许多“词语”(此处指密码子)有着相同的含义。人类的每一代里会积累大约100个突变,因为人类基因组里有100多万个密码子,这看上去并不算多。但是如果突变发生在错误的地方,即使只有一个,也可能是致命的。
凡事皆有例外(也包括人类基因)。并非人类所有的基因都在这23对主要的染色体上—有很少一部分存在于名为线粒体的小球里,并且,很有可能线粒体还是自由存在的细菌时就是如此。并非所有的基因都是由DNA组成—有些病毒由RNA构成。并非所有的基因都能够形成蛋白质,有些基因被转录为RNA,但并不被翻译成蛋白质。这些RNA或者成为核糖体的一部分,或者成为转运RNA,从而直接发挥作用。并非所有的化学反应都由蛋白质来催化,有少量是靠RNA催化的。并非所有的蛋白质都来自某个单独的基因,有些是由不同的基因组合而成的。并非所有的64个由三个字母组成的密码子都能够用来确定一个氨基酸—其中三个用来下达终止指令。最后,并非所有的DNA都能够形成基因,大多数DNA的序列是重复或者随机的,很少或从来不被转录,即所谓的无用DNA。
了解完这些,让我们一起开启人类基因组之旅吧!