生命科学名著 遗传学:从基因到基因组(原书第六版) Genetics: From Genes to Genomes (Sixth Edition) 〔美〕L. H. 哈特韦尔 M. L. 戈德伯格 J. A. 菲舍尔 L. 胡德 编 于军 主译 生命科学名著 遗 传 学 从基因到基因组 (原书第六版) Genetics: From Genes to Genomes (Sixth Edition) 〔美〕L. H. 哈特韦尔 M. L. 戈德伯格 J. A. 菲舍尔 L. 胡德 编 于 军 主译 北 京 遗传学-文前-3校.indd 1 2020/9/17 17:25:08 固宇: 01-2018-4303号 内容简介 《遗传学:从基因到基因组) (第六版)强调了遗传学的核心概念以及 前沿发现、现代工具和分析方法,这些将使遗传学继续向前发展。第六版的 作者们共同修订了每一章,不仅努力提供最新的信息,而且努力对复杂的概 念提供连续性和尽可能清楚的解释。本书展示了大学本科遗传学教学的一种 新尝试,也反映了作者们当前对生命分子基础的认知。 本书适合作为生命科学和医学相关专业的大专院校及研究所本科生和研 究生的教材使用,也可以用于从事相关专业的科研人员对遗传学、分子生物 学、基因组学和生物信息学等相关知识结构体系的系统更新。 圄书在版编目 (CIP)数据 遗传学:从基因到基因组:原书第六版/ (美) L且晗特韦尔(Leland Hartwell) 等编:于军主译.一北京:科学出版社. 2020.9 书名原文: Genetics: From G四.esωGenomes(Six也Edition) (生命科学名著) ISBN 978-7-03-063868-7 1.①遗… 1①L…②于… 1lI.<I温传学 w.①Q3 中国版本图书馆CIP数据核字(2019)第288298号 责任编辑:罗静岳漫宇刘晶/责任校对:严娜 责任印制:吴兆东/封面设计:刘新新 4半夺 去 后民 μ 出版 北京东黄城根北街16号 邮政编确: 1∞717 hltp:llwww.seiencc亨.com 此意4.量t'P刷et低劣司 印刷 科学出版社发行各地新华书店经销 • 202畔9月第一版开本: 889x 1194 1/16 2020年11月第二次印刷印张: 44 呈18 字数: 1611删 定价: 298.00元 (如有印装质量问题,我社负责调换) 《遗传学:从基因到基因组》(原书第6版) 译者名单 主 译:于 军 副 主 译:任鲁风 郭海燕 俞育德 其他译者:崔 丽 蔡亦梅 崔 鹏 吴双秀 李亚楠 刘文文 林 强 贾善刚 隋 硕 王绪敏 王琛瑜 高 静 杨 宇 节俊尧 魏清泉 蒋莉娟 刘元杰 王 翀 遗传学-文前-3校.indd 3 2020/9/17 17:25:08 关于作者 利兰·哈特韦尔(Leland Hartwell)博士是西雅图弗雷德·哈奇森癌症 研究中心主席、主任,也是华盛顿大学的基因组科学教授。哈特韦尔博士的主 要研究成果是鉴定控制酵母细胞分裂的基因,包括那些在分裂过程中必需的基 因,以及那些保证基因组复制保真度所必需的基因。随后,其研究发现许多相 同的基因控制人类的细胞分裂,并且常常是癌细胞改变的位点。哈特韦尔博士 是美国国家科学院的成员,曾获得阿尔伯特·拉斯克基础医学研究奖、盖德纳 基金会国际奖、遗传学协会奖章和2001年诺贝尔生理学或医学奖。 迈克尔·戈德伯格(Michael Goldberg)博士是康奈尔大学的一名教授, 教授遗传学入门和人类遗传学。他是耶鲁大学的本科生,在斯坦福大学获得 生物化学博士学位。戈德伯格博士在巴塞尔大学(瑞士)和哈佛大学的生物 研究院进行博士后研究,在帝国理工学院(英国)学习时获得了美国国立卫 生研究院Fogarty高级国际奖学金,在罗马大学(意大利)全职工作时获得 Cenci Bolognetti基金会的奖学金。他目前的研究是利用果蝇遗传学工具和青蛙 卵细胞提取物的生化分析来探讨其作用机制,来保证有丝分裂和减数分裂过 程中细胞周期的适当进展和染色体的分离。 遗传学-文前-3校.indd 1 2020/9/17 17:25:08 珍妮丝·菲舍尔(Janice Fischer)博士是得克萨斯大学奥斯汀分校的一 名教授,她是一名获奖的遗传学老师和生物教学办公室主任。她在哈佛大学 获得生物化学和分子生物学博士学位,并在加州大学伯克利分校和麻省理工 学院怀特海德学院进行博士后研究。在她的研究中,菲舍尔博士首先用果蝇 来确定组织特异性转录是如何工作的,然后研究泛素和内吞作用在发育过程 的细胞信号转导中的作用。 李·胡德(Lee Hood)博士在约翰·霍普金斯医学院获得医学学士学 位,在加州理工学院获得生物化学博士学位。他的研究兴趣包括免疫学、癌 症生物学、发育和生物仪器的发展(例如,蛋白质测序仪和自动荧光DNA测 序仪)。他早期的研究在揭示抗体多样性之谜中发挥了关键作用。最近,他 提倡生物学和医学的系统方法论。胡德博士教授过分子进化、免疫学、分子 生物学、基因组学和生物化学,并与人合著了生物化学、分子生物学和免疫 学的教科书,以及人类基因组计划专著《编码密码》(The Code of Codes)。 他是最早倡导人类基因组计划的人之一,并指导了一个联邦基因组中心对人 类基因组进行测序。胡德博士目前是位于华盛顿西雅图的多学科系统生物学 研究所的主席(和联合创始人)。胡德博士获得了多种奖项,包括阿尔伯 特·拉斯克医学研究奖(1987年)、国家教师协会杰出服务奖(1998年)和 勒梅尔逊/麻省理工发明奖(2003年)。他是2002年京都高级生物技术奖的获 得者,这个奖项是为了表彰他在发展蛋白质和DNA合成仪以及测序技术方面 的开创性工作,这些技术为现代生物学提供了技术基础。他深入参与K-12科 学教育。他的爱好包括跑步、爬山和阅读。 遗传学-文前-3校.indd 2 2020/9/17 17:25:09 前言 1. 作者序 ● 分子遗传学:DNA的结构,以及它如何指导蛋白 质的结构。 遗传学这门科学的历史还不到150年,但它在此 ● 数字分析和基因组学:最近的技术,允许综合分 时间内取得的成就却令人叹为观止。格雷戈尔·孟德 析整个有机体的基因集及其表达。 尔(Gregor Mendel)在1865年首次将基因描述为抽 ● 人类遗传学:基因如何影响健康和疾病,包括 象的遗传单元,但他的工作被忽视了,直到1900年又 癌症。 被重新发现。1910~1920年,托马斯·亨特·摩尔根 ● 生命形式的统一:将来自许多不同生物的信息合 (Thomas Hunt Morgan)和他的学生提供了实验证据, 成为相干模型。 证明基因存在于染色体中。到1944年,奥斯瓦尔德·艾 ● 分子进化:生物系统、整个有机体和群体进化及 弗里(Oswald Avery)和他的同事已经确定了基因是由 分化的分子机制。 DNA构成的。1953年,詹姆斯·沃森(James Watson) 这种整合方法的优势在于:学完这本书的学生们将 和弗朗西斯·克里克(Francis Crick)发表了他们开创 对遗传学有全面的认识,正如当今学术界和企业界的研 性的DNA结构。值得注意的是,不到50年之后(2001 究人员在实践中体会的那样。这些科学家正在迅速改变 年),一个国际研究小组破译了人类基因组中30亿个核 我们对包括我们自己在内的生命体的理解。最终,这项 苷酸的序列。20世纪的遗传学使鉴定单个基因成为可 重要的研究可能实现替换或纠正有害基因的能力——正 能,也使人们对其功能有了更多的了解。 如作为学者的阿奇博尔德·加罗德(Archibald Garrod) 今天,科学家们能够通过对许多生物的基因组进行 在1923年将这些基因称为“天生的新陈代谢错误”,以 测序而得到大量的遗传学数据。对这些数据的分析将使 及后来导致多种癌症的诸多遗传改变。 我们更深入地了解基因、蛋白质和其他复杂的分子间的 相互作用,以及这些分子所在的分子网络之间的相互作 3. 遗传学的思维方式 用。寻找分析这些数据的新方法和工具,将是21世纪遗 现代遗传学是一门分子水平的科学,但对其起源和 传学的重要组成部分。 原理的了解是必需的。为了鼓励遗传学的思维方式,我 我们的第六版《遗传学:从基因到基因组》强调了 们首先回顾孟德尔定律的原理和可遗传的染色体基础。 遗传学的核心概念、前沿发现、现代工具和分析方法, 然而,从一开始,我们的目标就是将生命体水平的遗传 这些将使遗传学继续向前发展。 学与基本的分子机制相结合。 第六版的作者们共同修订了每一章,不仅努力提供 第1章通过总结我们所探索的主要生物学主题,介 最新的信息,而且是为了对复杂的概念提供连续性和尽 绍了这种整合的基础。在第2章中,我们将孟德尔关于 可能清楚的解释。 豌豆性状遗传的研究与酶的作用联系起来,酶决定了豌 2. 我们的焦点——一种整合的方法 豆是圆的还是皱的、是黄的还是绿的等。在同一章中, 我们指出所有生物遗传模式的相关性。第3~5章包括孟 《遗传学:从基因到基因组》展示了大学本科遗传 德尔定律的扩展、遗传的染色体理论、基因连锁和定位 学教学的一种新尝试,也反映了作者们当前对生命分子 的基础。从第6章开始,我们关注DNA的物理特性、突 基础的认知。 变,以及DNA如何编码、复制和传输生物信息。 我们整合了如下内容: 从第9章开始,我们进入DNA分析的数字化革命, ● 形式遗传学:基因传递的规则。 了解现代遗传学技术,包括基因克隆、PCR、微阵列和 i 遗传学-文前-3校.indd 1 2020/9/17 17:25:09 前言 高通量基因组测序。我们探索生物信息学——一个新兴 起来的。 的分析工具,如何帮助发现基因组特征。这部分将在第11 ● 统一风格的遗传学 本书有一个友好而引人入胜 章结束,并以案例研究的形式介绍人类疾病基因的发现。 的阅读风格,帮助学生掌握整本书的种种概念。 对分子和计算机技术的理解使我们在第12~15章中 这种写作风格为学生提供了整本书的种种概念。 讨论染色体特性,并在第16、17章中为基因调控分析提 ● 可视化遗传学 本书利用高度专业化的艺术程序 供信息。第18章描述了科学家可以随意操纵基因组的最 整合了照片和线条艺术,提供了一种最具吸引力 新技术,第用三于部研分 究遗包传括信基息分因析治疗在内的实际目的。第19 的遗传学视觉呈现方式。我们的特色插图图例将 章描述了在分子水平上使用遗传学工具来揭示真核生物 复杂的过程分解成循序渐进的插图,使学生更容 人类基因组的序列甚至注释只是一个开始。人类 发育的复杂相互作用。第20章解释了我们(cid:11847)对(cid:14013)(cid:16309)遗α传学的α理 易理解。所有图例都以一致的颜色主题呈现—— 解和分子遗(cid:13434)传(cid:10899)(cid:17411)技(cid:17621)术的发展是(cid:12314)如(cid:16723)何(cid:16302)使我们了(cid:12314)解(cid:16723)(cid:15198)癌(cid:13984)症并(cid:21477)在(cid:13397)(cid:10587)某(cid:15952) RefSe例q为如识,别所和有分析代许表多磷个酸体盐基基因团组的之都间的是差相异同提的供颜了色, ζ α2 α1 参考标记,因此我们可以理解表型变异的遗传基础,例 些情况下治愈癌症的。 所有代表mRNA的也是相同的颜色。 (cid:17310)(cid:10692) αα/αα 4 100% 如,找到导致对人类健康广泛和不同影响的核苷酸差 第21章和第22章讨论了群体遗传学,并讨论了分子 ● 易学习 我们的目的是将最前沿的内容解释给学 异。在第11章中,我们描述了遗传学家目前如何查看多 工具如何提供物种亲缘性信息,以及随着时间的推移分 生。对一些复杂的插图进行了修改和分解,以帮 (cid:12819)(cid:17434)(cid:16302)(cid:16272)(cid:10969)(cid:17280) αα/α– 3 75% 个个体的基因组来追踪遗传变异并鉴定导致重要性状的 子水平上的基因组变化。此外,我们解释了生物信息学 序列差助异学。生理解这个过程。图例已被简化,只强调最 如何与群(cid:17076)体(cid:12080)(cid:17652)遗α(cid:11129)传(cid:17457)学(cid:12036)相结合,以了解α复–/α–杂性状的遗传和追 重要的观点,在整本书中,主题和例子的选择都 (cid:14359)(cid:16459) - (cid:14594)(cid:11305)(cid:14359)(cid:16459) (cid:12307) (cid:12307) 2 50% 习题精解 踪人类祖先。 αα/– – 集中在最重要的信息上。 在本书中,我们展示了该领域一些天才研究者的科 ● 解决问题 培养解决问题的能力对每个遗传学专 学推理—H(cid:17457)b—(cid:11305)H(cid:7625)(cid:16496)从β(cid:17465)4孟(cid:7626)(cid:14359)(cid:12435)(cid:16459)德(cid:10498)尔 - 到沃森和克里α–克/– –,再到1人类基因25组% Ⅰ. 下业图的显示学了生来来自说U都C是SC至基关因重组浏要览的器。的作屏者幕在截每图一,章的 考察了人类基因组的MFAP3L基因编码区(注意: 计划的合作者们。我们希望学生读者能看到,遗传学不 hg结38是尾指都人精类心基制因作组了Re习fS题eq集的,第3让8版学)生。提如高果解你决不问题 仅仅是一(cid:10912)(cid:14359)组(cid:12080)(cid:16459)α -数(cid:11129) (cid:17443)(cid:17457)据(cid:15329)(cid:12036)和事实,也是依赖– –于/– 杰– 出人0士贡献的0人% 记的得能浏览力器。如何展示基因组,请参阅图10.3底部的 类获得的宝贵资源。 ●图 习标。题精解 这些包含完整答案的专题材料可为学 图10.21 与α珠蛋白簇中基因缺失相关的地中海贫血。保留的 chr4 (生q33在) 逐步解决问题的过程中提供参考。 第三部分 遗传信息分析 4. 利于α学基因生拷贝学数越习少,的地特中海点贫血的临床症状就越严重。 ● 课S后cale习题 涉及各1种0kb各样难度的hg问38题超过700个, chr4: 170 000 000 170 010 000 170 020 000 170 030 000 这些难题都能培养出出Ref色Seq的 Gen解es决问题的能力。这 (cid:11847)(cid:14013)(cid:16309)α α 随着样人蛋文类白本基δ的珠因蛋数组白字的在成序胎分列儿变甚中至得表注越达释来[只综越是述重一见要图个,1开0让.始1人9(。兴c人)奋类]的。 MM些FFAA问PP33LL题是按章节组织的,为了便于教师和学生使 (cid:13434)(cid:10899)(cid:17411)(cid:17621) (cid:12314)(cid:16723)(cid:16302) (cid:12314)(cid:16723)(cid:15198)(cid:13984) (cid:21477)(cid:13397)(cid:10587)(cid:15952)是,R珍efS妮eq丝为在·识某菲别些和舍地分尔中析作海许为贫多教血个科症体书中基,作因导者组致,之疾间同病的时症差承状异担的提数突供字变了改编变 MFAP3L M用FA,P3L每个章节的难度都是逐步增加的。由迈克 ζ α2 α1 辑的参角考色了标α!记簇珍,一妮因末丝此端我将的们L确C可保R以或重理β要簇解的内表部文型的本变L和异CR的数。遗字L传配CR基件的础之缺,间失例可的以 来源:U尔niv·ersi戈ty o德f C伯alifo格rnia和 Ge珍nom妮e P丝roj·ect, 菲http舍s://g尔eno完me全.ucs修c.ed订u 的在线 (cid:17310)(cid:10692) αα/αα 4 100% 一致如性,。导找致到严导重致的对地人中类海健贫康血广,泛因和为受不影同响影的响基的因核簇苷中酸没差有一 a. 用近似的术语描述MFAP3L的基因组位置。 学习指南和解决方案手册第6版提供了解决所有 异我。们个在基付第因出11被了章正很中确,大转我的录们努[描力例述来如了帮,遗助参传见学学图生家1目对0.前2遗0如(传何c学)查有]看更。多事深实 b. 基因是沿着着丝粒到端粒,还是从端粒到着丝粒 (cid:12819)(cid:17434)(cid:16302)(cid:16272)(cid:10969)(cid:17280) αα/α– 3 75% 个个上体,的这基些因患组者来中追的踪所遗有传珠变蛋异白并基鉴因定都导是致完重整要的性,状而的基因 的章方节向结转尾录问?题的详细策略分析。 入的了解。这本书的许多特点都是为了这个目的而发展 序列簇差的异一。端外侧的DNA缺失提示LCR的存在及功能。 c. 数据表明有多少种MFAP3L mRNA的可变剪接 (cid:17076)(cid:12080)(cid:17652)α(cid:11129)(cid:17457)(cid:12036) α–/α– (cid:14359)(cid:16459) - (cid:14594)(cid:11305)(cid:14359)(cid:16459) (cid:12307) (cid:12307) 2 50% 形式? 习题精解 αα/– – 基本概念 d. 数据说明MFAP3L有多少种不同的启动子? H(cid:17457)b(cid:11305)H(cid:7625)(cid:16496)β(cid:17465)4(cid:7626)(cid:14359)(cid:12435)(cid:16459)(cid:10498) - α–/– – 1 25% Ⅰ. 下考● 氧察图胚气了显胎,人示和有类了胎助基来儿于因自形确式组UC保的的S血生CM基F红长A因蛋的P3组白胚L浏基比胎览因成/胎器编人儿的码形从式屏区母更幕(亲紧注截的密意图血地:,液结中合 e. M种F可AP变3L剪基接因形显式示的编m码R了NA多编少码种哪不种同蛋的白蛋质白?质不?哪同 获得足够的氧气。 形式的N端、C端或中间位置是否有所不同?估计 hg38是指人类基因组RefSeq的第38版)。如果你不 (cid:10912)(cid:14359)(cid:12080)(cid:16459)α -(cid:11129) (cid:17443)(cid:17457)(cid:15329)(cid:12036) – –/– – 0 0% 记● 得珠浏蛋览白器基如因何在展发育示过基程因中组的,顺请序参表阅达图受1α0簇.3底和部β簇的中的 每种蛋白质含有多少个氨基酸。 解答 图基标因。座控制区(LCR)调节。 图10.21 与α珠蛋白簇中基因缺失相关的地中海贫血。保留的 ch●r4 ( q地33中) 海贫血是由突变引起的血液疾病,这些突变消除 a. 该基因位于人类4号染色体的长(q)臂上:该位 置由图的顶部的染色体展示(染色体组型图)上 或减少来自其中一个基因簇的珠蛋白多肽,而另一个 α基因拷贝数越少,地中海贫血的临床症状就越严重。 Scale 10kb hg38 基c因hr4簇: 的产1物70 不000受 00影0 1响70。 01这0 00些0突170变 02包0 0括00任17意0 03基0 0因00组簇 的细红色垂直线表示。这个位置(在一个叫做 RefSeq Genes M中FA特P3L定基因或LCR区域的缺失。 4q33的染色体分带)距染色体4小臂(从编号开始 样蛋白δ珠蛋白在胎儿中表达[综述见图10.19(c)]。 MFAP3L 处)的端粒大约170Mb长度;该染色体的总长度 在某些地中海贫血症中,导致疾病症状的突变改变 MFAP3L 接MF下AP3L来的内容 约为190Mb。 了α簇一末端的LCR或β簇内部的LCR。LCR的缺失可以 来源:University of California Genome Project, https://genome.ucsc.edu b. 基因内含子内的箭头表明转录方向是从4q的端粒 导致严重的地中海贫血,因为受影响的基因簇中没有一 a. 用近确似定的人术类语基描因述组M的F核AP苷3L酸的序基列因和组许位多置其。他物种的基 到4号染色体的着丝粒。 个基因被正确转录[例如,参见图10.20(c)]。事实 b因. 基组因对是于沿我着们着理丝解粒生到物端学粒是,一还个是十从分端重粒要到的着里丝程粒碑事 c. 数据指示出四种mRNA的可变剪接形式。在以下 上,这些患者中的所有珠蛋白基因都是完整的,而基因 件的。方我向们转现录在?知道细胞和生物体生命的基本蓝图,我们 部分中,我们将从上到下依次标为A~D。 簇的一端外侧的DNA缺失提示LCR的存在及功能。 c也. 数已据经表知明道D有N多A的少差种异M如FA何P导3L致 m不R同N物A的种的可出变现剪。接 d. 数据表明有两个启动子:一个大致位于170 037 000 形式然?而,“人类基因组”这一术语在许多方面缺乏精 位置,并且允许初级RNA的转录可选地剪接以产 基本概念 d确. 数性据。说人明不M是F完AP全3L相有同多的少克种隆不;同相的反启,动我子们?每个人都拥 生mRNA B和D。另一个大致在170 013 000位置,并 ● 胚胎和胎儿形式的血红蛋白比成人形式更紧密地结合ii e有. M自F己AP的3L人基类因基显因示组编,码这了个多基少因种组不与同所的有蛋其白他质人?类哪密切 且导致初级RNA的可变剪接以产生mRNA A和C。 氧气,有助于确保生长的胚胎/胎儿从母亲的血液中 相种关可,变但剪也接是形独式特的而唯mR一N的A。编正码是哪个种体蛋基白因质组?之不间同的差 e. 数据表明MFAP3基因可编码两种不同但密切相关 获得足够的氧气。 异形导式致的我N们端每、个C人端拥或有中自间己位独置特是而否唯有一所的不表同型?。估计 每种蛋白质含有多少个氨基酸。 ● 珠蛋白基因在发育过程中的顺序表达受α簇和β簇中的 基因座控制区(LCR)调节。 解3答08 ● 地中海贫血是由突变引起的血液疾病,这些遗传突学变-文前消-3除校.indd 2 a. 该基因位于人类4号染色体的长(q)臂上:该位 2020/9/17 17:25:09 置由图的顶部的染色体展示(染色体组型图)上 或减少来自其中一个基因簇的珠蛋白多肽,而另一个 的细红色垂直线表示。这个位置(在一个叫做 基因簇的产物不受影响。这些突变包括任意基因组簇 中特定基因或LCR区域的缺失。 4q33的染色体分带)距染色体4小臂(从编号开始 处)的端粒大约170Mb长度;该染色体的总长度 接下来的内容 约为190Mb。 b. 基因内含子内的箭头表明转录方向是从4q的端粒 确定人类基因组的核苷酸序列和许多其他物种的基 到4号染色体的着丝粒。 因组对于我们理解生物学是一个十分重要的里程碑事 c. 数据指示出四种mRNA的可变剪接形式。在以下 件。我们现在知道细胞和生物体生命的基本蓝图,我们 部分中,我们将从上到下依次标为A~D。 也已经知道DNA的差异如何导致不同物种的出现。 d. 数据表明有两个启动子:一个大致位于170 037 000 然而,“人类基因组”这一术语在许多方面缺乏精 位置,并且允许初级RNA的转录可选地剪接以产 确性。人不是完全相同的克隆;相反,我们每个人都拥 生mRNA B和D。另一个大致在170 013 000位置,并 有自己的人类基因组,这个基因组与所有其他人类密切 且导致初级RNA的可变剪接以产生mRNA A和C。 相关,但也是独特而唯一的。正是个体基因组之间的差 e. 数据表明MFAP3基因可编码两种不同但密切相关 异导致我们每个人拥有自己独特而唯一的表型。 308 译者序 这是一本由四位遗传学家共同主编的遗传学教科 思想,还要揭示这些事件的可能分子细节在“拉-达思 书,其中的两位我曾常常称为“Lee”的作者(Leland 想”体系下的实质性归宿和关联,从而判断谱系系统变 和Leroy都可以昵称为Lee)曾是我在华盛顿大学(西雅 演(evolution)的证据和规律。以单一基因和单一物种 图)做博士后研究时的“老师级”同事。李兰·哈特维 为研究对象的时代,简单的从基因到基因组的研究模式 尔(Leland H. Hartwell)和李洛·胡德(Leroy Hood) 也都会一去不复返了,等待我们的是生命科学的另一卷 两位博士又都是我的博士后导师梅纳·欧森(Maynard 书,以及与经典遗传学相辅相承、贯通一线的新思想体 V. Olson)博士的同时代人,也是我的好友、同事;后 系。这个体系其实已经萌芽很久了,我们缺的不是思想 者还曾是我的系主任(建立时称为分子生物技术系,即 家,而是突破性技术、分析工具和第一手数据,三者在 Molecular Biotechnology;后来改为基因组科学系,即 目前都是瓶颈,没有10~20年的时间是很难通过的。 Genome Sciences)和在该校基因组中心工作时的上司。 其次是主线上下游和主线之间相互贯通的问题,也 他们都和欧森博士一样,目睹或经历了“人类基因组计 就是从基因型到表现型的关联,以及对这些关联性在分 划”的准备期和执行期的工作,肩负过将遗传学领入基 子水平上的详尽理解和解析。目前,在这样的思维范 因组学时代的责任。 畴里面最为人熟知的有两个概念,一个是“多系统生 如果我们可以将遗传学划分为三个时间段——前 物学”(systems biology),另一个是所谓的“组学” DNA时代(1953年之前,以DNA双螺旋结构的发现为 (omics)。因为工作的关系,我曾有幸在20世纪90年 标志)、前HGP时代(1953~2003年;以人类基因组 代初的时候当面向多系统生物学概念的提出者胡德博士 计划,即The Human Genome Project的实施和完成为标 请教个中的端倪,他的解释就是营造多学科科学家合 志)和后HGP时代(2003年之后),那么,这本书显 作的环境,包括分子生物学、数学、计算机科学和工程 然是总结了前两个时代遗传学的历史积累,也体现了 学等领域的专家,大家来共同解决生物学面临的新问 “从基因到基因组”的过渡,这便是我们翻译这本书的 题。而后,他也确实践行了自己的这个思维框架,在西 第一个初衷——不是画句号,而是全面传承。我们翻译 雅图成立了著名的多系统生物学研究所(the Institute of 这本书的第二个初衷是要推动从物种基因组学到谱系基 Systems Biology)。但是,就科学本身而言,这样的解 因组学的转折,呼唤学科汇聚和整合,促进新假说、新 释其实更像是提出实现这个科学构建目标的途径,而非 理论、新领域和新学科的创立及发展。这个新的转折, 新学科的内涵。这就促成了我后来提出的“五流”思 从根本上讲,是沿着两条主线,逐一地解决生命科学的 维框架和“通生学”(holovivology;holo,全;vivo, 诸多核心问题,并布局贯通生命科学横向、纵向和相互 活)的命名。“五流”思维框架与多系统生物学、各种 交织的核心理论体系,验证、践行这些理论的实验技术 组学及其组合等其实是有诸多不同的。第一是将生命 体系。 现象在机制层面分为“五流”,即信息流、操作流、 首先是主线问题,也就是拉马克主义(Lamarc- 平衡流、分室流和可塑流,并宣示五流之间的逻辑关 kism)和达尔文主义(Darwinism)两条主线在新知识 系为:生命始于操作(started with operation),源于平 体系中的地位问题。我们没有必要历史地回顾“拉-达 衡(originated from homeostasis),传于信息(inherited 思想”的起源和沿革,因为其中不仅有诸多的模糊概 through information),长于分室(grew as compart- 念,也充斥着非科学因素和局限于时代的种种谬误;但 ments),生于可塑(survived on plasticity)。第二是 是却一定要厘清“中心法则”和“RNA世界”两个假 将五流与生物学的诸多细分学科交叉关联起来,包罗 说的最后妥协,要建立物种起源其实是生命的自组装和 四大板块(plates):①信息流+可塑流:基因型-表型 自组织的过程,也是基因、分子机制和细胞过程起源的 板块;②操作流+平衡流+分室流:分子细胞板块; iii 遗传学-文前-3校.indd 3 2020/9/17 17:25:09 译者序 ③平衡流+分室流:生理解剖板块;④五流通悟:多系 的基础和限速步骤,而在这个多维的空间里,离子键 统整合板块。第三是将各个层面可无限细分的组学限定 (如氢离子和无机盐离子)和氢键(如水分子和生物大 在五流框架之内,例如,转录组和蛋白质组都属于操作 分子)都会被赋予作用力和空间概念,因为非共价相互 流,代谢组是平衡流的一部分,个体发育和细胞分化同 作用只有从7PN(氢键)到150PN(生物素和其结合蛋 属分室流等。第四是界定了遗传学和表观遗传学—遗 白间的亲和力)(PN,pico-newton)的动态范围—— 传学是信息流的学问,表观遗传学则是关乎其他四流的 只有令人惊讶的20倍左右的变化。分子间的弱力相互作 学问;前者或将突破达尔文主义的主线,而后者则将诠释 用构成了生命细胞内的自组装和细胞间自组织的基础。 拉马克主义的现代思考和寻证。总之,生命科学“合久必 然而目前我们的生物学家对其的理解仍处在茫然不知所 分”的时代即将过去,“分久必合”的时代正在到来。 云的状况,而这仅仅是操作流科学命题的一部分。我们 再有就是关于未来的生物学,即通生学的内涵,这 对平衡流的研究还刚刚起步,就是所谓的代谢组学和信 门学问将解决生物学历史遗留的诸多核心问题。例如, 号转导网络——连接基因与体内所有的物质及其量变的 RNA起源将取代DNA起源的假说,那么真核生物就不 关系。新问题和新生态将呼唤新的技术革新和革命。 会是由细菌演变而来的了。谱系演变、分子机制和细 毫无疑问,我们的确面临一个生命科学发展的伟大 胞过程的演变将辗压物种演变研究,达尔文“丢失的 转折。当我们面对过去200年来所积累的知识,或思考 连接”(missing links)将被合理地解释。基因组的突 取舍,或扣问真伪,或感叹弗如,或拍案惊奇的时候, 变也不再被假定是随机的,其中相当的部分会被与拉 我们看到未来了吗?我们仔细地想象未来的“新面孔” 马克主义的一些分子原理挂钩,如CpG序列密码和甲基 是什么样了吗?准备好拥抱未来了吗?不怕,我们只有 化位点密码。显然,演变的模式也不再会是一种,会 一个选择,那就是——走进新境界,看到新视野,运用 有鲁棒性(robustness)、易变性(variability)、多样 新的思维框架。我们首先要吃透经典,吃透遗传学,不 性(diversification)和复杂性(complexity)等多种模 要偏离这个轨道;同时,我们更要开拓眼光,思考书本 型。基因结构的研究不仅会按谱系分类,也会在操作流 背后的故事,要欢迎新事物,推敲新原理(这些原理一 层面寻求细胞水平的分子机制制约。可塑性研究还会将 定比这本书里说的更深、更难懂、更必要)。我作这个 细胞的应激反应、细胞能量的平衡等与免疫系统和认 序的目的就是给大家打造一个“书架”,为未来留下空 知、衰老等生命诸多可塑性现象联系起来。在这样的研 间,让大家有序地摆放新学到的知识。未来的50~100 究范式下,遗传学将是通生学五流之信息流部分的前奏 年是生命科学天翻地覆的时代,各位准备好了吗?请从 和引言。其实,在我们获取并分析人类和诸多大型动植 这本书开始。 物基因组序列的那些不眠之夜和兴奋的瞬间,一部新的 在这里,我们首先要特别感谢科学出版社的鼓励、 遗传学续集和与之平行的五流分卷就已经诞生了。 耐心和支持,使这个项目能够顺利完成。我还要感谢任 最后是技术革命和新研究生态问题,亦即破解和认 鲁风博士将这个项目扛下并主持任务的分解和完成,感 识生命原理的生态(ecosystems)和地貌(landscapes) 谢所有参与翻译和校对的各位专业人士。感谢总校对郭 将实现从宏观生物圈到微观生物圈,再到实观生物圈的 海燕博士、崔丽女士和负责图片处理的李亚楠女士! 全面拓展。通生学就是要突破微观生物圈的限制,增加 时空的维度,实现单细胞、单分子的实时、定量参数测 于 军 定。各学科领域新技术前沿的汇聚将成为实观技术发展 2019年7月28日北京 iv 遗传学-文前-3校.indd 4 2020/9/17 17:25:09