生物信息学(第二版) 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
生物信息学(第二版)电子书下载地址
内容简介:
本书主要介绍生物信息学基本概念、主要算法和常用工具。全书共15章,涵盖生物分子数据产生、数据库、序列联配、基因组拼接及其基因预测、系统发生树构建、组学数据(转录、三维、单细胞等)分析、群体遗传分析等,同时包括生物信息学统计与算法基础和计算机基础。每章(绪论除外)前均设计了思维导图,帮助读者 好地理解各章知识点和逻辑关系;每章后均安排了一篇以相关领域代表人物为主线的“历史与人物”短文,有助于读者理解学科发展脉络。书后还提供了丰富的生物信息学资源(主流软件工具和数据库),作为学习本书的辅助资料。
书籍目录:
目录
CONTENTS
第二版前言
版序
版前言
本书使用说明
致敬经典
第1章 绪论 1
节 生物信息与生物信息学 1
一、迅速增长的生物信息 1
二、生物信息学概念 2
第二节 生物信息学历史与展望 4
一、发展简史 4
二、应用领域 8
三、学科展望 9
习题 14
历史与人物“bioinformatics”之名的由来 14
第2章 生物信息类型及其产生途径 16
节 生物信息类型与测序技术 17
一、生物信息的类型 17
二、 代测序技术 18
三、第二代测序技术 20
四、第三代测序技术 25
第二节 组学数据及其测定 28
一、基因组 28
二、转录组 30
三、其他组学数据 35
第三节 蛋白质序列及其结构测定 49
一、蛋白质序列与蛋白质互作测定 49
二、蛋白质结构测定 51
习题 52
历史与人物 台高通量测序仪与罗斯伯格 53
第3章 分子数据库 54
节 分子序列数据库概述 54
一、分子数据库及其记录格式 54
二、数据库序列递交与检索 58
第二节 核苷酸序列相关数据库 61
一、核苷酸初级数据库 61
二、核苷酸二级数据库 65
第三节 蛋白质相关数据库 69
一、蛋白质序列与结构数据库 69
二、蛋白质功能域等其他数据库 73
习题 77
历史与人物 分子数据库与戴霍夫和戈德 78
第4章 两条序列联配及其算法 80
节 序列联配与计分矩阵 80
一、序列联配 80
二、计分矩阵 81
第二节 两条序列联配算法 87
一、Needleman-Wunsch算法 87
二、Smith-Waterman算法 91
第三节 BLAST算法及数据库搜索 93
一、BLAST算法 93
二、利用BLAST进行数据库序列搜索 94
三、序列相似性的统计推断 103
习题 105
历史与人物 序列联配算法与三个“man” 106
第5章 多序列联配及功能域分析 109
节 多序列联配算法 109
一、多序列全局联配算法 109
二、多序列局部联配算法 111
第二节 蛋白质序列功能域 115
一、功能域概念 115
二、功能域模型 116
第三节 熵与信息量 119
一、熵与不确定性 119
二、多序列联配结果的信息量估计 121
习题 122
历史与人物 基序、ClustalW与杜立特 122
第6章 系统发生树构建 124
节 系统发生树概述 124
一、系统发生树的概念 124
二、遗传模型 127
第二节 距离法 129
一、UPGMA法 129
二、Fitch-Margoliash法 131
三、邻接法 134
四、 小进化法 136
第三节 似然法 137
一、DNA序列的似然模型 137
二、基于 似然法建树 138
第四节 其他方法 141
一、 简约法 141
二、贝叶斯法 143
三、基因组组分矢量法 144
习题 146
历史与人物 邻接法、MEGA与根井正利 146
第7章 基因组调查、拼装与分析 148
节 基于字符串的基因组调查分析 148
一、基因组大小估计 149
二、基因组复杂度估计 149
第二节 基因组序列拼接与组装 151
一、基因组测序策略与步骤 151
二、基因组序列拼接算法 154
三、基因组染色体水平组装 163
第三节 基因组序列分析与比较 166
一、基因组序列构成分析 166
二、基因组可视化 174
三、比较基因组学分析 175
第四节 基因组重测序数据分析 181
一、分析流程与变异鉴定方法 181
二、泛基因组分析 185
习题 187
历史与人物 文特尔和帕夫纳的神来之笔 188
第8章 基因预测及其功能和结构注释 190
节 蛋白质编码基因预测 190
一、基因预测方法及其流程 190
二、隐马尔可夫模型预测方法 196
第二节 基因功能注释 199
一、基于已知基因和功能域数据 199
二、基于功能分类和代谢途径 200
第三节 蛋白质结构预测 202
一、蛋白质结构概述 202
二、蛋白质二级和三级结构预测 204
三、基因突变与蛋白质三维结构功能分析 209
习题 212
历史与人物 HMM、马尔可夫及其他 212
第9章 非编码RNA鉴定与功能预测 214
节 小RNA计算识别与靶基因预测 214
一、miRNA主要特征及计算识别 214
二、siRNA主要特征及计算识别 220
三、小RNA靶基因预测 223
第二节 长非编码RNA鉴定与功能预测 225
一、lncRNA鉴定与功能预测 225
二、circRNA鉴定与功能预测 229
习题 235
历史与人物 首届中国生物信息学终身成就奖 236
0章 基因转录与调控网络 238
节 转录组数据分析 238
一、转录组序列比对和拼接 239
二、基因表达分析 241
三、 基因可变剪接与融合 244
四、基因簇鉴定 249
第二节 甲基化分析 252
一、DNA甲基化 252
二、RNA甲基化 254
第三节 基因调控网络分析 256
一、生物网络 256
二、基因调控网络 259
习题 263
历史与人物 DNA自动测序仪、系统生物学与胡德 264
1章 宏基因组分析 265
节 16S rRNA等基因序列数据 265
一、质控与分析流程 267
二、物种多样性估计 269
三、群落结构分析 272
第二节 全基因组序列数据 275
一、分析流程及其主要工具 275
二、宏基因组拼接与物种注释 279
习题 284
历史与人物 16S rRNA、生命之树与乌斯 284
2章 新类型组学数据分析与利用 286
节 三维基因组 286
一、三维基因组数据标准化 286
二、染色质三维多级结构鉴定 289
三、三维基因组组装与可视化 292
第二节 单细胞组学数据 295
一、单细胞组学技术概况 295
二、单细胞基因组分析 297
三、单细胞转录组分析 299
第三节 基因组预测与选择 306
一、基因组数据与动植物育种 306
二、复杂性状的基因组预测与选择 311
第四节 其他 315
一、表型组之图像识别 315
二、合成生物学之基因组设计 323
三、翻译组 328
习题 331
历史与人物 深度学习“三剑客” 332
3章 群体遗传分析 334
节 群体遗传多态性与结构分析 334
一、遗传多态性及其估计 335
二、群体遗传结构分析 337
第二节 自然选择的统计检验 339
一、基于种内多态性的检验方法 341
二、基于种间分歧度的检测方法 345
第三节 种群历史的溯祖分析 347
一、溯祖理论与溯祖模拟 347
二、种群进化模型的溯祖测验 349
三、有效群体大小的溯祖估计 352
第四节 数量遗传学分析 355
一、QTL定位 355
二、全基因组关联分析 362
三、混池分离分析 369
习题 372
历史与人物 马莱科特和科克汉姆的“神器” 373
4章 生物信息学统计与算法基础 375
节 贝叶斯统计 376
一、贝叶斯统计概述 376
二、贝叶斯统计与生物信息学 379
三、图论与概率图模型 380
第二节 概率图模型 381
一、隐马尔可夫模型 381
二、贝叶斯网络 388
三、神经网络 391
第三节 机器学习算法 396
一、 期望算法 396
二、马尔可夫链蒙特卡罗方法 398
三、动态规划 400
四、遗传算法 401
习题 405
历史与人物 贝叶斯之谜 406
5章 生物信息学计算机基础 407
节 UnixLinux操作系统 408
一、系统特点及其结构 408
二、Linux Shell常用命令 409
第二节 计算机编程语言 411
一、计算机编程语言概述 411
二、Python语言与Biopython简介 413
三、R语言与Bioconductor简介 415
四、MySQL语言 415
第三节 其他 418
一、并行化 418
二、算法与画图 423
习题 426
历史与人物 Python语言与范罗苏姆 427
主要参考文献 429
附录1 生物信息学常用代码和关键词 430
附录2 生物信息学主要数据库与分析工具 435
附录3 生物信息学常用英文术语及释义 440
中文名词索引 441
英文名词索引 444
后记 447
作者介绍:
暂无相关内容,正在全力查找中
出版社信息:
暂无出版社相关信息,正在全力查找中!
书籍摘录:
第1章 绪论
我们处在一个激动人心的时代——基因组时代。科学的进步已使人类可以窥探生命的奥秘,甚至包括人类自身。人类基因组在世纪之交被人类自己破译了,这部由30亿个字符组成的人类遗传密码本已活生生地摆在了我们面前。与此同时,来自其他生物的基因组信息源源不断地从自动测序仪中涌出,堆积如山,浩如烟海。这些海量的生物信息主要由特殊的“遗传语言”——DNA的4个碱基字符(A、T、G和C)和蛋白质的20个氨基酸字符(A、R、N、D、C、Q、E、G、H、I、L、K、M、F、P、S、T、W、Y和V)写成。
Science杂志在2001年2月16日人类基因组专刊上发表了一篇题为《生物信息学:努力在数据的海洋里畅游》(“Bioinformatics—Trying to Swim in A Sea of Data”)的文章(Roos,2001),文章写道:“我们身处急速上涨的数据海洋中 我们如何避免生物信息的没顶之灾呢?”近年来高通量测序技术的出现,使数据海洋 添排山倒海之势。生物信息学便是使我们可以畅游数据海洋的一条“轻舟”(甚至“快艇”)。生物信息学是一门年轻的学科,它充满挑战和机遇,引人入胜。
节 生物信息与生物信息学
一、迅速增长的生物信息
近20年来,分子生物学发展的一个显著特点是生物信息的剧烈膨胀,且迅速形成了巨量的生物信息库。这里所指的生物信息包括多种数据类型,如分子序列数据(核酸和蛋白质)、蛋白质二级结构和三维结构数据等(详见第2章)。由测序仪等产生的大量核酸序列和三维结构数据被存储在各类数据库中,这些原始数据构成的数据库就是所谓的初级数据库(primary database);那些由原始数据分析而来的如功能区(domain)、二级结构、疏水位点等数据,则组成了所谓的二级数据库(secondary database)。
生物信息的增长是惊人的。近年来随着高通量测序技术的出现,核酸库的数据每14个月左右就要翻一番。2000年底, 公共核酸数据库数据超过了100亿个碱基对(GenBank Release 120,2000)(图1.1),2020年4月已达到4158亿个碱基对,如果再加上 加巨大的基因组测序数据(GenBank将其单独列为WGS类数据,7.8万亿个碱基对), 公共核酸序列数据已达到近8.2万亿个碱基对或14.8亿条序列数据。大量生物(包括人类自身)的整个基因组序列被测序完成或正在进行中,遍布世界各地的科研实验室或商业服务公司的高通量测序仪在日夜不停地运转,每天都有成千上万的数据被源源不断地输入公开或内部的生物信息库中。同时,由这些原始数据获得的蛋白质序列等数据信息,也被世界各地的分子生物学、生物信息学等学科领域的专家深入分析,进一步挖掘出重要信息(如功能域)并存入二级数据库中(详见第3章)。
迅速膨胀的生物信息给科学家们提出了一个新问题:如何有效管理、准确解读和充分使用这些信息?
二、生物信息学概念
生物信息学学科是在生物信息急剧膨胀的压力下诞生的。生物信息学的诞生和发展 早可以追溯到20世纪60年代,而“生物信息学”(bioinformatics)一词被人们认识则是在20世纪90年代(详见本章第二节)。
一般意义上,生物信息学是研究生物信息的采集、处理、存储、传播、分析和解释等的一门学科。它通过综合利用分子生物学、遗传学、计算机科学与技术,来揭示大量且复杂的生物数据所赋有的生物学奥秘。具体而言,生物信息学作为一门新的学科领域,它是把基因组DNA序列信息分析作为源头,在获得基因序列和蛋白质编码区的信息后,进行蛋白质功能、结构的模拟和预测等;然后依据特定蛋白质的功能进行必要的药物设计等一系列应用性研究。从生物信息学研究的具体内容来看,生物信息学应包括三个主要部分:新算法和统计学方法研究;各类数据的分析和解释;研制有效利用和管理数据的新工具。Claverie(2000)的描述给出了一个比较清晰的定义:“生物信息学是利用信息来理解生物学的一门科学,是一门探究基因组或蛋白质序列数据信息的学科。它涉及数据库的相似性搜索、序列间比较,或者基于已有知识对序列进行预测”。根据Wikipedia有关“bioinformatics”的词条解释,生物信息学是统计学和计算机科学在分子生物学领域应用的一门学科。20世纪80年代晚期,生物信息学主要集中在基因组学和遗传学领域,特别是基因组DNA大规模测序出现后。生物信息学的根本目标是增加对生物学过程的认识,具体而言,它 加注重发展和应用有效的计算方法(如模式识别、数据挖掘、机器学习算法和可视化技术)来达到这一目标。目前该学科主要的研究领域包括序列联配、基因预测、基因组拼接、药物设计和筛选、蛋白质结构预测、基因表达和蛋白质互作预测、全基因组关联和进化分析等。图1.2给出了生物信息学早期的一个“路线图”。
新的生物信息学分析软件都是商业化产品,不付费难以取得。“你 终还是需要具体的实验”。实验生物学家 羡慕生物信息学家,认为“他们只是敲敲键盘,然后便是写论文”,他们的研究结果只是一种试验结果的预测,是对实验研究的一种“支持”。在分子生物学研究中,固定的模式是先有某一假设,然后用某一实验去验证或支持这一 初的猜测。在生物信息学研究中,也同样进行着这一模式:有一无效假设(如某一序列在数据库中没有同源序列),然后进行实验(如搜索数据库)并验证,明确拒 还是接受无效假设(如该序列的确有或无同源序列)。这是一个标准的假设—实验模式。在其他学科中,计算科学已被作为深入理解科学问题的重要手段,而在生物学领域还没有形成这样的共识。“生物信息学是门新技术,但只是一门技术而已”,由此把生物信息学仅定位为一门新的应用性学科。正如前面所说,虽然生物信息学是一门新学科,但在20世纪60~70年代,该学科 重要的一些算法便已被提出,生物计算和理论研究已形成雏形。把生物信息学仅仅认为是一门应用技术、是将从信息学移植来的技术应用于生物学科领域,这是一个致命的误解。生物信息学实际是一门具有丰富知识内涵的学科,它有很多尚待解决的科学问题,这些问题包括生物学方面的(如分子的功能如何进化)和计算方面的(如数据库系统间如何 地协同)。生物信息学不仅是一个技术平台,它同样需要周密的实验计划和准确的操作,同样需要丰富的想象和一瞬即逝的运气。
第二节 生物信息学历史与展望
一、发展简史
生物信息学的诞生和发展 早可以追溯到20世纪60年代。1962年,诺贝尔奖得主鲍林(Linus Pauling)提出基于蛋白质序列的分子进化理论,标志着生物信息学的来临。“bioinformatics”一词 早由荷兰理论生物学家Paulien Hogeweg于1978年提出(Hogeweg,1978a;Hogeweg and Hesper,1978b)。根据她的回顾文章,她及团队成员于20世纪70年代便在荷兰乌得勒支大学(Utrecht University)开始使用“生物信息学”一词,用于定义他们开展的生物系统的信息学研究(“the study of informatic processes in biotic systems”)(Hogeweg,2011)。这之前普遍认为“生物信息学”一词在1990年才出现(Claverie,2000),由出生于马来西亚的华裔学者林华安(Hwa A. Lim) 提出。据说1987年他在佛罗里达州立大学任教期间,认为生物学和信息学结合交叉是未来发展趋势,构思了“bioinformatics”一词作为这个新领域的名字,并于1990年组织了 届生物信息学与基因组研究 会议(Bioinformatics and Genome Research International Conference)。一般认为生物信息学学科的开创者为Margaret Dayhoff(第3章“历史与人物”短文)、Michael Waterman(第4章“历史与人物”短文)和David Sankoff(简介扫右侧二维码可见)等人。
生物信息学发展过程中的主要事件(表1.1),不少在“生物信息学”一词出现前便已发生了。纵观生物信息学的发展历史,可以分为4个主要阶段:①萌芽期(20世纪60~70年代),以Dayhoff的替换矩阵和Needleman-Wunsch算法为代表,它们实际组成了生物信息学的一个 基本内容——序列联配。它们的出现,代表了生物信息学的萌芽,以后的发展基本是在这两项内容上的不断改善。1977年,Rodger Staden发表利用计算机处理数据的文章,开创了生物信息学工具开发的先河,持续开发并 终成就分子生物学领域 个免费软件包Staden。②形成期(20世纪80年代),以分子数据库和BLAST等数据库序列搜索程序为代表。1981年 上 个核酸序列数据库EMBL Data Library诞生,1982年GenBank成立(前身为Los Alamos Sequence Data Bank),之后联合建立 公共核苷酸序列数据库。同时为了有效管理与日俱增的数据,以BLAST、FASTA等为代表的数据库工具软件和相应的新算法被大量提出和研制,极大地改善了我们管理和利用分子数据的能力。在这一阶段,生物信息学作为一个新兴学科已经形成,并确立了自身学科的特征和地位。③基因组与互联网时期(20世纪90年代至2005年),以基因组测序及其拼接与分析技术为代表。基因组测序计划,特别是人类基因组计划的实施,产生以亿计的分子数据;基因组平上的分析使生物信息学的优势得以充分表现,基因组信息学成为生物信息学中发展 快的学科前沿。Philip Green开发的Phred-Phrap-Consed系统软件包1993年问世,1995年已广泛应用于鸟 法测序中序列碱基识别、拼装和编辑等,是当时人类基因组等测序计划的主要生物信息学软件,与BLAST一起在人类基因组计划的研究历史中占有一席之地(详见Science 2001年2月人类基因组专刊的“A History of Human Genome Project”一文)。由于互联网的普及,这个时期还有一个重要进展就是在线数据库和生物信息学分析平台的出现。1993年,欧洲分子生物学实验室(EMBL)在互联网上公布了世界上 个核苷酸序列数据库(EMBL Nucleotide Sequence Data Library);1994年,NCBI开始提供GenBank等在线服务。在此阶段,生物信息学已成为举世瞩目、各国竞相发展的热点学科。GenBank数据库中直 升的数据增长趋势(图1.1)正是生物信息学发展的写照。生物信息学在这十余年间经历了长足的发展,并迅速成为生命科学新的生长点。人类基因组计划的实施和生物医药工业的介入是生物信息学迅猛发展的主要推动力。④高通量测序技术时期(2005年至今),以第二代和第三代测序技术及其相关数据分析方法为代表。高通量测序技术 改变了生物信息学研究对象(序列)的产生数量、成本、特征和应用领域等,它带来了一系列生物信息学方法的变革和创新,如基因组拼接方法等。该技术使特定生物群体在基因组水平遗传变异的检测成为可能,基于如此大规模基因组水平的遗传变异数据(如SNP)可以从根本上改变我们的许多研究思路和水平,例如,个性化医疗使基于生物信息学的遗传诊断 加便捷和准确(所谓精准医疗),作物基因组设计育种和基因组选择育种成为可能。
表1.1 生物信息学学科发展的主要事件
在线阅读/听书/购买/PDF下载地址:
原文赏析:
暂无原文赏析,正在全力查找中!
其它内容:
暂无其它内容!
网站评分
书籍多样性:7分
书籍信息完全性:4分
网站更新速度:6分
使用便利性:9分
书籍清晰度:5分
书籍格式兼容性:4分
是否包含广告:7分
加载速度:9分
安全性:5分
稳定性:4分
搜索功能:8分
下载便捷性:5分
下载点评
- 情节曲折(343+)
- 目录完整(420+)
- 种类多(78+)
- 中评多(435+)
- txt(290+)
- 小说多(451+)
- 无盗版(243+)
- 体验还行(627+)
- 中评(326+)
- 好评多(308+)
下载评价
- 网友 瞿***香: ( 2025-01-08 17:45:45 )
非常好就是加载有点儿慢。
- 网友 宫***玉: ( 2024-12-31 19:12:28 )
我说完了。
- 网友 田***珊: ( 2025-01-07 20:52:12 )
可以就是有些书搜不到
- 网友 国***舒: ( 2025-01-13 11:57:51 )
中评,付点钱这里能找到就找到了,找不到别的地方也不一定能找到
- 网友 曾***玉: ( 2025-01-04 21:37:58 )
直接选择epub/azw3/mobi就可以了,然后导入微信读书,体验百分百!!!
- 网友 焦***山: ( 2025-01-03 14:19:21 )
不错。。。。。
- 网友 苍***如: ( 2025-01-19 16:47:02 )
什么格式都有的呀。
- 网友 屠***好: ( 2024-12-26 22:31:43 )
还行吧。
- 网友 权***颜: ( 2025-01-07 21:43:31 )
下载地址、格式选择、下载方式都还挺多的
- 网友 利***巧: ( 2025-01-13 16:18:30 )
差评。这个是收费的
- 网友 蓬***之: ( 2024-12-26 04:35:06 )
好棒good
- 网友 温***欣: ( 2025-01-13 23:06:37 )
可以可以可以
- 网友 相***儿: ( 2025-01-04 02:52:12 )
你要的这里都能找到哦!!!
喜欢"生物信息学(第二版)"的人也看了
- Portugal 葡萄牙 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
- American Dreaming 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
- Access数据库基础及应用 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
- 2016护士执业资格考试历年考题纵览与考点评析(第十一版) 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
- 河流 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
- 固定收益分析(威立金融经典译丛) 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
- 歌剧艺术鉴赏 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
- 化学纤维手册 沈新元 主编 中国纺织出版社【正版书籍 无忧售后】 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
- 动物生理学复习指南暨习题解析(2020) 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
- 全国注册城乡规划师职业资格考试辅导教材(第十六版)第3分册城乡规划管理与法规【新华集团正版书籍】 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
书籍真实打分
故事情节:5分
人物塑造:6分
主题深度:7分
文字风格:9分
语言运用:5分
文笔流畅:6分
思想传递:5分
知识深度:4分
知识广度:8分
实用性:3分
章节划分:6分
结构布局:4分
新颖与独特:7分
情感共鸣:3分
引人入胜:6分
现实相关:9分
沉浸感:3分
事实准确性:8分
文化贡献:9分