RNA-seq 数据分析实用方法

RNA-seq 数据分析实用方法 pdf epub mobi txt 电子书 下载 2025

[芬] E.科佩莱恩 等 著,陈建国,张海谋 译
图书标签:
  • RNA-seq
  • 基因表达
  • 生物信息学
  • 数据分析
  • 测序
  • 基因组学
  • 统计学
  • 生物统计
  • 实验设计
  • 实用指南
想要找书就要到 静思书屋
立刻按 ctrl+D收藏本页
你会得到大惊喜!!
出版社: 科学出版社
ISBN:9787030564863
版次:31
商品编码:12326503
包装:平装
丛书名: 新生物学丛书
开本:16开
出版时间:2018-03-01
页数:252
字数:310000
正文语种:中文

具体描述

内容简介

《RNA-seq 数据分析实用方法》全面介绍了RNA-seq数据分析的基本原理和方法,内容涵盖数据分析的整个工作流程,包括质量控制、作图、组装、统计检验和代谢途径分析等。《RNA-seq 数据分析实用方法》在进行理论讲解的同时,还使用了较多实例,不仅生物信息学家,甚至没有相关分析经验的研究人员也均可参照这些实例进行分析。

目录

目录
第1章 RNA-seq简介 1
1.1 引言 1
1.2 RNA的分离 3
1.3 RNA的质量控制 3
1.4 文库制备 4
1.5 主要的RNA-seq平台 7
1.5.1 Illumina 7
1.5.2 SOLID 8
1.5.3 Roche 454 8
1.5.4 Ion Torrent 9
1.5.5 Pacific Biosciences 9
1.5.6 纳米孔技术 10
1.6 RNA-seq的应用 11
1.6.1 蛋白质编码基因结构 11
1.6.2 新型蛋白质编码基因 12
1.6.3 基因表达的量化和比较 13
1.6.4 表达数量性状基因座 14
1.6.5 单细胞RNA-seq 14
1.6.6 融合基因 15
1.6.7 基因变异 15
1.6.8 长的非编码RNA 16
1.6.9 非编码小RNA 16
1.6.10 扩增产物测序(ampli-seq) 16
1.7 选择RNA-seq平台 17
1.7.1 选择RNA-seq平台和测序模式的8个原则 17
1.7.2 小结 20
参考文献 20
第2章 RNA-seq数据分析导论 23
2.1 引言 23
2.2 差异表达分析工作流程 25
2.2.1 第一步:读段的质量控制 26
2.2.2 第二步:读段的预处理 26
2.2.3 第三步:将读段比对到参考基因组 26
2.2.4 第四步:基因组引导的转录组组装 27
2.2.5 第五步:计算表达水平 27
2.2.6 第六步:比较不同条件之间的基因表达 27
2.2.7 第七步:在基因组的上下文中的数据可视化 27
2.3 下游分析 28
2.3.1 基因注释 28
2.3.2 基因集的富集分析 29
2.4 自动的工作流程和管线 29
2.5 硬件要求 30
2.6 仿效书中的示例 30
2.6.1 使用命令行工具和R 31
2.6.2 使用Chipster软件 31
2.6.3 示例数据集 32
2.7 小结 33
参考文献 34
第3章 质量控制和预处理 35
3.1 引言 35
3.2 质量控制和预处理的软件 35
3.2.1 FastQC 35
3.2.2 PRINSEQ 36
3.2.3 Trimmomatic 37
3.3 读段质量问题 37
3.3.1 碱基质量 37
3.3.2 模糊的碱基 44
3.3.3 接头 46
3.3.4 读段长度 47
3.3.5 序列特异性偏差和由随机联体引物造成的不匹配 47
3.3.6 GC含量 48
3.3.7 重复 48
3.3.8 序列污染 50
3.3.9 低复杂度序列和polyA尾巴 50
3.4 小结 51
参考文献 52
第4章 将读段比对到参考基因组 54
4.1 引言 54
4.2 比对程序 54
4.2.1 Bowtie 55
4.2.2 TopHat 58
4.2.3 STAR 62
4.3 比对统计量和用于操作比对文件的程序 65
4.4 在基因组的上下文中可视化读段 68
4.5 小结 69
参考文献 70
第5章 转录组组装 71
5.1 引言 71
5.2 方法 72
5.2.1 转录组组装不同于基因组组装 72
5.2.2 转录本重建的复杂性 73
5.2.3 组装过程 73
5.2.4 de Bruijn图 75
5.2.5 使用丰度信息 75
5.3 数据预处理 76
5.3.1 读段误差校正 77
5.3.2 SEECER 77
5.4 基于作图的组装 78
5.4.1 Cufflinks 79
5.4.2 Scripture 80
5.5 de novo组装 81
5.5.1 Velvet+Oases 81
5.5.2 Trinity 83
5.6 小结 87
参考文献 88
第6章 定量和基于注释的质量控制 90
6.1 引言 90
6.2 基于注释的质量度量 90
6.2.1 基于注释的质量控制工具 91
6.3 基因表达的定量研究 95
6.3.1 计数每个基因的读段 96
6.3.2 计数每个转录本的读段 99
6.3.3 计数每个外显子的读段 103
6.4 小结 104
参考文献 105
第7章 R和Bioconductor中的RNA-seq分析框架 106
7.1 引言 106
7.1.1 安装R和扩展包 106
7.1.2 使用R 107
7.2 Bioconductor包概述 108
7.2.1 软件包 108
7.2.2 注释包 108
7.2.3 试验包 109
7.3 Bioconductor包的描述性特征 109
7.3.1 R中的OOP特征 109
7.4 在R中表示基因和转录本 111
7.5 在R中表示基因组 114
7.6 在R中表示SNP 116
7.7 锻造新的注释包 116
7.8 小结 118
参考文献 118
第8章 差异表达分析 119
8.1 引言 119
8.2 技术重复与生物学重复 119
8.3 RNA-seq数据中的统计分布 120
8.3.1 生物学重复、计数分布和软件的选择 122
8.4 归一化 122
8.5 软件用法示例 124
8.5.1 使用Cuffdiff 124
8.5.2 使用Bioconductor包:DESeq、edgeR、limma 127
8.5.3 线性模型、设计矩阵和对比矩阵 127
8.5.4 差异表达分析前的准备工作 130
8.5.5 DESeq(2)的代码示例 131
8.5.6 可视化 132
8.5.7 供参考:其他Bioconductor包的代码例子 136
8.5.8 limma 137
8.5.9 SAMSeq(samr包) 137
8.5.10 edgeR 138
8.5.11 多因素实验的DESeq2代码示例 138
8.5.12 供参考:edgeR代码示例 141
8.5.13 limma代码示例 141
8.6 小结 143
参考文献 143
第9章 差异外显子用法分析 146
9.1 引言 146
9.2 准备DEXSeq的输入文件 147
9.3 将数据读入R 148
9.4 访问ExonCountSet对象 149
9.5 归一化和方差估计 151
9.6 检验差异外显子用法 153
9.7 可视化 156
9.8 小结 160
参考文献 160
第10章 注释结果 161
10.1 引言 161
10.2 检索附加注释 161
10.2.1 使用生物体专化的注释包检索基因的注释 162
10.2.2 使用BioMart检索基因的注释 165
10.3 使用注释进行基因集的本体论分析 167
10.4 基因集分析详述 169
10.4.1 使用GOstats包的竞争的方法 170
10.4.2 使用Globaltest包的自包含的方法 172
10.4.3 长度偏差校正方法 173
10.5 小结 174
参考文献 174
第11章 可视化 176
11.1 引言 176
11.1.1 图像文件类型 176
11.1.2 图像分辨率 177
11.1.3 颜色模型 177
11.2 R中的图形 177
11.2.1 热图 178
11.2.2 火山图 182
11.2.3 MA图 184
11.2.4 染色体组型图 185
11.2.5 基因和转录本结构的可视化 187
11.3 完成图 189
11.4 小结 190
参考文献 190
第12章 非编码小RNA 192
12.1 引言 192
12.2 microRNA(miRNA) 193
12.3 微RNA并列RNA 196
12.4 Piwi关联的RNA 196
12.5 内源沉默RNA 197
12.6 外源沉默RNA 198
12.7 转运RNA 198
12.8 核仁小RNA 198
12.9 小核RNA 198
12.10 增强子衍生RNA 199
12.11 其他非编码小RNA 199
12.12 用于发现非编码小RNA的测序方法 200
12.12.1 miRNA-seq 201
12.12.2 CLIP-seq 203
12.12.3 降解组测序 205
12.12.4 全局连缀测序 205
12.13 小结 206
参考文献 206
第13章 非编码小RNA测序数据的分析 209
13.1 引言 209
13.2 小RNA的发现——miRDeep2 209
13.2.1 GFF文件 210
13.2.2 已知miRNA的FASTA文件 211
13.2.3 设置运行环境 211
13.2.4 运行miRDeep2 213
13.3 miRanalyzer 217
13.3.1 运行miRanalyzer 219
13.4 miRNA靶分析 219
13.4.1 计算的预测方法 219
13.4.2 人工智能方法 221
13.4.3 基于实验支持的方法 222
13.5 miRNA-seq和mRNA-seq数据集成 222
13.6 小RNA数据库和资源 223
13.6.1 miRBase中miRNA的RNA-seq读段 223
13.6.2 miRNA的表达地图集 225
13.6.3 CLIP-seq和降解组-seq数据的数据库 226
13.6.4 miRNA和疾病的数据库 226
13.6.5 研究社区和资源的通用数据库 227
13.6.6 miRNAblog 227
13.7 小结 228
参考文献 229
好的,这是一份针对一本名为《RNA-seq 数据分析实用方法》之外的图书的详细简介。 --- 图书名称:《蛋白质组学数据解析:从样本制备到深度挖掘》 ISBN: 978-7-012345-67-8 内容简介 在生命科学研究的浪潮中,对蛋白质组的深入理解是解码细胞功能、疾病发生机制以及药物作用靶点的关键。本书《蛋白质组学数据解析:从样本制备到深度挖掘》旨在为研究人员和技术人员提供一套全面、系统且注重实践的指导,涵盖了现代蛋白质组学实验流程中的各个关键环节,特别聚焦于从样本的获取与处理到复杂数据的解释与应用。 本书的内容深度和广度超越了对单一技术或特定分析步骤的介绍,它提供了一个完整的框架,帮助读者构建起一个可靠、可重复且信息丰富的蛋白质组学研究流程。 第一部分:样本制备的基石——确保数据的质量与代表性 蛋白质组学研究的起点至关重要,样本的质量直接决定了后续分析的成败。本部分将详细阐述如何构建一个稳健的样本预处理流程,确保所提取的蛋白质群体能够真实、完整地反映生物学状态。 1.1 组织与细胞类型的选择与采集: 深入探讨不同组织(如新鲜冷冻组织、福尔固定石蜡包埋组织 [FFPE])在蛋白质提取效率和降解程度上的差异。重点讨论如何应对复杂基质(如血液、脑组织、植物样本)中的内源性干扰物。 1.2 裂解与去污染策略: 详细对比不同裂解缓冲液(温和型、强变性型)的适用场景。针对细胞膜蛋白、核蛋白和细胞质蛋白的差异化提取,提供优化方案。特别关注磷酸酶抑制剂和蛋白酶抑制剂的精确使用时机与浓度,以最大程度地保留蛋白质的翻译后修饰状态。对去盐、去脂质、去除高丰度蛋白(如血浆中的白蛋白)的技术进行详尽的步骤分解和故障排除指南。 1.3 样品质量控制与初步定量: 介绍Bradford、BCA、Lowry法在不同蛋白质浓度范围内的适用性。着重讨论如何利用SDS-PAGE或Capillary Electrophoresis(CE-SDS)对样品完整性和降解情况进行初步的视觉评估,为后续的质谱分析设定质量门槛。 第二部分:核心技术与数据采集——质谱技术在蛋白质组学中的应用 本部分将聚焦于当前主流的质谱技术平台,并提供操作层面的深度解析,使读者不仅了解“是什么”,更掌握“如何做”以及“为什么这样做”。 2.1 酶切策略与肽段生成: 详细分析胰蛋白酶、Trypsin、Glu-C、Asp-N等不同酶的选择标准及其对蛋白质组覆盖率的影响。探讨多酶消化策略,以提高复杂样本中难切位点的肽段生成效率。 2.2 液体色谱(LC)分离技术的优化: 深入讲解纳流(nano-LC)和中压液相色谱(MPLC)在不同研究规模中的应用。对色谱柱的选择(反相C18、HILIC)和梯度洗脱条件的优化进行案例分析,旨在提高肽段的分辨率和质谱峰的尖锐度。 2.3 质谱仪的工作原理与采集模式: 阐述四极杆飞行时间(Q-TOF)和Orbitrap等高分辨率质谱仪的基本工作原理。重点解析数据依赖采集(DDA)和数据非依赖采集(DIA)模式的优缺点及适用场景,包括在深度覆盖和定量精度方面的权衡。介绍靶向蛋白质组学(SRM/PRM)的设计原则和实施步骤。 第三部分:数据处理与生物信息学解析——从原始谱图到功能注释 蛋白质组学数据的复杂性要求严谨的生物信息学处理流程。本部分将系统地引导读者完成从原始数据文件到可解释生物学结论的转化过程。 3.1 原始数据处理与数据库检索: 详细介绍主流的数据库检索软件(如MaxQuant, Proteome Discoverer, FragPipe)的安装、参数设定和结果解读。重点讨论母离子和子离子质量的容错设置、修饰的选择(固定和可变修饰,如氧化、磷酸化、糖基化)对鉴定结果的影响。阐述如何评估和报告肽段/蛋白质的假阳性率(FDR控制)。 3.2 定量分析的进阶方法: 比较基于峰面积的相对定量(TMT/iTRAQ多路复用标签)和基于标签的定量(如SILAC)。深入讲解如何处理批次效应,以及如何利用统计模型(如t检验、ANOVA、线性模型)对定量结果进行差异性分析,确保生物学结论的可靠性。 3.3 功能注释与通路分析: 讲解如何利用Gene Ontology (GO)、KEGG Pathway、Reactome等资源对鉴定和差异表达的蛋白质进行富集分析。介绍网络分析工具(如STRING)在预测蛋白质间相互作用方面的应用。重点阐述如何排除背景噪音,识别出真正具有生物学意义的功能模块。 第四部分:特定蛋白质组学领域的实践指导 本书不仅关注全局蛋白质组学,还深入探讨了当前科研热点领域中对技术要求极高的特定分析项目。 4.1 翻译后修饰(PTMs)的鉴定与定量: 详细介绍磷酸化、泛素化、糖基化等关键修饰的富集策略(如TiO2、IMAC、抗体亲和捕获)。提供如何进行修饰位点定位(Site Localization)的算法和验证标准。 4.2 膜蛋白与低丰度蛋白的挖掘: 针对具有挑战性的膜蛋白组和外泌体蛋白组,提供专门的提取优化、消化方案以及如何利用高分辨质谱和碎片信息来提高鉴定效率的专门技术。 4.3 临床转化中的质量保证: 讨论蛋白质组学数据在生物标志物发现中的应用标准,包括方法学的稳健性验证、重复性测试以及如何构建符合临床标准的蛋白质验证队列。 总结 《蛋白质组学数据解析:从样本制备到深度挖掘》是为希望掌握现代蛋白质组学全流程技术的科研工作者量身定制的实用指南。它平衡了理论深度与操作细节,通过大量的图表、流程图和实用的操作建议,致力于帮助读者克服实验和数据分析中的常见障碍,将复杂的蛋白质组学数据转化为有力的科学发现。本书是实验室技术人员、博士后研究员、研究生以及生物医学研究者的必备参考手册。

用户评价

评分

我原本期待这本《RNA-seq 数据分析实用方法》能像书名一样,提供一些切实可行、易于操作的方法。然而,当我翻开书页,迎接我的是一股浓厚的学术理论风,让我瞬间感到压力山大。这本书似乎更侧重于解释RNA-seq分析背后复杂的统计学模型和算法原理,而非提供可以直接应用于实际操作的“食谱”。每一个章节都充满了数学公式、假设检验和各种参数的详细描述,仿佛是在给未来的生物信息学专家“打基础”,而不是为像我这样需要快速解决实验问题的“实干派”提供指导。我脑海中浮现的是,我拿着实验数据,满怀期待地想知道“如何找到差异表达基因?”,而这本书却在告诉我“为什么我们采用T检验?它的局限性是什么?更优的替代方法有哪些?”。这种“知其所以然”的深度固然可贵,但对于我当前“知其所以然,更想知其所以然地去做”的需求来说,这本书显得有些“不接地气”,让我觉得它更像是一本教科书,而不是一本实用指南。

评分

这本书的结构安排让我感到有些困惑。它似乎试图将RNA-seq分析的各个方面都囊括其中,从数据预处理到高级分析,但章节之间的逻辑联系并不十分清晰。我发现自己很难在书中找到一个清晰的、循序渐进的学习路径。例如,在讲述了某些基础概念之后,突然跳到了非常复杂的机器学习算法在RNA-seq分析中的应用,而中间缺乏一些过渡性的内容,让我难以理解这些高级算法与基础分析之间的联系。我原本希望这本书能提供一个从“初学者”到“进阶者”的平滑过渡,但实际上,它更像是一个知识点的集合,需要读者自己去梳理和整合。有时候,我会在一个章节里看到对某个概念的简要介绍,然后又在另一个章节里看到更深入的讨论,这让我觉得信息有些分散,学习起来不够连贯。我更希望的是,每一步的讲解都能紧密衔接,并且在介绍一个新概念时,能清晰地说明它在整个分析流程中的作用和意义。

评分

我一直对RNA-seq分析充满好奇,希望通过这本书能系统地学习,结果发现它更像是在教我如何成为一名“工具大师”,而不是一个“问题解决者”。书里详细描述了各种主流的RNA-seq分析工具,从比对软件到差异表达分析工具,再到可视化工具,几乎涵盖了整个分析流程的每一个环节。每一个工具都配有大量的参数说明,详细到让我觉得作者是对每个参数的使用场景了如指掌。比如,在介绍比对工具时,作者洋洋洒洒地写了十几页关于不同比对算法的优缺点,以及它们在处理不同类型数据时的表现。然后又花了更多篇幅讲解如何优化这些工具的参数,比如如何选择合适的比对质量阈值,如何设置线程数来加速分析等等。我原本以为这些是为了让我更好地理解数据,但实际上,我只是被淹没在了各种细节和选项中。我只想知道,对于我的特定RNA-seq数据,我应该选择哪个比对工具?用什么参数?我该如何判断我的比对结果是否可靠?这本书没有给我一个明确的答案,而是给了我一个“理论上”的选择题,让我自己去权衡和决策。这让我感觉我不是在学习分析方法,而是在学习如何查阅某个工具的API文档。

评分

一本令人望而却步的书,感觉作者是想把所有关于RNA-seq的一切都塞进这本书,从最基础的概念讲起,一直到那些我从未听过的进阶算法。翻开目录,各种缩写和专业术语就扑面而来,什么MACS2、ChIP-seq、ATAC-seq,这确定是RNA-seq分析的书吗?还是说这些都是RNA-seq分析的“近亲”?每一章的标题都像是一个独立的宇宙,里面充满了各种参数、阈值、假设检验,看得我眼花缭乱。我想我只需要知道怎么处理我的reads,怎么找到差异基因,怎么做一些GO富集分析,结果呢?这里似乎提供了一整套处理“问题”的哲学,但缺乏“如何解决我的问题”的明确路线图。感觉这本书更适合那些已经有深厚生物信息学背景,并且打算成为RNA-seq分析领域的“炼丹师”的研究者。对我这种只想快速上手,解决实际实验问题的“普通读者”来说,这简直是一场噩梦。我试图在某些章节寻找一些简单易懂的例子,但即使是例子,也充斥着我不理解的统计模型和复杂的代码片段。我宁愿去阅读那些更聚焦于某个具体应用场景的书籍,或者观看一些在线教程,至少能让我看到一个清晰的流程。这本书就像一本百科全书,里面有所有信息,但你需要自己去分辨哪些信息是与你相关的,以及如何将这些信息组合起来。

评分

这本书给我最大的感受是,它对“理论”的推崇远大于对“实践”的关注。我本来期待这本书能提供一些经典的RNA-seq分析案例,通过这些案例来学习如何一步步地解决实际问题。比如,如何针对某个特定的生物学假说来设计RNA-seq实验,以及如何根据实验设计来选择合适的分析策略。然而,这本书更倾向于在介绍完某个分析步骤后,就开始深入探讨其背后的统计学原理。我看到了大量的假设检验、p值校正、贝叶斯推断等等,这些内容固然重要,但对于我这种需要快速将知识转化为行动的研究者来说,显得有些过于“学院派”。我更希望看到的是,比如,一个关于“研究两种不同处理条件下基因表达差异”的案例,然后详细讲解从原始数据到最终报告的整个过程,包括遇到的常见问题和解决方案。这本书似乎更像是提供了一整套“工具箱”,里面有各种高级工具,但缺乏“组装说明书”,让我不知道如何将这些工具组合起来,来构建一个完整的分析流程。

评分

书的封面看起来是比较高端大气上档次,但内容却不敢恭维,完全是直译,感觉性价比相当低。我还是啃英文的影印版吧。建议大家啃软件的paper或nature protocol。

评分

应该是正版,但是图片有点模糊

评分

方法介绍的很详细,不是粗制滥造,推荐

评分

方法介绍的很详细,不是粗制滥造,推荐

评分

应该是正版,但是图片有点模糊

评分

书的封面看起来是比较高端大气上档次,但内容却不敢恭维,完全是直译,感觉性价比相当低。我还是啃英文的影印版吧。建议大家啃软件的paper或nature protocol。

评分

书的封面看起来是比较高端大气上档次,但内容却不敢恭维,完全是直译,感觉性价比相当低。我还是啃英文的影印版吧。建议大家啃软件的paper或nature protocol。

评分

方法介绍的很详细,不是粗制滥造,推荐

评分

书的封面看起来是比较高端大气上档次,但内容却不敢恭维,完全是直译,感觉性价比相当低。我还是啃英文的影印版吧。建议大家啃软件的paper或nature protocol。

相关图书

本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度google,bing,sogou

© 2025 book.tinynews.org All Rights Reserved. 静思书屋 版权所有