数据质控
低质量reads过滤
宏基因组 ( Metagenome)是由 Handelsman 等 1998 年提出的新名词, 其定义为环境中全部微小生物遗传物质的总和。它包含了可培养的和未可培养的微生物的基因,目前主要指环境样品中细菌、真菌和古菌的基因组总和。宏基因组学(metagenomics)是一种以环境样品中的微生物群体基因组为研究对象,以功能基因筛选和/或测序分析为研究手段,以微生物多样性、种群结构、进化关系、功能活性、相互协作关系及与环境之间的关系为研究目的的新的微生物研究方法。
宏基因组测序分析(Metagenomics Sequencing) 是指对特定样品中的微生物群落提取总基因组DNA,构建测序文库,然后进行高通量测序及后续生物信息分析,宏基因组测序分析主要研究微生物种群结构、基因功能活性、微生物之间的相互协作关系以及微生物与环境之间的关系。宏基因组测序研究摆脱了微生物分离纯培养的限制,扩展了微生物资源的利用空间,为环境微生物群落的研究提供了有效工具。
数据质控
低质量reads过滤
序列组装
基因预测,ORF预测
NR、KEGG、eggNOG 数据注释
CAZy、ARDB 数据库注释
VFDB 数据库注释
主成分分析(PCA)
主坐标分析(PCoA)
非度量多维度尺度分析(NMDS)
相似性分析(ANOSIM)
置换多因素方差分析(PERMANOVA)
多响应置换过程分析(MRPP)
多元分散置换检验(PERMDISP)
多样本比较 UpSetR 图
物种 Heatmap 图
Wilcoxon 秩和检验
组间LEfSe 差异判别分析
环境因子关联分析(可选)
网络分析
根据研究需要定制分析内容