微生物群落多样性测序与功能分析( 二 )


方式/
116s rDNA阐发根基流程:

微生物群落多样性测序与功能分析



2原始数据处置:
原始测序数据需要去除接头序列 , 按照 overlap 并将双端测序序列进行拼接当作单条序列 , 同时对序列质量进行质控和过滤 。 供给已知数据库 GreenGenes 作为参考 , 去除嵌合体序列获得最终可用的序列 。
提掏出的数据以 fastq 格局保留 , 每个样本有 fq1 和 fq2两个文件 , 里面为测序两头的 reads , 序列按挨次一一对应 。
原始fastq格局是一个文本格局用于存储生物序列(凡是是核酸序列)和其测序对应的质量值 。 这些序列以及质量信息用ASCII字符标识 。

3OTU分类和统计:
OTU(operational taxonomic units) 是在系统发生学研究或群体遗传学研究中 , 为了便于进行阐发 , 报酬给某一个分类单位(品系 , 种 , 属 , 分组等)设置的统一标记 。 凡是按照 97% 的相似性阈值将序列划分为分歧的 OTU , 每一个 OTU 凡是被视为一个微生物物种 。 相似性小于97%就可以认为属于分歧的种 , 相似性小于93%-95% , 可以认为属于分歧的属 。 样品中的微生物多样性和分歧微生物的品貌都是基于对OTU的阐发 。
利用QIIME(version 1.8.0)东西包进行统计注释 。
利用QIIME(version 1.9.0, http://bio.cug.edu.cn/qiime/)的ucluster方式按照97%的序列相似度将所有序列进行同源比对并聚类当作operational taxonomic units (OTUs) 。 然后与数据库GreenGenes(version gg_13_8, http://greengenes.lbl.gov/cgi-bin/JD_Tutorial/nph-16S.cgi)进行比对 , 比对方式uclust , identity 0.9 。
然后对每个OTUs进行reads数量统计 。
下面的2个表 , 此中一个表是对每个样本的测序数目和OTU数量进行统计 , 而且在表栺中列出了测序笼盖的完整度(显示前10个样本) 。
另一个表是对每个样本在分类字程度上的数目进行统计 , 而且在表栺中列出了在每个分类字程度上的物种数量(显示前10个样本) 。
可以看到绝大部门的OTU都分类到了属(Genus) , 也有良多分类到了种(Species) 。 可是仍然有良多无法完全分类到种一级 , 这是因为情况微生物自己存在很是丰硕的多样性 , 还有大量的菌仍然没有被测序和发现 。
测序数量统计表本家儿如果对每个样本的测序数目和OTU数量进行统计 , 而且在表格中列出了测序笼盖的完整度(显示前10个样本 , 若是样本跨越10个 , 请查看成果中otu_stat.txt文件)
此中 SampleName暗示样本名称;SampleSize暗示样本序列总数;OTUsNumber暗示注释上的OTU数量;OTUsSeq暗示注释上OTU的样本序列总数 。
Coverage是指各样品文库的笼盖率 , 其数值越高 , 则样本中序列没有被测出的概率越低 。 该指数现实反映了本次测序成果是否代表样本的真实环境 。
计较公式为:C=1-n1/N  此中n1 = 只含有一条序列的OTU的数量; N = 抽样中呈现的总的序列数量 。
分类程度统计表本家儿如果对每个样本在分类学程度上的数目进行统计 , 而且在表格中列出了在每个分类学程度上的物种数量(只显示前10个样本 , 若是样本跨越10个 , 请查看成果中taxon_all.txt文件)
此中SampleName暗示样本名称;Phylum暗示分类到门的OTU数目;Class暗示分类到纲的OTU数目;Order暗示分类到目标OTU数目;Family暗示分类到科的OTU数目;Genus暗示分类到属的OTU数目;Species暗示分类到种的OTU数目 。

微生物群落多样性测序与功能分析

猜你喜欢