编前语
随着假期的结束,老师们的数据分析结果也陆陆续续回来了或即将回来。
然而,面对一大堆的图表文件,是不是有种明知此地有宝藏却不知从何寻起的懵圈感?
没关系,在接下来的一个月里,小编将在每周五和您一起领略16S测序的风采!
1、原理概述
16S测序是对样本提取总DNA接着进行目的片段区域(即16S rDNA的部分区域)扩增、测序,再通过数据分析从而得知样品中的微生物群落多样性。
16S rDNA是由10个保守区及9个可变区组成的,通过保守区序列我们可以判断物种间的亲缘关系,而通过可变区序列我们可以得知物种间的差异情况。
针对16S测序,目前市面上采用的测序平台主要有二代测序平台IlluminaMiseq/HiSeq和三代测序平台。二代测序平台由于有读长限制,所以对16S的测序只能选择单v区、双v区或者三v区为目的片段区域,而又由于V3、V4、V5的特异性较好,数据库信息也比较全,所以我们在进行二代测序时常常选择V3V4、V4或者V4V5进行细菌多样性注释。其中V3V4区选用引物341F和806R,该引物在细菌和古菌的覆盖率均较高,我们可以利用它同时检测细菌和古菌的多样性分布。相对于二代测序的读长限制,三代测序平台对16S可进行全长测序,序列比对率和鉴定准确率都较二代测序更高。
2、16S测序工作流程
16S测序工作流程主要包括两大部分:实验流程和分析流程。首先选择1~2个可变区,利用它旁边的保守区设计通用引物,对可变区进行扩增(也叫建库)、测序分析。
3、实验流程简介
实验这部分首先是样品生物学重复数量的设置问题,原则上是重复数量越多实验结果的准确率越高,通常建议5个以上,宿体环境如人类肠道、粪便等建议10个以上,但现实情况往往是科研经费有限不得不把生物学重复数量设得低一些,不过无论如何,为了保证实验的可信度,生物学重复数量原则上不得低于3个。
其次是样品的采集及运送、提取注意事项,这个过程千万马虎不得,所得的DNA质量高低直接决定了测序结果的准确性。由于核酸在室温下易发生变性讲解的情况,所以该过程一定要保证快速、低温的环境。
4、分析流程简介
首先是将测序数据过滤、质控,过滤掉低质量的序列,保留clean data进行后续分析。接着进行OTU分析、注释,这个步骤中主要是将序列分成不同的分类单元,往往是按照97%的相似性进行OTU聚类。不过,新出现的Feature分析相当于100%相似性的OTU聚类,有替代OTU聚类的趋势。Feature的本质依旧是将序列分类成不同的可操作单元。也有不少同学感到困惑,为什么不直接对序列进行物种注释及后续分析呢?没错,原则上可以这么做,但测序序列少则几万,多则几千万,若对每条序列都注释的话则工作量太大了。先将序列分类成不同的可操作单元,可以大大提高效率,且在聚类的过程中会去除嵌合体等错误序列,从而提高分析的准确度。
将序列分成不同的可操作单元后,则可以进行后续分析,包括Alpha多样性分析、Beta多样性分析、微生物群落展示、组间物种差异分析、组间群落差异分析、环境因子分析、功能预测等。
具体的分析内容及意义将在下周五《解读16S结题报告| 16S专题》中提到,由于篇幅有限,本次16S简介到此结束,尚有疑问和建议的地方请留言小编~
本文由莫秋芬、江舜尧编辑。
有话要说...