編前語
随着假期的結束,老師們的數據分析結果也陸陸續續回來了或即将回來。
然而,面對一大堆的圖表文件,是不是有種明知此地有寶藏卻不知從何尋起的懵圈感?
沒關系,在接下來的一個月裡,小編将在每周五和您一起領略16S測序的風采!
1、原理概述
16S測序是對樣本提取總DNA接着進行目的片段區域(即16S rDNA的部分區域)擴增、測序,再通過數據分析從而得知樣品中的微生物群落多樣性。
16S rDNA是由10個保守區及9個可變區組成的,通過保守區序列我們可以判斷物種間的親緣關系,而通過可變區序列我們可以得知物種間的差異情況。
針對16S測序,目前市面上采用的測序平台主要有二代測序平台IlluminaMiseq/HiSeq和三代測序平台。二代測序平台由于有讀長限制,所以對16S的測序隻能選擇單v區、雙v區或者三v區為目的片段區域,而又由于V3、V4、V5的特異性較好,數據庫信息也比較全,所以我們在進行二代測序時常常選擇V3V4、V4或者V4V5進行細菌多樣性注釋。其中V3V4區選用引物341F和806R,該引物在細菌和古菌的覆蓋率均較高,我們可以利用它同時檢測細菌和古菌的多樣性分布。相對于二代測序的讀長限制,三代測序平台對16S可進行全長測序,序列比對率和鑒定準确率都較二代測序更高。
2、16S測序工作流程
16S測序工作流程主要包括兩大部分:實驗流程和分析流程。首先選擇1~2個可變區,利用它旁邊的保守區設計通用引物,對可變區進行擴增(也叫建庫)、測序分析。
3、實驗流程簡介
實驗這部分首先是樣品生物學重複數量的設置問題,原則上是重複數量越多實驗結果的準确率越高,通常建議5個以上,宿體環境如人類腸道、糞便等建議10個以上,但現實情況往往是科研經費有限不得不把生物學重複數量設得低一些,不過無論如何,為了保證實驗的可信度,生物學重複數量原則上不得低于3個。
其次是樣品的采集及運送、提取注意事項,這個過程千萬馬虎不得,所得的DNA質量高低直接決定了測序結果的準确性。由于核酸在室溫下易發生變性講解的情況,所以該過程一定要保證快速、低溫的環境。
4、分析流程簡介
首先是将測序數據過濾、質控,過濾掉低質量的序列,保留clean data進行後續分析。接着進行OTU分析、注釋,這個步驟中主要是将序列分成不同的分類單元,往往是按照97%的相似性進行OTU聚類。不過,新出現的Feature分析相當于100%相似性的OTU聚類,有替代OTU聚類的趨勢。Feature的本質依舊是将序列分類成不同的可操作單元。也有不少同學感到困惑,為什麼不直接對序列進行物種注釋及後續分析呢?沒錯,原則上可以這麼做,但測序序列少則幾萬,多則幾千萬,若對每條序列都注釋的話則工作量太大了。先将序列分類成不同的可操作單元,可以大大提高效率,且在聚類的過程中會去除嵌合體等錯誤序列,從而提高分析的準确度。
将序列分成不同的可操作單元後,則可以進行後續分析,包括Alpha多樣性分析、Beta多樣性分析、微生物群落展示、組間物種差異分析、組間群落差異分析、環境因子分析、功能預測等。
具體的分析内容及意義将在下周五《解讀16S結題報告| 16S專題》中提到,由于篇幅有限,本次16S簡介到此結束,尚有疑問和建議的地方請留言小編~
本文由莫秋芬、江舜堯編輯。
有話要說...